아마존 웹 서비스(AWS)는 AWS re:Invent 2025 행사에서 Trainium3 및 Trainium3 UltraServer 시스템을 출시하면서 자체 설계 AI 칩 개발 전략에서 큰 진전을 이루었다고 발표했습니다.
이것은 회사의 가장 강력한 3나노미터 칩 세대로 대규모 AI 모델 교육 및 추론 모두에 최적화되었습니다.
AWS에 따르면 Trainium3는 이전 세대보다 4배 더 높은 성능을 제공하며 복잡한 처리가 필요한 AI 모델에 적합한 4배 더 큰 메모리 용량을 가지고 있습니다.
UltraServer는 최대 144개의 칩을 수용할 수 있고 수천 개의 서버 클러스터를 서로 연결할 수 있는 함께 제공되는 시스템으로 기존 세대 확장 기능의 10배인 최대 100만 개의 Trainium3 칩이 병렬로 실행됩니다.
강조된 점 중 하나는 Trainium3가 이전 칩 라인에 비해 전력 소비량을 최대 40%까지 줄여 에너지 절약 능력입니다.
데이터 센터가 점점 더 많은 전력을 소비하는 상황에서 AWS는 전력 최적화가 이중 이점을 제공하며 이는 아마존의 운영 비용을 줄이고 고객이 AI 클라우드 서비스를 더 경제적으로 사용할 수 있도록 돕는다고 밝혔습니다.
Anthropic, LLM Karakuri(일본): Splashmusic 또는 Decart와 같은 많은 기업들이 새로운 칩 세대를 테스트하고 추론 비용이 크게 감소한 것으로 기록했습니다. 이는 Trainium3 시스템이 기술적으로 강력할 뿐만 아니라 비용 면에서도 매력적임을 보여줍니다.
AWS는 또한 Trainium4,를 개발 중인 차세대 칩으로 처음으로 공개했습니다. 가장 주목할 만한 점은 Trainium4가 엔비디아의 고속 연결 기술인 NVLink Fusion,를 지원한다는 것입니다.
이는 Trainium4 칩이 Nvidiamia GPU와 병행하여 작동하고 성능을 확장할 수 있음을 의미하며 CUDA에 크게 의존하는 AI 인프라 시장에서 큰 경쟁 우위를 창출합니다.
Trainium4 출시 시점을 아직 발표하지 않았지만 AWS는 내년 re:Invent 행사에서 더 많은 정보를 공유할 가능성이 높으며 이는 AI 생태계에서 엔비디아의 강력한 경쟁자로서의 입지를 계속 강화할 것입니다.