중국 AI 스타트업 DeepSeek은 고성능 저비용 경쟁 전략을 이어가며 DeepSeek V4 Flash 및 DeepSeek V4 Pro라는 두 가지 새로운 대규모 언어(LLM) 모델을 출시했습니다.
이러한 움직임은 V3.2 및 R1과 같은 이전 버전이 전 세계적인 주목을 받고 인공 지능 산업의 많은 거물들의 입지에 도전한 지 1년여 만에 이루어졌습니다.
두 개의 새로운 V4 모델 모두 오픈 소스 형태로 출시되었으며, 100만 토큰을 초과하는 컨텍스트 창을 소유하고 있어 한 번의 입력으로 전체 문서 또는 소스 코드와 같은 엄청난 양의 데이터를 처리할 수 있습니다.
그중 Pro 버전은 1조 6천억 개의 매개변수(490억 개의 작동 매개변수) 규모로 현재 가장 큰 오픈 소스 모델 중 하나로 간주됩니다. 이 수치는 키미 K2.6의 문샷 AI나 M1의 미니맥스와 같은 경쟁사를 능가합니다.
약 2,840억 개의 매개변수를 가진 더 작은 Flash 버전은 비용과 처리 속도를 최적화하도록 설계되었습니다.
두 모델 모두 텍스트 출력만 지원하고 이미지나 비디오와 같은 멀티미디어 콘텐츠를 생성하지 않으며 현재 일부 폐쇄형 AI 시스템과는 다릅니다.
기술적으로 DeepSeek은 작업을 세분화하고 전문 모듈에 처리를 맡깁니다. 동시에 회사는 모델 증류 및 다중 헤드 주의 메커니즘과 같은 많은 첨단 기술을 결합하여 덜 첨단 하드웨어를 사용하더라도 성능을 최적화하는 데 도움이 됩니다.
이전에는 DeepSeek이 Nvidia의 GPU H20을 활용했습니다. 새로운 세대에서는 Huawei에서 개발한 칩으로 전환했습니다.
발표에 따르면 DeepSeek V4 Pro는 추론 테스트에서 높은 성능을 달성했으며 특정 작업에서 OpenAI 또는 Google의 최고 모델과 경쟁할 수 있습니다.
그러나 회사는 또한 자체 모델이 일반적인 지식 측면에서 가장 진보된 시스템보다 약 3~6개월 느리다는 것을 인정합니다.
가장 주목할 만한 점은 가격 전략에 있습니다. 딥시크는 V4 플래시가 수백만 개의 투입 토큰당 0.14달러, 수출입 토큰당 0.28달러부터 시작하는 저렴한 비용이라는 장점을 계속 유지하고 있습니다. 이는 시장의 동급 제품보다 훨씬 낮은 수치로 간주됩니다.
반면 V4 Pro는 Gemini 또는 GPT와 같은 고급 모델보다 경쟁력 있는 가격을 가지고 있습니다.
V4 라인의 등장은 DeepSeek가 규모와 컴퓨팅 성능 경쟁에만 치중하는 대신 비용 대비 효율성을 최적화하는 자체적인 길을 추구하고 있음을 보여줍니다. 이는 AI 개발 비용에 대한 관점을 바꾸고 업계 전체의 경쟁 압력을 증가시키는 데 기여합니다.
대형 기술 회사들이 AI에 지속적으로 강력하게 투자하는 상황에서 DeepSeek이 저렴하지만 효율적인 오픈 소스 모델을 제공하는 것은 더 광범위한 응용 물결을 촉진할 수 있습니다.
이점을 유지할 수 있다면 중국 회사는 앞으로 몇 년 안에 글로벌 AI 경쟁을 재구성할 가능성이 있습니다.