
OpenAI는 회사의 오시리즈 라인과 동등한 기능을 가진 gpt-oss-120b 및 gpt-oss-20b,라는 2개의 오픈 소스 추론 AI 모델을 발표했습니다. 이는 GPT-2(2019년 출시) 이후 OpenAI가 오픈 소스 언어 모델을 다시 출시한 첫 번째 사례입니다. 둘 다 허가나 비용 지불 없이 상용화할 수 있는 Apache 2.0 라이선스를 사용하는 Hugging Face, 플랫폼에서 무료로 다운로드할 수 있습니다.
모델은 다양한 크기로 설계되었습니다. 1 200억 개 매개변수 버전은 단일 Nvidia GPU에서 실행할 수 있습니다. 200억 개 가벼운 버전은 16GB RAM 노트북에서 잘 작동합니다. OpenAI는 두 모델 모두 효율성을 최적화하기 위해 각 작업에 대해 작은 부분의 매개변수만 활성화하는 전문가 혼합 아키텍처(MoE ngo)를 사용한다고 밝혔습니다.
여러 척도에서 ngai gpt-oss는 DeepSeek 및 Qwen ngai와 같은 개방형 경쟁자를 능가하는 능력이 있는 것으로 평가되지만 여전히 내부 오시리즈 라인에는 뒤쳐집니다. 예를 들어 Codeforces game의 ngai gpt-oss-120b는 2622점을 획득하여 DeepSeek R1보다 약간 높습니다. 그러나 ngai의 오답률은 여전히 우려스러운 문제입니다. gpt-oss는 PersonQA ngai 기준의 49-53% 이상의 질문에서 정확하지 않은 답을 내놓았으며 이는 o1
영양 교육에 관해서는 OpenAI는 고급 모델과 유사한 강화 학습(RL) 및 다단계 추론 체인찬과 같은 고급 기술을 적용합니다. Gpt-oss는 AI 에이전트가 웹 검색과 같은 도구를 호출하거나 Python 코드를 실행하도록 지원할 수 있지만 이미지나 사운드를 처리할 수는 없습니다.
OpenAI는 저작권 관련 소송이 계속 진행 중인 상황에서 아카데미가 법적 이유로 아카데미 데이터를 공개하지 않을 것이라고 밝혔습니다. 회사는 또한 모델이 무기 제조나 사이버 공격과 같은 나쁜 목적으로 악용될 위험을 제한하기 위해 안전 테스트를 실시합니다.
우리는 미국에서 만들어지고 민주적 가치를 기반으로 하는 개방형 AI 플랫폼 위에 세계가 구축되기를 바랍니다.'라고 CEO 샘 알트먼은 강조했습니다. 그러나 개방형 AI 경쟁은 여전히 치열하게 진행되고 있으며 개방형 AI는 DeepSeek R2와 향후 Meta의 새로운 초지능 모델에 대한 기대를 안고 있습니다.