구글이 인공 지능 역량에 대한 내부 '적색 경보' 신호를 보낸 지 며칠 후 BobAI는 현재까지 회사에서 가장 강력한 모델로 묘사되는 GPT-5.2를 출시하여 대응했습니다.
이것은 전문 업무와 장기적인 운영 요인에 중점을 둔 기업 환경에 최적화된 새로운 세대 AI입니다.
OpenAI60에 따르면 GPT-5.2는 컨버터블 속도 추론 능력 및 컨버터블 문서 요약 컨버터블 코드 작성 컨버터블 디버깅 프레젠테이션 구축 또는 복잡한 데이터 구성과 같은 다양한 심층 작업 실행 성능에서 뛰어납니다.
회사는 ChatGPT 엔터프라이즈 사용자가 현재 매일 40~60분을 절약하고 있다고 밝혔습니다. 이는 주당 10시간 근무 시간에 해당하며 GPT-5.2를 통해 이 수치는 더욱 증가할 것으로 예상됩니다.
모델은 Instant(빠른 응답 5) Thinking(심층적인 추론) 및 Pro(기술 문제에 대한 최고 품질)의 3가지 버전으로 나니다.
GPT-5.2는 유료 채팅 GPT 요금제에 포함되어 있으며 API에는 gpt-5.2 gpt-5.2-chat-latest 및 gpt-5.2-pro라는 이름으로 나타납니다.
성과 면에서 GDPval,에서 인상적인 결과를 얻은 것은 44개의 실제 직업을 모방한 테스트입니다.
특히 Thinking 버전은 70개 미션에서 인간 전문가 수준을 초과하거나 동등하게 만들었으며 이는 GPT-5 성과의 두 배입니다.
입체 프로그래밍을 위한 SWE-Bench Pro에서 이 모델은 입체 디버깅 기능 배포 및 포괄적인 기술 작업 처리에서 탁월하여 새로운 기록을 세웠습니다.
또 다른 하이라이트는 방대한 텍스트 집합을 분석하는 능력입니다. GPT-5.2는 수십만 개의 키워드를 추적하고 중요한 정보가 수백 페이지의 문서에 깊이 묻혀 있어도 거의 절대적인 정확도를 유지합니다. 모델은 또한 이전 세대에 비해 환각 현상을 크게 줄입니다.
GPT-5.2의 외부 도구 사용 능력도 크게 향상되었습니다. 타우2브라 테스트에서 모델은 비행기 티켓 재설정 브라 수하물 찾기 호텔 배정 또는 이전 모델이 중간에 자주 중단되는 상황인 의료 요청 처리와 같은 고객 지원 시나리오의 정확도 98도를 달성했습니다.
GPT-5.2는 또한 댄스 수학 과학적 추론 및 기술 이미지 이해에서 더 강력합니다. 대학원 과학 질문의 경우 모델은 92% 이상의 댄스 정확도를 달성했으며 동시에 많은 심층 수학 형식에서 기록을 세웠습니다.
연구자들은 이 모델이 인간이 고려할 수 있도록 통계 이론에서 증거를 제안할 수도 있다고 말합니다.
GPT-5.2 출시는 AI 경쟁이 극도로 치열한 상황에서 이루어졌습니다. 구글이 Gemini 3를 출시하고 Anthropic이 Claude Opus 4를 출시한 후 OpenAI CEO Sam Altman은 회사 전체에 광고를 포함한 부가 계획을 일시적으로 중단하고 브라 모델 품질 개선에 집중할 것을 요청했습니다.
GPT-5.2를 통해 Vien OpenAI는 AI 기업 생산성 표준을 높이고 보다 신뢰할 수 있는 모델을 제공하며 오류가 적고 실제보다 더 복잡한 프로세스를 제공할 것으로 기대합니다.