
The Information에 따르면 지난 두 달 동안 OpenAI는 약 1년 안에 출시될 예정인 음성 통신을 우선시하는 개인 장치를 준비하기 위해 다양한 기술 그룹, 제품 및 연구를 통합하여 전체 사운드 모델을 재구성했습니다.
이러한 움직임은 음향이 점차 화면의 지배적인 역할을 대체하는 중앙 인터페이스가 되고 있는 기술 산업의 일반적인 추세를 반영합니다. 음성 비서는 스마트 스피커를 통해 미국 가구의 3분의 1 이상에 등장했습니다. 많은 대기업도 이러한 방향으로 나아가고 있습니다.
Meta는 최근 사용자가 시끄러운 환경에서 더 명확하게 들을 수 있도록 다중 마이크 시스템을 사용하는 Ray-Ban 스마트 안경에 방향 감지 오디오 기능을 추가했습니다. Google은 검색 결과를 음성 음성 요약으로 전환하는 기능을 테스트하고 있습니다. 한편 Tesla는 xAI의 챗봇 Grok를 전기 자동차에 통합하여 사용자가 자연 음성으로 다양한 기능을 제어할 수 있도록 했습니다.
기술 "거물"뿐만 아니라 많은 스타트업도 화면 없는 AI 장치를 구축하려는 야망을 추구하고 있습니다. 그러나 이 길은 쉽지 않습니다. Humane AI Pin이나 Friend AI 목걸이와 같이 주목을 받았던 일부 제품은 실패하거나 개인 정보 보호와 관련된 논쟁에 직면하여 음성 AI를 개인 생활에 도입하는 데 큰 위험이 있음을 보여줍니다.
그럼에도 불구하고 이러한 추세는 계속해서 강화되고 있습니다. Sandbar와 Eric Migicovsky가 설립한 회사를 포함한 일부 스타트업은 사용자가 웨어러블 장치를 통해 직접 대화할 수 있는 AI 반지를 개발하고 있으며, 2026년에 출시될 예정입니다.
The Information에 따르면 2026년 초에 출시될 예정인 OpenAI의 새로운 사운드 모델은 더 자연스러운 음성, 유연한 끊김 처리, 심지어 사용자와 "대칭으로 말"하여 실제 대화와 같은 느낌을 줄 수 있습니다. OpenAI는 또한 유리 또는 화면 없는 스마트 스피커를 포함할 수 있는 새로운 장치 생태계를 상상하고 있으며, 도구보다는 동반자로서 작동하는 것으로 알려져 있습니다.
이 전략은 65억 달러 규모의 io 인수 거래 후 OpenAI 하드웨어 부서에 합류한 애플의 전 디자인 이사인 조니 아이브의 음향 우선 디자인 방향과 관련이 있습니다. 그는 화면 의존도를 줄이고 음향 인터페이스를 미래에 사람들이 소비 기술과 상호 작용하는 방식을 재구성할 수 있는 기회로 보고 싶어하는 것으로 알려져 있습니다.
이러한 맥락에서 음성 AI는 더 이상 보조 기능이 아니라 음성이 인간의 새로운 "통제 표면"이 되는 차세대 개인 기기의 기반으로 간주되고 있습니다.