OpenAI, 오디오 AI에 베팅, 스크린 없는 개인 기기 준비

HẠO THIÊN (THEO techcrunch) |

OpenAI는 ChatGPT의 대화 기능 개선에 그치지 않고 음성 인공 지능 개발 전략을 추진하고 있습니다.

OpenAI dat cuoc lon vao AI am thanh va chuan bi cho thiet bi ca nhan khong man hinh. Do hoa: AI
OpenAI는 오디오 AI에 큰 투자를 하고 화면 없는 개인 기기에 대비하고 있습니다. 그래픽: AI

The Information에 따르면 지난 두 달 동안 OpenAI는 약 1년 안에 출시될 예정인 음성 통신을 우선시하는 개인 장치를 준비하기 위해 다양한 기술 그룹, 제품 및 연구를 통합하여 전체 사운드 모델을 재구성했습니다.

이러한 움직임은 음향이 점차 화면의 지배적인 역할을 대체하는 중앙 인터페이스가 되고 있는 기술 산업의 일반적인 추세를 반영합니다. 음성 비서는 스마트 스피커를 통해 미국 가구의 3분의 1 이상에 등장했습니다. 많은 대기업도 이러한 방향으로 나아가고 있습니다.

Meta는 최근 사용자가 시끄러운 환경에서 더 명확하게 들을 수 있도록 다중 마이크 시스템을 사용하는 Ray-Ban 스마트 안경에 방향 감지 오디오 기능을 추가했습니다. Google은 검색 결과를 음성 음성 요약으로 전환하는 기능을 테스트하고 있습니다. 한편 Tesla는 xAI의 챗봇 Grok를 전기 자동차에 통합하여 사용자가 자연 음성으로 다양한 기능을 제어할 수 있도록 했습니다.

기술 "거물"뿐만 아니라 많은 스타트업도 화면 없는 AI 장치를 구축하려는 야망을 추구하고 있습니다. 그러나 이 길은 쉽지 않습니다. Humane AI Pin이나 Friend AI 목걸이와 같이 주목을 받았던 일부 제품은 실패하거나 개인 정보 보호와 관련된 논쟁에 직면하여 음성 AI를 개인 생활에 도입하는 데 큰 위험이 있음을 보여줍니다.

그럼에도 불구하고 이러한 추세는 계속해서 강화되고 있습니다. Sandbar와 Eric Migicovsky가 설립한 회사를 포함한 일부 스타트업은 사용자가 웨어러블 장치를 통해 직접 대화할 수 있는 AI 반지를 개발하고 있으며, 2026년에 출시될 예정입니다.

The Information에 따르면 2026년 초에 출시될 예정인 OpenAI의 새로운 사운드 모델은 더 자연스러운 음성, 유연한 끊김 처리, 심지어 사용자와 "대칭으로 말"하여 실제 대화와 같은 느낌을 줄 수 있습니다. OpenAI는 또한 유리 또는 화면 없는 스마트 스피커를 포함할 수 있는 새로운 장치 생태계를 상상하고 있으며, 도구보다는 동반자로서 작동하는 것으로 알려져 있습니다.

이 전략은 65억 달러 규모의 io 인수 거래 후 OpenAI 하드웨어 부서에 합류한 애플의 전 디자인 이사인 조니 아이브의 음향 우선 디자인 방향과 관련이 있습니다. 그는 화면 의존도를 줄이고 음향 인터페이스를 미래에 사람들이 소비 기술과 상호 작용하는 방식을 재구성할 수 있는 기회로 보고 싶어하는 것으로 알려져 있습니다.

이러한 맥락에서 음성 AI는 더 이상 보조 기능이 아니라 음성이 인간의 새로운 "통제 표면"이 되는 차세대 개인 기기의 기반으로 간주되고 있습니다.

HẠO THIÊN (THEO techcrunch)
관련 뉴스

후에 카운트다운은 활기찬 조명 소리 공연으로 뜨겁게 달아올랐습니다

|

후에 - 후에 카운트다운 프로그램은 음향 및 조명 공연으로 시작하여 넓은 광장 전체를 뜨겁게 달궜습니다.

Google Notebook, 오디오 학습 기능 확장

|

Google Notebook는 최대 30분 길이의 오디오 강의 모드를 추가하여 사용자가 매끄러운 읽기 음성과 명확한 구조로 수동 학습을 할 수 있도록 합니다.

미국에서 보호되는 FPT의 비정상적인 소리 감지 AI 모델

|

새로운 기능과 높은 응용 가능성 덕분에 FPT의 비정상적인 소리를 감지하는 AI(인공 지능) 모델은 미국에서 보호됩니다.

2026년 1월 1일부터 Thien Loc 코뮌 노동자 주택 임대료 인상에 대한 설명

|

티엔록사(하노이) 노동자 주택 단지 임대료가 2026년 1월 1일부터 인상되었습니다.

결승선 도착 전 하노이의 7,780억 동 지하차도 전경

|

하노이 - 7,780억 동 규모의 김동-자이퐁 지하차도 프로젝트가 막바지 단계에 접어들었으며, 2026년 초에 완공 및 운영될 예정입니다.

여기 네 개의 하늘의 날개로"와 돈 때문에 붕괴된 장면

|

라이브 쇼 "Ve day bon canh chim troi"가 공연 직전에 연기된 사건은 베트남 공연 조직 작업의 심각한 허점을 드러냈습니다.

꽝닌, 2026년 양력설 맞아 38만 명의 관광객 맞이

|

꽝닌 - 2026년 설날 연휴 동안 2025년 12월 31일부터 2026년 1월 1일까지 꽝닌은 38만 명의 관광객을 맞이했습니다.

북한, 김정은 국무위원장 딸의 희귀 사진 공개

|

북한 언론은 쿰수산 태양궁 방문에서 지도자의 딸의 새로운 모습을 보여주는 희귀한 사진을 공개했습니다.

후에 카운트다운은 활기찬 조명 소리 공연으로 뜨겁게 달아올랐습니다

PHÚC ĐẠT - NGUYỄN LUÂN |

후에 - 후에 카운트다운 프로그램은 음향 및 조명 공연으로 시작하여 넓은 광장 전체를 뜨겁게 달궜습니다.

Google Notebook, 오디오 학습 기능 확장

Cát Tiên |

Google Notebook는 최대 30분 길이의 오디오 강의 모드를 추가하여 사용자가 매끄러운 읽기 음성과 명확한 구조로 수동 학습을 할 수 있도록 합니다.

미국에서 보호되는 FPT의 비정상적인 소리 감지 AI 모델

NGUYỄN ĐĂNG |

새로운 기능과 높은 응용 가능성 덕분에 FPT의 비정상적인 소리를 감지하는 AI(인공 지능) 모델은 미국에서 보호됩니다.