구글은 음성을 텍스트로 바꾸는 기술 경쟁에서 주목할 만한 진전을 알리는 새로운 철자법 읽기 앱인 Google AI Edge Eloquent를 조용히 출시했습니다.
이 앱의 가장 큰 차이점은 오프라인 작동 기능으로, 인터넷 연결이 필요 없는 사용자도 핵심 기능을 사용할 수 있습니다.
이 앱은 현재 iOS에서 무료로 출시됩니다. Gemma 기반 음성 인식 모델(ASR)을 다운로드하여 설치한 후 사용자는 휴대폰에서 직접 철자를 읽기 시작할 수 있습니다.
사용 중 Eloquent은 녹음을 실시간으로 표시합니다. 사용자가 일시 정지하면 시스템은 자동으로 내용을 처리하고 "음", "아"와 같은 중간 단어를 제거하고 문장을 더 명확하게 편집합니다.
이것은 원래 말만 그대로 기록하는 많은 전통적인 도구와 차별화되는 점입니다.
이 앱은 또한 사용자가 빠른 메모에서 전문적인 콘텐츠에 이르기까지 필요에 따라 텍스트를 빠르게 변환할 수 있도록 "주요 목적", "장식", "짧음" 또는 "길이"와 같은 옵션을 제공합니다.
주목할 만한 점 중 하나는 Eloquent를 통해 사용자가 클라우드 모드를 완전히 끌 수 있다는 것입니다. 이때 모든 데이터가 장치에서 직접 처리되어 프라이버시와 보안이 향상됩니다.
온라인 모드를 켜면 애플리케이션은 클라우드 플랫폼의 제미니 모델을 활용하여 텍스트를 더 잘 최적화합니다.
사용자는 앱이 Gmail 계정에서 키워드, 개인 이름 또는 전문 용어를 학습하거나 정확도를 개선하기 위해 사용자 정의 단어를 추가하도록 허용할 수 있습니다.
이 앱은 또한 철자 읽기 세션의 기록을 저장하여 콘텐츠를 다시 검색할 수 있도록 합니다. 단어 수, 읽기 속도(분당 단어) 또는 총 사용 단어 수와 같은 통계도 표시되어 자세한 추적 경험을 제공합니다.
Eloquent의 등장은 Google이 Wispr Flow, SuperWhisper 또는 Willow와 같은 AI 받아쓰기 애플리케이션과 직접 경쟁하고 있음을 보여줍니다.
음성 인식 모델이 점점 더 정확해지는 상황에서 이 시장은 빠르게 성장하고 있습니다.
현재 iOS에서만 제공되지만, 앱 설명은 구글이 안드로이드 버전을 준비했음을 보여줍니다.
심지어 이 버전은 운영 체제에 깊이 통합되어 기본 키보드로 사용하거나 팝업 버튼을 통해 모든 응용 프로그램에서 빠르게 액세스할 수 있을 것으로 예상됩니다.
구글이 오프라인 처리에 집중하는 것은 클라우드에서 사용자 장치로 직접 AI를 가져오는 새로운 트렌드를 반영합니다.
이는 처리 속도를 높일 뿐만 아니라 개인 데이터와 관련된 위험을 줄이는 데도 도움이 됩니다.
테스트가 성공하면 스마트 맞춤법 기능이 곧 안드로이드의 표준이 되어 사용자가 모바일 장치와 상호 작용하는 방식을 타이핑에서 자연스러운 대화로 바꿀 수 있습니다.