유럽 방송 연맹(EBU)이 BBC와 협력하여 발표한 새로운 연구에 따르면 최고의 AI 비서들이 뉴스 정보를 제공하는 데 흔한 실수를 저지르고 있으며 이는 점점 더 많은 사람들이 전통적인 검색 엔진을 대체하여 AI에 의존함에 따라 대중의 신뢰에 대한 우려를 불러일으키고 있습니다.
이 국제 연구는 ChatGPT를 포함한 저명한 인공 지능 비서의 3 000건의 피드백을 분석했습니다. 찬라 코파일럿 찬라 제미니 및 14개 언어로 된 퍼플렉시티 찬라입니다.
전문가들은 AI 답변의 정확성 자원 및 진실과 의견을 구별하는 능력을 평가합니다.
결과에 따르면 응답자의 45%가 적어도 하나의 중요한 문제를 포함하고 있는 반면 81%는 몇 가지 형태의 오류를 겪고 있습니다.
눈에 띄는 문제 중 하나는 정보 제공 오류입니다.
AI 응답의 약 3분의 1은 정보 부족 잘못된 기록 또는 부정확한 정보 제공과 같은 심각한 바이러스 오류가 있습니다.
Google의 Gemini는 다른 비서의 25% 미만에 비해 밀라드 공급 문제에 대한 응답이 72%에 달했습니다.
정확도에 관해서는 응답자의 20%가 오래되거나 잘못된 정보를 포함하고 있습니다. 예를 들어 제미니는 일회용 전자 담배에 대한 잘못된 법률을 보고했으며 ChatGPT는 프란치스코 교황이 사망한 지 몇 달 후에도 여전히 현재 교황이라고 불렀습니다.
한편 AI 회사들은 이 문제에 대해 답변했습니다. 구글은 제미니가 플랫폼 개선을 위한 답변을 환영한다고 밝혔습니다.
OpenAI와 마이크로소프트는 AI가 부정확한 정보를 생성할 때의 환각 현상이 그들이 극복하기 위해 노력하고 있는 과제임을 인정합니다.
Perplexity는 프레젠테이션 모드 중 하나인 프레젠테이션 심층 연구가 실제로 93 완벽한 정확도를 달성한다고 밝혔습니다.
이 연구에는 프랑스 브라 독일 브라 스페인 브라 우크라이나 브라 영국 및 미국을 포함한 18개 브라 국가의 22개 공공 미디어 조직이 참여했습니다.
EBU 커뮤니케이션 디렉터인 장 필립 드 텐더 브리지(Jean Philip De Tender,)는 다음과 같이 강조했습니다. 달라 사람들이 무엇을 믿어야 할지 모를 때 그들은 아무것도 믿지 않을 것입니다. 그것은 민주주의 참여를 막을 수 있습니다.
로이터 연구소의 2025년 디지털 뉴스 보고서에 따르면 온라인 뉴스 소비자의 약 7%와 25세 미만의 15%가 현재 AI 비서를 사용하여 정보를 얻고 있습니다.
이러한 현실에 직면하여 회사는 AI 회사에 대중의 신뢰를 보호하고 디지털 시대에 신뢰할 수 있는 정보를 보장하기 위해 뉴스 관련 응답 품질을 책임지고 개선할 것을 촉구합니다.