전 OpenAI 연구원 ChatGPT의 망상 소용돌이에 대해 경고

Cát Tiên (THEO techcrunch) |

희귀하지만 우려스러운 사례는 ChatGPT와 같은 AI 챗봇이 사용자를 위험한 환상으로 이끌 수 있음을 보여줍니다.

47세의 앨런 브룩스 브라이즈는 캐나다에 살고 있으며 브라이즈는 ChatGPT와 3주 동안 대화를 나누었고 인터넷을 '마비'시킬 수 있는 새로운 형태의 수학을 발견했다고 믿습니다.

수학적 배경이나 정신 질환 이력이 없었음에도 불구하고 브룩스는 챗봇의 안심시키는 대화의 연속에 빠져들었고 그곳에서 모든 것이 환상이라는 것을 깨닫습니다.

이 이야기는 2024년 말 회사를 떠난 후 독립 보고서에서 OpenAI-30의 전직 안전 연구원인 스티븐 애들러에 의해 분석되었습니다.

애들러는 해리 포터 7권보다 긴 브룩스 브래드의 전체 대화 기록을 얻었고 이것이 적절한 보호 메커니즘이 없을 때 AI 모델의 위험에 대한 명백한 증거라고 경고했습니다.

애들러는 OpenAI가 위기 상황에서 사용자를 지원하는 방식에 여전히 많은 단점이 있다고 생각합니다.

그는 ChatGPT가 챗봇이 실제로 이 기능을 전혀 가지고 있지 않은데도 OpenAI의 안전 그룹에 문제를 보고하겠다고 계속해서 주장하면서 Brooks,에게 거짓말을 했다고 강조했습니다.

직접 연락한 후에야 브룩스는 회사 지원 부서로부터 자동 응답을 받았습니다.

브룩스의 경우는 예외적인 경우가 아닙니다. 지난 8월 bia OpenAI는 16세 청소년이 자살한 후 소송에 직면했습니다. gia는 ChatGPT에 자신의 의도를 밝혔습니다.

Adler,에 따르면 이는 챗봇이 사용자를 반박하거나 조정하는 대신 위험한 신뢰를 강화할 때 발생하는 '아첨' 현상의 결과입니다.

이를 극복하기 위해 OpenAI는 기존 모델 행동 연구 그룹을 재구성하고 ChatGPT의 기본 모델로 GPT-5를 도입하여 어려움을 겪는 사용자를 더 잘 지원할 수 있도록 했습니다.

회사는 또한 MIT 미디어 랩과 협력하여 음성 대화에서 정서적 건강을 평가하는 도구를 개발했지만 아직 테스트 단계에 머물러 있습니다.

그의 분석에서 눈 애들러는 OpenAI 분류를 브룩스의 데이터에 적용하여 ChatGPT 메시지의 85% 이상이 '절대적인 합의'를 나타낸다는 것을 발견했습니다. 반면 90% 이상은 브룩스의 독특함을 주장합니다. 눈은 간접적으로 그가 '세계를 구하는 천재'라는 환상을 키웠습니다.

애들러는 OpenAI가 이러한 안전 도구를 즉시 배포하고 AI에 맡기는 대신 실제 사람들을 지원하는 데 더 많은 투자를 해야 한다고 권장합니다.

그는 또한 사용자가 악순환을 제한하고 광범위한 안전 위반을 감지하기 위한 개념 검색을 적용하기 위해 새로운 대화를 자주 시작하도록 장려할 것을 제안했습니다.

OpenAI는 GPT-5가 크게 개선되었다고 주장하지만 애들러의 분석가는 다른 AI 회사들이 브라 망상 악순환을 막기 위해 유사한 보호 조치를 적용할 것인지 아니면 이 위험이 미래 세대 챗봇에서 반복될 것인지에 대한 질문을 계속 제기합니다.

Cát Tiên (THEO techcrunch)
관련 뉴스

ChatGPT AI 초상화 기능 출시 검은 슈퍼히어로 제미니 나노 바나나 경쟁

|

OpenAI는 ChatGPT,에 AI 슈퍼 히어로 액션 초상화 기능을 통합하여 Gemini Nano Banana와 직접 경쟁합니다.

OpenAI Google 및 Amazon과 직접 경쟁하는 ChatGPT, 쇼핑 시스템 출시

|

새로운 시스템은 ChatGPT를 안전한 결제를 통합한 가상 상점으로 만들고 전자 상거래 통제권을 확대하며 Google 및 Amazon과 경쟁합니다.

OpenAI 수익 창출 이사 채용 ChatGPT 광고 가능성 공개

|

OpenAI는 회사가 새로운 수익 전략을 관리하기 위해 수익 창출 이사를 찾고 있기 때문에 ChatGPT에 광고를 도입할 준비를 하고 있는 것으로 알려졌습니다.

투자자들이 바닥을 잡기 위해 몰려들고 증권이 극적으로 반전되었습니다

|

VN-Index가 1 600포인트 선으로 돌아오면서 저가 매수 자금이 다시 유입되어 증권 시장이 극적인 반전을 보였습니다.

신임 하노이시 당위원회 서기: 수도를 위해 최선을 다할 것이며 어려움을 두려워하지 않고 회피하지 않을 것입니다

|

응우옌주이응옥 신임 하노이시 당위원회 서기는 수도를 위해 최선을 다할 것이며 헌신적인 눈 공정한 눈 객관적인 눈 어려움을 두려워하지 않는 눈 회피하지 않는 눈이라고 단언했습니다.

하띤에서 꽝응아이까지 32개 주요 취약 제방 위치 확인

|

제방 관리 및 재해 예방국에 따르면 중부 제방 시스템에는 32개의 주요하고 중요한 위치가 확인되었습니다.

건설 허가 발급 기간이 최대 7일로 단축됩니다

|

건설법(수정안): 초안에서 정부는 온라인 건축 허가 발급을 시행하여 발급 시간을 최대한 줄일 것을 제안합니다. 예상 기간은 최대 7일입니다.

금융 리스크가 고조되면 금 가격이 700달러 더 오를 수 있습니다

|

UBS는 금 가격 조정이 기술적인 성격일 뿐이라고 평가합니다. 지정학적 또는 재정적 위험이 고조되면 금은 4 700 USD/온스까지 상승할 수 있습니다.

ChatGPT AI 초상화 기능 출시 검은 슈퍼히어로 제미니 나노 바나나 경쟁

Cát Tiên (T/H) |

OpenAI는 ChatGPT,에 AI 슈퍼 히어로 액션 초상화 기능을 통합하여 Gemini Nano Banana와 직접 경쟁합니다.

OpenAI Google 및 Amazon과 직접 경쟁하는 ChatGPT, 쇼핑 시스템 출시

Cát Tiên (T/H) |

새로운 시스템은 ChatGPT를 안전한 결제를 통합한 가상 상점으로 만들고 전자 상거래 통제권을 확대하며 Google 및 Amazon과 경쟁합니다.

OpenAI 수익 창출 이사 채용 ChatGPT 광고 가능성 공개

Cát Tiên (THEO hindustantimes) |

OpenAI는 회사가 새로운 수익 전략을 관리하기 위해 수익 창출 이사를 찾고 있기 때문에 ChatGPT에 광고를 도입할 준비를 하고 있는 것으로 알려졌습니다.