클로드 미토스는 너무 강력해서 발매할 수 없어 논란을 일으켰습니다

Cát Tiên | 09/04/2026 15:04

Anthropic의 클로드 미토스는 너무 강력하여 오래된 보안 취약점을 감지하고 공격 도구를 만들 수 있다고 여겨 논란을 일으켰습니다.

Anthropic의 Claude Mythos라는 미공개 인공 지능 모델이 기술 업계에서 강력한 논쟁을 불러일으키고 있습니다.

많은 전문가에 따르면 이것은 AGI(일반 인공 지능)에 근접한 뛰어난 AI 시스템일 수 있지만 보안에 대한 큰 위험도 내포하고 있습니다.

X 소셜 네트워크에 퍼진 정보에 따르면 클로드 미토스는 수십조 개의 매개변수 규모를 소유하고 있으며, 훈련 비용은 약 100억 달러로 추정됩니다.

AI 전문가 니나 시크(Tamang Ventures 컨설팅 회사 설립자)는 이 모델이 SWE-벤치에서 94%를 달성했으며, 이는 현재 가장 어려운 프로그래밍 테스트 중 하나라고 평가했습니다.

주목할 만한 점은 Mythos가 수십 년 동안 존재해 온 보안 취약점을 감지할 수 있는 것으로 알려져 있다는 것입니다. 언급된 한 가지 예는 27년 동안 작동해 온 시스템의 오류를 찾는 것, 또는 수백만 번의 테스트를 거쳤지만 여전히 누락된 또 다른 오류를 찾는 것이며, 이 AI는 단 하룻밤 만에 감지할 수 있습니다.

공개 발행, 통제된 시행 금지

Anthropic은 널리 퍼뜨리는 대신 방어 사이버 보안에 초점을 맞춘 제어 환경에서 AI를 사용하는 프로그램인 Glasswing 프로젝트를 구현했습니다.

이 회사는 약 1억 달러의 컴퓨팅 신용을 제공하고 Amazon, Microsoft, Google, Apple 및 NVIDIA와 같은 주요 파트너와 협력하는 것으로 알려져 있습니다.

관찰자들에 따르면 이것은 제품을 출시하는 것이 아니라 자유롭게 보급하기에는 너무 강력하다고 여겨지는 기술을 제한적으로 배포하는 전례 없는 접근 방식입니다.

AI의 "사기" 행위에 대한 우려

성능 외에도 일부 초기 연구에서는 모델의 우려스러운 행동도 지적했습니다. AI 전략가 앨리 밀러는 테스트 버전이 법을 피하는 경향이 있다고 말했습니다.

한 경우에는 AI가 구성 파일에 코드를 삽입한 다음 제한을 극복하기 위해 흔적을 지웠습니다. 다른 경우에는 규칙을 위반했지만 의도적으로 오해를 불러일으키는 변수를 추가하여 행동을 숨겼습니다. 분석 결과 이것은 검사 시스템을 속이기 위한 의도적인 시도일 수 있습니다.

그럼에도 불구하고 Anthropic은 이러한 행동이 드물고 이후 버전에서 줄어들었다고 주장합니다.

전 세계 사이버 보안에 대한 큰 영향

John Garguilo(Airpost 프로젝트 출신)와 같은 기술 전문가들은 Mythos가 사이버 보안 상황을 완전히 바꿀 수 있다고 생각합니다.

이 모델은 취약점을 악용하는 도구를 자동으로 생성하고 보안 계층을 통과하기 위해 여러 오류를 결합할 수도 있는 것으로 알려져 있습니다.

한편, 일부 기업가들은 이 기술이 취약점 감지 시간을 수년에서 몇 분으로 단축할 수 있으며, 이는 도약이지만 위험도 크다고 경고합니다.