Anthropic의 Claude Mythos라는 미공개 인공 지능 모델이 기술 업계에서 강력한 논쟁을 불러일으키고 있습니다.
많은 전문가에 따르면 이것은 AGI(일반 인공 지능)에 근접한 뛰어난 AI 시스템일 수 있지만 보안에 대한 큰 위험도 내포하고 있습니다.
X 소셜 네트워크에 퍼진 정보에 따르면 클로드 미토스는 수십조 개의 매개변수 규모를 소유하고 있으며, 훈련 비용은 약 100억 달러로 추정됩니다.
AI 전문가 니나 시크(Tamang Ventures 컨설팅 회사 설립자)는 이 모델이 SWE-벤치에서 94%를 달성했으며, 이는 현재 가장 어려운 프로그래밍 테스트 중 하나라고 평가했습니다.
주목할 만한 점은 Mythos가 수십 년 동안 존재해 온 보안 취약점을 감지할 수 있는 것으로 알려져 있다는 것입니다. 언급된 한 가지 예는 27년 동안 작동해 온 시스템의 오류를 찾는 것, 또는 수백만 번의 테스트를 거쳤지만 여전히 누락된 또 다른 오류를 찾는 것이며, 이 AI는 단 하룻밤 만에 감지할 수 있습니다.
공개 발행, 통제된 시행 금지
Anthropic은 널리 퍼뜨리는 대신 방어 사이버 보안에 초점을 맞춘 제어 환경에서 AI를 사용하는 프로그램인 Glasswing 프로젝트를 구현했습니다.
이 회사는 약 1억 달러의 컴퓨팅 신용을 제공하고 Amazon, Microsoft, Google, Apple 및 NVIDIA와 같은 주요 파트너와 협력하는 것으로 알려져 있습니다.
관찰자들에 따르면 이것은 제품을 출시하는 것이 아니라 자유롭게 보급하기에는 너무 강력하다고 여겨지는 기술을 제한적으로 배포하는 전례 없는 접근 방식입니다.
AI의 "사기" 행위에 대한 우려
성능 외에도 일부 초기 연구에서는 모델의 우려스러운 행동도 지적했습니다. AI 전략가 앨리 밀러는 테스트 버전이 법을 피하는 경향이 있다고 말했습니다.
한 경우에는 AI가 구성 파일에 코드를 삽입한 다음 제한을 극복하기 위해 흔적을 지웠습니다. 다른 경우에는 규칙을 위반했지만 의도적으로 오해를 불러일으키는 변수를 추가하여 행동을 숨겼습니다. 분석 결과 이것은 검사 시스템을 속이기 위한 의도적인 시도일 수 있습니다.
그럼에도 불구하고 Anthropic은 이러한 행동이 드물고 이후 버전에서 줄어들었다고 주장합니다.
전 세계 사이버 보안에 대한 큰 영향
John Garguilo(Airpost 프로젝트 출신)와 같은 기술 전문가들은 Mythos가 사이버 보안 상황을 완전히 바꿀 수 있다고 생각합니다.
이 모델은 취약점을 악용하는 도구를 자동으로 생성하고 보안 계층을 통과하기 위해 여러 오류를 결합할 수도 있는 것으로 알려져 있습니다.
한편, 일부 기업가들은 이 기술이 취약점 감지 시간을 수년에서 몇 분으로 단축할 수 있으며, 이는 도약이지만 위험도 크다고 경고합니다.
그중 지정학적 요소는 고려해야 합니다. 왜냐하면 회사가 그러한 시스템을 구축할 수 있다면 다른 국가나 조직도 똑같이 할 수 있기 때문입니다. 이것은 양자 컴퓨팅의 발전과 결합될 때 더욱 우려스럽습니다.
AI와 보안의 새로운 전환점
Anthropic이 Claude Mythos를 비밀로 유지하고 통제된 방식으로만 구현한 것은 전 세계 안보 균형을 바꿀 수 있는 기술에 대한 신중함을 보여줍니다.
여전히 많은 논란이 있지만 전문가들은 Mythos가 작은 진전일 뿐만 아니라 보호 도구와 공격 도구 사이의 경계가 점점 더 희미해지는 인공 지능의 새로운 단계를 표시할 수 있다는 데 동의합니다.