Anthropic은 AI가 보안 취약점을 악용할 위험으로부터 중요한 소프트웨어를 보호하기 위한 연구 프로그램인 Glasswing 프로젝트의 첫 번째 결과를 발표했습니다.
Anthropic에 따르면 Claude Mythos라는 사이버 보안 AI 모델은 한 달 만에 10,000개 이상의 심각하거나 매우 심각한 소프트웨어 취약점을 발견했습니다.
이 정보는 AI가 현재 인간의 처리 및 패치 능력을 훨씬 뛰어넘는 속도로 보안 취약점을 감지할 수 있다는 인식을 강화하고 있습니다.
Anthropic에 따르면 Claude Mythos는 사이버 보안 임무를 위해 특별히 개발된 공개되지 않은 AI 모델입니다. 테스트 단계에서 프로젝트에 참여한 많은 파트너가 이전보다 발견된 보안 오류 수가 크게 증가한 것으로 기록했습니다.
눈에 띄는 파트너 중 하나는 기술 회사인 Cloudflare입니다. 이 회사는 주요 시스템에서 약 2,000개의 오류를 발견했으며, 그 중 400개의 오류가 심각하거나 위험한 수준으로 평가되었다고 밝혔습니다.
Cloudflare 기술팀은 Mythos의 오경보 비율이 많은 전통적인 수동 테스트 방법보다 낮다고 판단했습니다.
한편, 비영리 기술 기관인 모질라는 Mythos Preview를 테스트하면서 Firefox 150에서 271개의 보안 취약점을 발견하고 수정했다고 밝혔습니다. 이 수치는 이전 Claude Opus 4.6 모델을 사용하여 Firefox 148에서 발견한 오류 수보다 약 10배 높은 수치입니다.
파트너 은행과의 테스트에서 이 시스템은 150만 달러 상당의 사기성 송금 거래를 실시간으로 성공적으로 차단한 것으로 알려졌습니다.
오픈 소스 프로젝트의 경우 Anthropic은 Mythos Preview를 사용하여 현재 인터넷의 대부분을 기반으로 하는 1,000개 이상의 프로젝트를 스캔했다고 밝혔습니다. 이러한 프로젝트에서 AI는 약 6,202개의 심각하거나 매우 심각한 취약점을 발견했습니다.
정확성을 확인하기 위해 Anthropic은 6개의 독립 보안 연구 회사와 협력하여 발견된 1,752개의 취약점을 평가했습니다. 결과는 약 90.6%가 정확한 경고이고 62.4%가 심각도가 높거나 매우 심각한 것으로 확인되었습니다.
그러나 AI의 오류 감지 속도가 너무 빨라 소프트웨어 개발 커뮤니티에 큰 압력을 가하고 있습니다.
Anthropic은 현재 취약점 처리 절차가 상당히 복잡하다고 밝혔습니다. AI가 오류를 감지한 후 전문가는 진위 여부를 확인하고 위험 수준을 평가하고 패치를 확인하고 관련 소프트웨어 개발 팀에 자세한 보고서를 보내야 합니다.
많은 오픈 소스 프로젝트가 AI로 인해 생성된 많은 오류 보고서로 인해 과부하가 걸린 것으로 알려져 있습니다. 일부 소프트웨어 관리 그룹은 Anthropic에 보안 패치를 개발하고 배포할 충분한 시간을 갖도록 보고서 전송 속도를 줄일 것을 제안하기도 했습니다.
회사 통계에 따르면, 평균적으로 각 심각한 취약점을 해결하는 데 약 2주가 걸립니다.
현재까지 Anthropic은 530개의 심각한 취약점을 보고했으며, 그 중 75개만 완전히 패치되었고 65개는 공개 보안 경고를 발령했습니다. 또한 여전히 827개의 다른 취약점이 발표를 기다리고 있습니다.