arXiv(컴퓨터 과학, 수학 및 물리학과 같은 분야에서 유명한 선출판물 연구 라이브러리)는 과학 논문에서 인공 지능(AI) 남용을 제한하기 위한 조치를 강화하고 있습니다.
새로운 움직임은 대규모 언어 모델(LLM)에 의해 생성되거나 과도하게 지원되는 연구의 질에 대한 우려가 점점 더 커지는 상황에서 나타났습니다.
arXiv는 원래 과학자들이 공식 승인 전에 연구를 발표하는 데 인기 있는 플랫폼이었으며, 동시에 글로벌 연구 추세를 반영하는 중요한 데이터 소스가 되었습니다.
arXiv의 컴퓨터 과학 부서 책임자인 토마스 디테리히에 따르면, 기사가 저자가 AI가 생성한 콘텐츠를 확인하지 않았다는 것을 보여주면 이 플랫폼은 엄격한 처리 조치를 적용할 것입니다.
이러한 증거에는 AI "환각"으로 인해 존재하지 않는 참조 문서, 게시물에 잘못 삽입된 챗봇과의 대화 또는 검증 없이 언어 모델에서 직접 복사된 내용을 보여주는 오류가 포함될 수 있습니다.
새로운 규정에 따르면 위반 저자는 1년 동안 arXiv에 게시물을 게시하는 것이 금지될 수 있습니다. 이 기간 이후 플랫폼에 게재하려는 모든 후속 연구는 신뢰할 수 있는 검토 포럼에서 사전에 승인되어야 합니다.
그러나 arXiv는 이것이 과학 연구에서 AI 사용을 금지하는 명령이 아니라고 강조합니다. 디테리히에 따르면 과학자들은 여전히 큰 언어 모델을 지원 도구로 사용할 수 있지만, 콘텐츠가 어떻게 생성되었든 발표된 콘텐츠에 대해 "완전한 책임"을 져야 합니다.
이는 저자가 오류가 있는 단락, 편파적인 내용, 잘못된 참고 자료 또는 AI로부터 오해를 불러일으키는 정보를 직접 복사한 경우에도 다른 모든 학술적 오류와 마찬가지로 책임을 져야 함을 의미합니다.
디테리히 씨는 또한 처벌을 내리기 전에 arXiv 코디네이터가 사건을 보고해야 하고 전문 재판장이 위반 증거를 확인해야 한다고 밝혔습니다. 처벌받는 저자는 여전히 결정에 대해 항소할 권리가 있습니다.
최근 몇 년 동안 arXiv에 등장하는 저품질 논문 수는 생성형 AI 도구의 보급과 함께 급증하는 추세입니다. 이러한 상황을 제한하기 위해 플랫폼은 처음 논문을 게시하는 사람이 연구 커뮤니티에서 평판이 좋은 저자의 확인을 받아야 한다고 요구했습니다.
코넬 대학교에서 20년 이상 관리한 arXiv는 현재 검열 시스템을 개선하고 학술적 품질을 유지하기 위해 추가 자원을 동원하기 위해 독립적인 비영리 단체로 전환하고 있습니다.
최근의 일부 검토 연구에 따르면 생의학 분야의 가짜 인용이 증가하고 있으며, 이는 문서 생성을 위한 AI 모델 남용과 관련이 있을 가능성이 높습니다. 이는 AI가 엄격하게 통제되지 않으면 과학적 연구의 신뢰성을 떨어뜨릴 수 있다는 우려를 불러일으킵니다.