콘텐츠 플랫폼과 AI 회사 간의 대립은 Reddit이 최근 플랫폼에서 대부분의 게시물 댓글 및 공개 정보를 스캔하고 저장하는 인터넷 아카이브의 유명한 웹 호스팅 도구인 Wayback Machine,를 차단할 것이라고 발표하면서 계속해서 뜨거워지고 있습니다.
레딧이 제시한 이유는 일부 AI 회사가 웨이백 머신을 이용하여 데이터를 수집하고 라이선스 비용을 회피하고 사용자 정보를 악용하고 있다는 증거가 있다는 것입니다.
이 결정은 웨이백 머신이 Reddit.com 홈페이지에 나타나는 콘텐츠를 제외하고는 Reddit의 게시물 게시물 댓글 또는 프로필 정보를 저장할 수 없다는 것을 의미합니다.
위의 움직임은 이 소셜 네트워크 플랫폼이 AI 회사와 협력할 의향이 있지만 수수료를 지불할 의향이 있는 경우에만 데이터 통제권을 강화하는 배경에서 이루어졌습니다.
앞서 레딧은 인터넷 아카이브와 같은 '선의의 행위자'를 제한하지 않겠다고 단언했습니다. 그러나 웨이백 머신을 통해 AI가 불법적으로 데이터를 채굴하는 것을 지원하는 일부 당사자가 발견되면서 이러한 입장이 바뀌었습니다.
인터넷 아카이브 및 웨이백 머신
1996년 미국에 설립된, Internet Archive는 컴퓨터 엔지니어 Brewster Kahle이 설립한 비영리 단체로 포괄적이고 공개적인 인터넷 스토리지를 구축하는 것을 목표로 합니다. 가장 유명한 것은 과거 웹사이트의 스토리지 버전에 사용자가 액세스할 수 있도록 하는 도구인 Wayback Machine,입니다.
인터넷 아카이브는 웹사이트 눈 눈 소프트웨어 눈 음악 영화에서 인쇄물에 이르기까지 다양한 종류의 눈 디지털 콘텐츠에 대한 무료 액세스를 제공합니다.
대부분의 데이터는 공개 정보를 보존하고 디지털 데이터의 '증발'을 방지하기 위해 크롤러 브리지 시스템을 통해 자동으로 수집됩니다.
브루스터 칼레에 따르면 인터넷 아카이브는 단순한 디지털 라이브러리일 뿐만 아니라 기술 변화에 대한 '문화 보호 조치'이기도 합니다. 브루스터 칼레는 이 프로젝트를 현대 시대의 '알렉산드리아 라이브러리'를 재현하려는 노력 즉 인류의 지식이 미래 세대를 위해 보존되도록 보장하는 것에 비유했습니다.
레딧이 웨이백 머신을 차단한 것은 데이터 소유권 보호와 개방형 인터넷 유지 사이의 경계가 점점 더 구별하기 어려워지고 있는 AI 시대의 새로운 긴장을 보여줍니다.