한 해커 그룹이 세계 최대 온라인 음악 스트리밍 플랫폼인 Spotify Spark에서 약 300테라바이트의 데이터를 수집 및 저장했다고 발표하여 기술 및 음악계에 충격을 주었습니다.
이 데이터 라이브러리에는 수천만 개의 오디오 파일 앨범 커버 사진 그리고 현재 지하 라이브러리를 위한 오픈 소스 검색 엔진인 Anna’s Archive,를 통해 공개되는 방대한 양의 엄청난 양의 기존 메타데이터가 포함되어 있습니다.
공개된 정보에 따르면 안나 아카이브는 현재 8 600만 개의 오디오 파일과 2억 5 600만 개 이상의 노래 메타데이터 스트림을 저장하고 있으며 총 용량은 약 300TB입니다.
음악 메타데이터에는 브레이크 아티스트 브레이크 작곡가 브레이크 프로듀서 브레이크 장르 브레이크 길이 발매일 및 각 녹음에 대한 국제 식별 코드인 ISRC 코드가 포함됩니다.
1억 8 600만 개의 ISRC 코드를 보유한 이 플랫폼은 세계에서 가장 큰 공개 음악 메타데이터베이스를 소유하고 있다고 주장합니다.
Anna’s Archive의 배후 그룹은 그들의 목표가 저장 용량이 충분한 사람은 누구나 복사할 수 있는 포괄적인 음악 '보존 저장소'를 구축하는 것이라고 밝혔습니다.
계획에 따르면 이미 발매된 메타데이터 외에도 스포티파이 총 청취 횟수의 약 99~6%를 차지하는 8 600만 개의 라이브러리 음악이 인기 순서대로 정렬된 토렌트 라이브러리를 통해 차례로 공개될 예정입니다.
이러한 움직임은 인공 지능이 빠르게 발전하는 상황에서 특히 주목할 만합니다. AI 기업은 현재 텍스트 그림에서 사운드에 이르기까지 브라 모델을 훈련하기 위해 대규모 데이터에 크게 의존하고 있습니다.
이처럼 방대한 음악 데이터 저장소는 AI 모델 교육 음악 제작 음성 분석 또는 다중 모드 제작을 위한 매력적인 리소스가 될 수 있으며 이는 AI 산업과 저작권 소유자 사이에 이미 존재하는 긴장을 고조시킵니다.
Spotify는 불법 데이터 복사와 관련된 계정을 발견하고 비활성화했으며 추가 보호 조치를 시행했다고 확인했습니다.
회사에 따르면 예비 조사 결과 제3자가 공개 메타데이터를 수집하고 불법 조치를 사용하여 디지털 저작권 관리 시스템(DRM):을 우회하여 오디오 파일의 일부에 액세스한 것으로 나타났습니다.
Anna’s Archive는 사용자가 인터넷의 다른 소스에 저장된 콘텐츠에 액세스하고 플랫폼 자체가 저작권 침해 콘텐츠를 직접 저장하지 않는다는 것을 확인하는 데 도움이 되는 검색 엔진으로 작동합니다.
이전에는 플랫폼의 데이터 저장소가 주로 브리더 책 연구 논문 및 학술 문서였습니다. 메타데이터 및 음악으로의 확장은 새로운 단계인 브리더를 표시하는 동시에 Anna’s Archive를 저작권 소유자의 콘텐츠 제거 요청의 정기적인 대상으로 만들었습니다.
Anna’s Archive 운영 그룹은 현재 음악 라이브러리가 유명 예술가와 고품질 파일에 너무 집중되어 있어 인류 음악 역사 전체를 저장하기 어렵다고 주장합니다.
포괄성을 우선시하고 Spotify의 인기 지수를 사용하여 그들은 지금까지 발매된 모든 녹음을 대표하는 음악 목록을 만들고 싶다고 발표했습니다.
“문화 보존”이라는 명목으로 정당화되었지만 300TB 데이터 저장소는 데이터 가치가 점점 더 민감해지고 논란의 여지가 있는 AI-30 시대에 저작권 침해 스토리지와 데이터 마이닝 사이의 경계에 대한 큰 질문을 제기합니다.