A Spotify le ha estallado una crisis incómoda en un día cualquiera de calendario navideño: el colectivo Anna’s Archive asegura haber "respaldado" a escala industrial la biblioteca musical del servicio, y habla de un botín que rondaría los 300 TB y que incluiría metadatos de 256 millones de pistas y archivos de audio de 86 millones de canciones. La compañía, por ahora, no valida esas cifras, pero sí admite que investiga un acceso no autorizado vinculado al "scraping" de datos públicos, un matiz que cambia el encuadre: no sería el guion clásico de "hackeo" a sistemas internos, sino una extracción masiva que, aun así, puede tener consecuencias.
La clave está en el "cómo" y en el "qué" de ese supuesto volcado. Varias coberturas señalan que el grupo empezó liberando metadatos —la cartografía del catálogo: identificadores, créditos, versiones, fechas, vínculos entre artistas— antes de prometer entregas escalonadas del audio, ordenadas por popularidad. Spotify ha reconocido en declaraciones publicadas por varios medios que detectó una combinación de raspado de metadatos públicos y "tácticas ilícitas" para acceder a algunos archivos de audio, sin confirmar ni el volumen ni el alcance que proclama Anna’s Archive.
Metadatos, larga cola y preservación
En el relato de Anna’s Archive hay, además, un dato que duele más por lo que sugiere que por lo que cuenta: su análisis de metadatos dibuja un Spotify donde la "larga cola" es inmensa y silenciosa, con una mayoría de canciones que apenas existen en términos de escucha, frente a una minoría que concentra la atención. Ese patrón no es nuevo en economía digital: distintos trabajos han descrito distribuciones muy sesgadas —el "winner takes all" que se come el mercado—, y en música se ha documentado tanto el efecto long tail como su debilitamiento por dinámicas de concentración. Incluso el debate reciente sobre el umbral de 1.000 reproducciones para generar royalties en Spotify se apoya, de forma indirecta, en esa realidad estadística: millones de temas quedan fuera del reparto, lo que reabre la discusión sobre quién gana (y quién se queda mirando) en el streaming.
El grupo intenta revestirlo todo con la palabra "preservación", como si Spotify fuera una Filmoteca sin puertas de emergencia: si mañana se cae el edificio —por cierre, por licencias, por litigios—, se perdería música que no está en ningún otro sitio. Ese temor tiene literatura seria: bibliotecas y archivistas llevan años advirtiendo de que el acceso a música online y bajo licencia no equivale a conservación, y de que las plataformas —por diseño legal y técnico— no garantizan permanencia ni disponibilidad histórica. Ahora bien, que exista un problema real de preservación cultural no convierte automáticamente en "archivo" lo que, en la práctica, es la copia y distribución de obras protegidas: el choque entre interés público y derechos de autor es precisamente el campo de minas que este episodio vuelve a pisar.
DRM, reputación y el "control de acceso"
En lo técnico, el caso golpea una idea que el streaming vende sin decirla: que el catálogo es inabarcable, sí, pero también intransferible, porque vive detrás de DRM, cuentas, acuerdos y sistemas antifraude. Si la investigación de Spotify confirma que alguien logró sortear DRM y automatizar accesos a audio "a escala", el problema no es solo la música: es el precedente para cualquier plataforma que base su modelo en control de acceso, no en posesión. De ahí que la compañía esté calibrando el lenguaje ("scraping" de metadatos públicos, "algunos" audios) mientras el eco mediático se dispara: cuando una filtración se mide en terabytes, el tamaño se convierte en titular y, a la vez, en presión reputacional.