1. Vandal Random
  2. Noticias
  3. La IA está copiando a Hollywood y ya lleva aprendidas 53.000 películas y 85.000 episodios de series

La IA está copiando a Hollywood y ya lleva aprendidas 53.000 películas y 85.000 episodios de series

Empresas como Apple y Anthropic han utilizado los diálogos de estas películas y programas de televisión para entrenar sistemas de IA.
La IA está copiando a Hollywood y ya lleva aprendidas 53.000 películas y 85.000 episodios de series

En los últimos años, la relación entre la creatividad y la inteligencia artificial ha generado una controversia que sigue creciendo, y un reciente análisis de The Atlantic ha puesto el foco en cómo los subtítulos de películas y series se han convertido en una pieza clave para entrenar modelos de lenguaje generativo. Este análisis reveló que grandes empresas tecnológicas como Apple, Meta, Nvidia y Salesforce han utilizado datos de OpenSubtitles.org, una base de datos que recopila más de 9 millones de archivos de subtítulos en múltiples idiomas. La colección incluye diálogos de clásicos como El Padrino y Los Simpsons hasta éxitos modernos como Breaking Bad.

Si bien algunos ven en estos avances una oportunidad para enriquecer la tecnología, otros los perciben como una amenaza.

El dilema ético y legal

Según la publicación, entre las películas y series que nutren estos modelos se encuentran también Friends, Juego de Tronos, The Office y Stranger Things, lo que refleja un amplio espectro de géneros y estilos narrativos. Aunque no se trata de guiones completos, estos subtítulos ofrecen un acceso invaluable a la estructura del diálogo hablado, un recurso escaso en el mundo de la IA. El uso de estos subtítulos no solo es un recurso técnico, sino también un tema ético y legal. Hay pruebas de que los sistemas de IA han sido entrenados con el trabajo de guionistas de cine y televisión. No solo en El Padrino y Alf, sino con más de 53.000 películas y 85.000 episodios de televisión: el diálogo de todo ello está incluido en un conjunto de datos de entrenamiento de IA.

PUBLICIDAD

Los creativos de Hollywood han mostrado preocupación, especialmente porque muchos de ellos nunca imaginaron que su trabajo podría ser usado para entrenar programas que podrían reemplazarlos. La falta de transparencia por parte de las empresas y la complejidad legal de usar obras protegidas por derechos de autor como material de entrenamiento agravan el conflicto. Mientras las compañías argumentan que su uso se enmarca en el "fair use", los escritores y creadores sostienen que se trata de un caso claro de plagio tecnológico, como lo expresó Vince Gilligan, creador de Breaking Bad, en una carta reciente a la Oficina de Derechos de Autor de EE. UU.

El poder de los subtítulos en el desarrollo de IA

El conjunto de datos OpenSubtitles es solo una parte de The Pile, una colección de fuentes para entrenar IA que incluye textos de libros, patentes, discusiones en línea e incluso subtítulos de YouTube. Sin embargo, los subtítulos destacan por su capacidad de reflejar patrones de conversación y por su valor en la generación de diálogos naturales en chatbots. Esta técnica, que inicialmente tenía como objetivo aplicaciones como Google Translate, ahora se está utilizando para desarrollar modelos que podrían competir con guionistas humanos en la creación de narrativas complejas. Entre los títulos más populares que enriquecen estos conjuntos están Sherlock, House of Cards y The Mandalorian, series que destacan por sus diálogos ágiles y cautivadores.

Impacto en la cultura y los derechos de los creadores

El impacto cultural y económico de esta práctica es innegable. Si bien algunos ven en estos avances una oportunidad para enriquecer la tecnología, otros los perciben como una amenaza directa a sus medios de vida. La posibilidad de que los modelos de lenguaje generen guiones completos, eliminando la necesidad de escritores, plantea preguntas urgentes sobre cómo proteger los derechos de los creadores en un mundo donde los límites entre lo humano y lo artificial se desdibujan cada vez más.

La necesidad de regulación

Por otro lado, los desarrolladores de estos modelos, como Apple y Salesforce, aseguran que los datos no se utilizan para productos comerciales, sino para investigación. Sin embargo, el acceso a estos modelos permite a terceros aplicarlos en múltiples contextos, incluyendo usos que podrían desplazar a escritores y artistas. Este vacío ético y legal subraya la necesidad de una regulación más clara en torno al uso de datos en la inteligencia artificial, especialmente cuando se trata de trabajos creativos.

A medida que el debate continúa, una cosa queda clara: el uso de subtítulos para entrenar IA es solo un ejemplo de cómo las tecnologías emergentes están reconfigurando nuestra relación con el arte y la creatividad. La pregunta que queda por resolver es cómo equilibrar la innovación tecnológica con la justicia para los artistas y creadores cuyas obras se encuentran en el corazón de este cambio.

Comentarios: 0

En forosComentar en nuestros foros

Más sobre Cine

RANDOM
Flecha subir