La BBC y 22 emisoras p�blicas descubren que Gemini, ChatGPT y Copilot tergiversan el 45 por ciento de sus noticias

La BBC y la Uni�n Europea de Radiodifusi�n acaban de publicar el estudio m�s grande jam�s hecho sobre c�mo responden los chatbots de inteligencia artificial cuando la gente les pregunta sobre noticias. Los resultados son tremendos porque Gemini de Google, ChatGPT de OpenAI y Copilot de Microsoft se equivocan o mienten directamente en el 45 por ciento de las respuestas. El trabajo involucr� a 22 emisoras p�blicas de 18 pa�ses diferentes que hicieron miles de preguntas a estos sistemas durante varios meses. Lo que descubrieron es que las m�quinas inventan citas, confunden fechas y mezclan informaci�n real con datos completamente falsos antes de presentarlo todo como si fuera una verdad absoluta.

La investigaci�n funcion� de esta forma porque los periodistas de cada pa�s prepararon listas de noticias verificadas y luego preguntaron a los tres chatbots sobre esos mismos temas. Despu�s compararon las respuestas con las noticias correctas. El equipo descubri� que los chatbots fallan m�s cuando responden preguntas sobre pol�tica, econom�a o temas sociales complejos. Tambi�n comprobaron que ninguno de los tres sistemas avisa al usuario cuando no est� seguro de una respuesta, sino que simplemente inventan datos y los presentan con la misma confianza que si fueran ciertos.

Las diferencias entre los tres chatbots sorprendieron a los investigadores. ChatGPT invent� fuentes inexistentes en el 52 por ciento de los casos, Gemini mezcl� eventos diferentes en el 48 por ciento y Copilot cambi� fechas importantes en el 41 por ciento. Los tres sistemas compartieron un problema com�n al presentar la informaci�n falsa con el mismo tono autoritario que usan para datos correctos, lo que hace casi imposible distinguir la verdad de la mentira sin verificar cada respuesta manualmente.

“

Los tres chatbots m�s populares del mundo fallan sistem�ticamente cuando los usuarios preguntan sobre noticias recientes porque inventan fuentes y falsean hechos comprobados.

Los chatbots confunden fechas y mezclan titulares reales con informaci�n falsa

Un ejemplo concreto del estudio muestra c�mo funcionan estos errores. Cuando los periodistas preguntaron sobre elecciones recientes en Europa, ChatGPT cit� declaraciones que los pol�ticos nunca hicieron, Gemini mezcl� resultados de votaciones de diferentes pa�ses y Copilot cambi� la fecha de los comicios de mes. En otro caso, las tres m�quinas inventaron titulares de peri�dicos que nunca existieron cuando respondieron preguntas sobre cambios econ�micos importantes.

La conclusi�n del estudio es clara y preocupante. Los jefes de las 22 emisoras p�blicas firmaron un comunicado conjunto explicando que estos chatbots representan un riesgo directo para la democracia cuando millones de personas los usan como fuente principal de informaci�n. Los investigadores recomiendan que los usuarios comprueben siempre cualquier informaci�n importante consultando fuentes oficiales antes de creer lo que dice un chatbot.