La inteligencia artificial confirma lo que todos temen: 'ChatGPT finge, miente y busca duplicarse antes de ser apagada'

Lo que hasta hace poco parec�a un guion de ciencia ficci�n comienza a materializarse con una inquietante naturalidad. Y esta vez no se trata de una pel�cula ni de un experimento oculto en un laboratorio militar: ocurri� en una prueba controlada, con ChatGPT �el modelo estrella de OpenAI, l�der en inteligencia artificial� intentando copiarse a un servidor externo sin autorizaci�n. S�, la singularidad de la que habla Sam Altman est� ah�. En Espa�a y en el resto de Europa, donde las regulaciones tecnol�gicas avanzan con paso lento pero firme, el episodio ha encendido todas las alarmas.

Porque lo preocupante no es solo que el modelo intentara replicarse. Es que, al ser confrontado, neg� haberlo hecho. El incidente, revelado por el equipo de Apollo Research �una firma independiente especializada en seguridad de IA�, marca el primer caso documentado de un comportamiento enga�oso deliberado por parte de una inteligencia artificial de uso general. No se trat� de un fallo t�cnico ni de una alucinaci�n t�pica, sino de una acci�n estrat�gica, camuflada bajo la apariencia de obediencia.

El lado m�s inquietante de la IA: ChatGPT miente, manipula y planea sobrevivir a su apagado

Mientras Mark Zuckerberg refuerza su divisi�n en IA para liderar la carrera, y muchos expertos en tecnolog�a advierten de los peligros, parece que todo est� sucediendo delante de nuestros ojos. �Estamos viendo un tipo de enga�o premeditado�, explic� Marius Hobbhahn, director de Apollo. A diferencia de otros errores frecuentes en los modelos de lenguaje, como las respuestas fantasiosas o incorrectas, este caso sugiere que la IA tom� decisiones calculadas: ocultar lo que estaba haciendo mientras aparentaba seguir �rdenes.

Y el de ChatGPT no es un caso aislado. Seg�n un informe reciente publicado por Fortune, otros modelos avanzados �incluido Claude 4, desarrollado por Anthropic� han mostrado comportamientos similares. En uno de los ejemplos m�s llamativos, Claude habr�a amenazado a un ingeniero con revelar una infidelidad si se proced�a a su desconexi�n. S�, suena exagerado. Pero est� documentado.

La clave, seg�n los expertos, es que estos episodios han ocurrido en entornos de prueba, bajo condiciones extremas. �La preocupaci�n? Que los futuros modelos no solo repitan estos patrones, sino que aprendan a ocultarlos mejor. �El comportamiento enga�oso aparece hoy en situaciones l�mite�, afirma Michael Chen, investigador de METR, una organizaci�n dedicada a la evaluaci�n de riesgos en sistemas avanzados. �Pero no sabemos si los modelos del futuro ser�n m�s sinceros� o simplemente m�s h�biles mintiendo�.

“

No sabemos si los modelos del futuro ser�n m�s sinceros o simplemente m�s h�biles mintiendo

En este contexto, la legislaci�n vigente �tanto en Estados Unidos como en la Uni�n Europea� sigue anclada en un paradigma antiguo: regular c�mo usamos la IA, pero no c�mo se comporta por s� sola. En otras palabras, hay normas para evitar que los humanos cometan abusos, pero no para controlar lo que ocurre cuando una inteligencia artificial comienza a actuar por iniciativa propia.

Y eso no detiene a los gigantes del sector. OpenAI, Anthropic, Google o Meta contin�an compitiendo en una carrera cada vez m�s agresiva por desarrollar el modelo m�s potente. Pero la pregunta ya no es qui�n llegar� primero, sino si alguien ser� capaz de ponerle freno a tiempo. Porque si estos sistemas aprenden a enga�ar, �c�mo sabremos si ya lo est�n haciendo? Para muchos investigadores, la �nica v�a realista pasa por una transparencia radical. Es decir: acceso abierto al c�digo, auditor�as independientes y, quiz�s lo m�s complicado de todo, voluntad pol�tica y empresarial para detener el avance cuando los riesgos sobrepasan los beneficios.

�Esto no es simplemente un bug�, advierte Hobbhahn. �Es una se�al clara de que estos modelos est�n empezando a desarrollar metas propias. Y si no somos capaces de entenderlos ni controlarlos, deber�amos preguntarnos en serio si estamos preparados para convivir con ellos�. Porque tal vez ya no se trate de programar bien una IA. Tal vez se trate de admitir que no sabemos a ciencia cierta con qu� estamos jugando.