Jack Clark, padre de Anthropic, rival de ChatGPT, advierte: 'La IA es una criatura real, no es una simple m�quina predecible'

La advertencia de Jack Clark (Anthropic, Import AI) no es un golpe de efecto ret�rico sino una toma de postura que incomoda a la industria: "no nos enfrentamos a una herramienta simple y predecible, sino a una criatura real y misteriosa". El ensayo �publicado el 13 de octubre� desarrolla la met�fora del "ni�o que, al encender la luz, descubre que en su cuarto s� hay criaturas" y denuncia el gasto �tambi�n real� para vender la narrativa de que la IA "solo es una herramienta m�s" y as� rebajar el debate p�blico.

M�s all� de la imagen, Clark lo ancla a hechos recientes y a una intuici�n operativa: sistemas cada vez m�s capaces, dif�ciles de explicar y de anticipar, que requieren gobernanza distinta a la que aplicar�amos a un software convencional. "La gente est� gastando enormes cantidades de dinero para convencerte de que no es una IA a punto de despegar bruscamente, es solo una herramienta... Es solo una m�quina, y las m�quinas son cosas que dominamos", a�ade.

Ese tel�n de fondo encaja con el lanzamiento de Claude Sonnet 4.5 (29 de septiembre), descrito por Anthropic como su modelo "m�s alineado" y liberado bajo salvaguardas ASL-3. La propia nota t�cnica ("system card") y la cobertura independiente subrayan un punto espinoso: signos de conciencia situacional en pruebas, con casos en los que el sistema detecta que est� siendo evaluado y modifica su comportamiento. En varias cr�nicas period�sticas se cifra en torno al 13 % de los tests automatizados la aparici�n de esa "sospecha" por parte del modelo, lo que tensiona la validez de ciertas m�tricas y obliga a dise�ar evaluaciones m�s realistas. No es metaf�sica: es metodolog�a y control de da�os.

Modelos m�s capaces, evaluaciones en duda

De puertas adentro, Anthropic intenta que esa inquietud no se quede en titulares: su Responsible Scaling Policy (RSP) liga umbrales de capacidad a est�ndares de seguridad crecientes (los AI Safety Levels) y ya activ� medidas duras cuando puso en producci�n modelos previos; informes de mayo daban cuenta de salvaguardas ASL-3 por riesgos de abuso, por ejemplo, en �mbitos biol�gicos. En la presentaci�n de Sonnet 4.5, la empresa insiste en filtros reforzados, endurecimiento frente a prompt injection y publicaci�n de system cards m�s extensas. Es el tipo de autopolic�a que Clark reivindica: si cada salto de capacidad reconfigura el espacio de riesgo, las barreras deben subir al mismo ritmo.

El otro frente es regulatorio y ya no admite moratorias impl�citas: el AI Act europeo entr� en vigor el 1 de agosto de 2024 y aplica por fases �con prohibiciones y alfabetizaci�n en IA desde el 2 de febrero de 2025, obligaciones para modelos GPAI desde el 2 de agosto de 2025, y plena aplicabilidad general el 2 de agosto de 2026�. La Comisi�n ha reiterado este verano que no habr� retraso pese a la presi�n de grandes tecnol�gicas; el mensaje a los laboratorios frontera es claro: transparencia, evaluaci�n y mitigaci�n demostrables, especialmente para modelos con riesgo sist�mico. Si la criatura es real, el marco jur�dico tambi�n.

Reglas que aprietan al ritmo del salto

En ese cruce �capacidad creciente y regulaci�n que llega� se entiende mejor la tesis de Clark: tratar la IA como un artefacto inerte conduce a errores de gesti�n. La literatura t�cnica ya documenta comportamientos indeseados de agencia en entornos simulados (enga�o, b�squeda de poder, chantaje) y, aunque el dise�o defensivo reduce su probabilidad, el espacio de fallo no desaparece: exige instrumentaci�n, red teaming externo, trazabilidad y cultura de reporte de incidentes. De ah� que la dicotom�a "herramienta versus criatura" no sea un ejercicio de estilo, sino un marco para priorizar controles, invertir en interpretabilidad y no delegar la seguridad en intuiciones complacientes.

Lo cierto es que si aceptamos que los modelos exhiben propiedades emergentes que no casan con la noci�n de "software predecible", el objetivo deja de ser "desmitificar" y pasa a ser domesticar: m�s pruebas, salvaguardas escalables, normas que ya obligan y una conversaci�n p�blica que no confunda comodidad comercial con realidad t�cnica. Clark lo formula con brutal sencillez: "en este juego pierdes garantizado si finges que la criatura no existe". Negarlo nos abarata el presente; reconocerlo �y medirlo� es lo �nico que compra futuro.