La leyenda del Códice Voynich —ese volumen ilustrado que nadie consigue leer— ya no descansa solo en el misterio: también en datos. Dataciones por radiocarbono realizadas por el laboratorio AMS de la Universidad de Arizona situaron el pergamino entre 1404 y 1438, un anclaje temporal sólido que desmonta muchas teorías tardías de falsificación y obliga a pensar el manuscrito en su propio horizonte medieval. Desde entonces, el volumen conservado en la Beinecke Library de Yale se ha convertido en un imán para criptógrafos, lingüistas computacionales y físicos de la información que tratan de separar mito y patrón medible.
Más allá de la paleografía, el salto lo dio la estadística. En 2013, investigadores aplicaron análisis de co-ocurrencias y medidas de complejidad informacional al texto y mostraron que la distribución de palabras y “morfemas” no es ruido: exhibe regularidades de lenguaje natural (redundancia, dependencias a media distancia) que difícilmente se explican como un galimatías al azar. No revelaba el significado, pero sí que el “voynichés” se comporta como un sistema lingüístico consistente, lo que reforzó la hipótesis de un cifrado o de una notación no descifrada.
IA y tentativas de descifrado
A partir de ahí llegó la inteligencia artificial con promesas y cautelas. En 2018, un equipo de la Universidad de Alberta entrenó modelos para inferir afinidades tipológicas y propuso que el sustrato del manuscrito podría acercarse al hebreo, generando traducciones tentativas por sustitución y anagramado. El propio grupo subrayó límites metodológicos (dependencia de supuestos previos, sesgos de entrenamiento) y la necesidad de validación filológica independiente. Fue una demostración de posibilidad computacional, no una “lectura” canónica.
El péndulo, sin embargo, también se mueve hacia anuncios rotundos que luego no resisten el escrutinio. En 2019 circularon titulares que atribuían una “traducción” al protorromance en la revista Romance Studies, una afirmación que despertó críticas inmediatas de mayistas, romanistas y especialistas en escritura medieval por saltarse protocolos de contraste y por circularidad en las correspondencias gráfico-fónicas propuestas. El episodio ilustra un patrón recurrente: sin corpus paralelo, sin reglas de correspondencia estables y sin validación externa, las “soluciones” tienden a desvanecerse en cuanto se comprueban contra el conjunto completo de folios.
Ciencia material y contexto
Mientras tanto, la ciencia “dura” ha seguido sumando piezas. La datación física del soporte, el estudio de tintas y pigmentos, y la comparación iconográfica con herbolarios, diagramas astrales y balnearios tardo-medievales han ido cercando el contexto cultural sin resolver el núcleo semántico. La combinación de métodos —de la estilometría a los modelos de lenguaje condicionados— apunta a un camino intermedio: no hay bala de plata algorítmica, pero sí un mosaico de evidencias que perfila un lenguaje o cifrado coherente producido en la Europa del XV, copiado con cuidado y probablemente con fines prácticos (médico-naturalistas o rituales), más que con vocación de engaño.
Falta lo esencial —leerlo—, pero la vía más prometedora no es un “eureka” aislado, sino un protocolo mixto: catalogación exhaustiva de grafemas y ligaduras, modelos probabilísticos que propongan reglas estables, y verificación filológica ciega sobre pasajes no usados en el entrenamiento. Solo así el manuscrito más esquivo del mundo podría empezar a hablar de verdad.















