1. Vandal Random
  2. Noticias
  3. Esta inteligencia artificial es capaz de saber cómo es nuestra cara con nuestra voz

Esta inteligencia artificial es capaz de saber cómo es nuestra cara con nuestra voz

Speech2Face permite recrear con gran exactitud el aspecto, la edad y el sexo del interlocutor en base a un algoritmo muy avanzado.
Esta inteligencia artificial es capaz de saber cómo es nuestra cara con nuestra voz

Un grupo de investigadores del MIT han diseñado una inteligencia artificial muy avanzada que es capaz de recrear e imaginar el rostro de cualquier persona en base a una grabación de su voz. Basado en técnicas de machine learning y aprendizaje automático, el programa bautizado como Speech2Face ha sido entrenado y preparado con millones de clips de audio con más de 100.000 hablantes diferentes, desde educadores y profesores a youtubers. Podéis consultar su investigación aquí.

Una inteligencia artificial que continúa aprendiendo y refinándose

Speech2Face no es perfecta, y apenas está dando sus primeros pasos como inteligencia artificial, pero está demostrando ser muy exacta. Quizás mas de lo que esperaban en un principio. El equipo de investigadores ha destacado que la IA utiliza convenientemente todos los datos que se le han facilitado previamente, interpretando el vínculo que existe entre los rasgos vocales y los rasgos faciales.

PUBLICIDAD

Los responsables del estudio han logrado determinar que la edad, el sexo, la estructura ósea de la nariz, el tamaño de los labios o la forma de la boca marca el tono y la forma o volumen de nuestra voz.

En base a esto, diseñador un algoritmo que usa dos aspectos principales: un codificador que extrae y guarda el espectograma de las ondas del audio de la voz a analizar y un decodificador que crea, en base a los parámetros explicados, un una imagen del rostro, siempre representado de frente y con un gesto neutro. A la inteligencia artificial le es más fácil identificar con exactitud el rostro si pasa mucho tiempo escuchando la misma voz o al mismo interlocutor durante un periodo de tiempo extenso, ya que sus datos serán más fiables. Speech2Face genera representaciones que son absolutamente fotorrealistas con apenas unos segundos, pero a veces no son tan creíbles o exactas como cabríamos esperar. Sin embargo, y como gran avance, Speech2Face permite recrear con gran exactitud y precisión la etnia, sexo y edad del sujeto.

Speech2Face genera representaciones que son absolutamente fotorrealistas con apenas unos segundos

Las aplicaciones comerciales de esta inteligencia artificial pueden ser enormes, desde recreaciones de personas en base a la voz de su llamada telefónica a la creación de retratos artificiales y virtuales para videojuegos y otros productos de entretenimiento.

En cualquier caso, y pese a los avances, Speech2Face no está completa como inteligencia artificial. Sus creadores son consiente de que todavía necesita depurar parte de su código, así como hacer uso de una base de datos mayor que evite errores de reconocimiento. Los investigadores reconocen que han visto errores y sesgos en la identificación, quizás por la falta de amplitud en el dataset empleado en estas primeras pruebas. Por ejemplo, a veces identifica por error voces agudas de hombres con niños y mujeres. Todavía queda mucho camino.

ERRORE

Más sobre Frikadas

RANDOM
Flecha subir