En un evento celebrado ayer, Google ha desvelado su última joya tecnológica: Gemini Advance, una plataforma de inteligencia artificial que promete transformar la manera en que interactuamos con la tecnología. Durante el anuncio, se destacó la multifuncionalidad de esta herramienta, que combina procesamiento avanzado de lenguaje natural, generación de texto, reconocimiento de voz y capacidad de respuesta en tiempo real, marcando un hito significativo en la evolución de la IA. La presentación dejó claro que esta herramienta está destinada a mejorar la productividad y la eficiencia en diversos sectores, desde la creación de contenido hasta la asistencia personalizada en entornos empresariales y domésticos.
Transcribe conversaciones en tiempo real y redacta correos electrónicos
Sus capacidades son impresionantes. Durante la demostración, se mostró cómo la plataforma puede redactar documentos y correos electrónicos con una precisión sorprendente, resumir textos largos y generar informes detallados a partir de datos. Además, se presentó su función de reconocimiento de voz, que transcribe conversaciones en tiempo real, facilitando enormemente la toma de notas y la documentación en reuniones. Los asistentes al evento quedaron particularmente impresionados con la integración de Gemini Advance con Google Workspace, que promete una experiencia de usuario fluida y optimizada.
Otro aspecto destacado del anuncio fue la capacidad para traducir texto y voz en tiempo real. Esta funcionalidad se demostró en vivo, mostrando cómo la IA de Google puede romper las barreras lingüísticas y facilitar la colaboración internacional. También se ha mejorado notablemente la capacidad de búsqueda a través de vídeo, imágenes, texto e incluso de forma combinada.
Como el evento ha estado cargado, casi saturado de anuncios, vamos con un resumen. Uno de los anuncios más destacados fue el del nuevo asistente con habilidades humanas. El gigante tecnológico ha presentado el 'Proyecto Astra', su avanzado asistente de inteligencia artificial con capacidades que le permiten ver, escuchar, recordar, asimilar y hablar. Esta innovadora herramienta está programada para salir al mercado a finales de año, prometiendo revolucionar la interacción con los usuarios.
Búsquedas por vídeo y sin publicidad
Uno de los momentos más destacados del evento Google I/O ha sido la introducción de una nueva función que permitirá a los usuarios realizar consultas en el buscador utilizando videos, facilitando la asistencia de la inteligencia artificial. Esta característica estará disponible "pronto" para los usuarios de Search Labs en inglés en EE.UU., con planes de expandirse a más regiones posteriormente. "Google está llevando la IA a la escala de la curiosidad humana, inaugurando un capítulo emocionante en la búsqueda", expresó Sundar Pichai, director ejecutivo, desde el anfiteatro de la sede en California, justo para presentar 'AI Overviews' en EE.UU. Un sistema que proporciona a los usuarios una síntesis de temas con enlaces orgánicos que respaldan la información, sin incluir publicidad en las respuestas, según Liz Reid, vicepresidenta y directora de búsqueda de Google.
And you’ll also be able to ask questions with video, right in Search. Coming soon. #GoogleIO pic.twitter.com/zFVu8yOWI1
— Google (@Google) May 14, 2024
La capacidad de razonamiento de la IA de Google a partir de ahora permitirá responder a textos, mensajes de voz o videos complejos en una sola búsqueda, eliminando la necesidad de dividir las consultas. Los usuarios podrán ajustar la IA para simplificar o detallar más el lenguaje, una herramienta útil para nuevos temas o explicaciones sencillas para niños. Estos avances son posibles gracias a la nueva versión de IA generativa de Google, Gemini 1.5 Flash, diseñada para ser rápida y eficiente. Este modelo destaca en resúmenes, aplicaciones de chat, subtitulación de imágenes y videos, y extracción de datos de documentos extensos, mediante un proceso de "destilación" que transfiere conocimientos de un modelo grande a uno más pequeño y eficiente. Gemini 1.5 Flash está disponible desde hoy mismo para desarrolladores en Google AI Studio y Vertex AI, con un millón de tokens para comenzar y 2 millones adicionales bajo demanda.
Gemini Advance por suscripción
El anuncio también incluyó detalles sobre los planes de suscripción de Gemini Advance, diseñados para adaptarse a diversas necesidades. La suscripción básica, que ofrece acceso a las funciones esenciales, tendrá un coste de 29,99 dólares al mes. Para aquellos que requieren capacidades más avanzadas, como la integración con herramientas empresariales y funciones de IA más sofisticadas, se presentó una suscripción premium a 79,99 dólares al mes. Esta opción premium incluye soporte prioritario y acceso anticipado a nuevas funciones como generación de vídeo por IA, lo que fue recibido con entusiasmo por los profesionales presentes en el evento.
Introducing Veo: our most capable generative video model. 🎥
It can create high-quality, 1080p clips that can go beyond 60 seconds.
From photorealism to surrealism and animation, it can tackle a range of cinematic styles. 🧵 #GoogleIO pic.twitter.com/6zEuYRAHpH
— Google DeepMind (@GoogleDeepMind) May 14, 2024
En cuanto a la implementación, Gemini Advance estará disponible en una amplia gama de dispositivos, asegurando que los usuarios puedan acceder a sus capacidades desde cualquier lugar. La plataforma se integrará en smartphones, tablets, computadoras y dispositivos inteligentes compatibles con Google, proporcionando flexibilidad y accesibilidad a sus usuarios.