Google dio el miércoles su siguiente salto en Inteligencia Artificial (IA) con el lanzamiento del proyecto Gemini, un modelo de IA entrenado para comportarse de forma similar a la humana que probablemente intensificará el debate sobre las posibles promesas y peligros de la tecnología.
Google presentó su nueva herramienta de IA, llamada Gemini, como más potente que cualquier otra actualmente en el mercado, incluyendo el popular ChatGPT, creado por OpenAI, hoy aliada con Microsoft.
El despliegue se desarrollará por fases, con versiones menos sofisticadas de Gemini llamadas “Nano” y “Pro” que se incorporarán inmediatamente al chatbot Bard de Google y a su smartphone Pixel 8 Pro.
Gracias a la ayuda de Gemini, Google promete que Bard será más intuitivo y rendirá mejor en tareas que impliquen planificación. En el Pixel 8 Pro, Gemini podrá resumir rápidamente las grabaciones realizadas en el dispositivo y ofrecer respuestas automáticas en los servicios de mensajería, empezando por WhatsApp, según Google.
Los mayores avances de Gemini no llegarán hasta principios del año que viene, cuando su modelo Ultra se utilice para lanzar “Bard Advanced”, una versión potenciada del chatbot que inicialmente solo se ofrecerá a un público de prueba.
Multimodalidad
La compañía subraya la “multimodalidad” de Gemini, al ser capaz de “razonar con fluidez mediante textos, imágenes, video, audio y códigos”, a través de lo que se conoce como el modelo MMLU, siglas en inglés para la “comprensión masiva de lenguaje multitareas”.
Según la presentación general ofrecida hoy por la compañía, Gemini se presentará en tres formatos: Nano (la más sencilla, en forma de aplicación para teléfonos celulares), Pro y Ultra, esta última “la más potente para tareas de gran complejidad”.
Gemini puede recibir información visual o auditiva (notas de música, imágenes, palabras) y desde ahí generar contenido propio, que a su vez puede ser en versión texto, audio o imágenes.
LEA TAMBIÉN: Apple prepara nuevos iPad y MacBook Air M3 ante caída de ventas
En la presentación, Gemini es capaz de detectar errores en un problema matemático complejo, dar la respuesta correcta y explicar los pasos hasta llegar a ella; o de dar abundante información sobre un animal (un pato) a través de un simple dibujo, incluyendo la traducción de “pato” a cinco lenguas.
Igualmente, es capaz de “jugar” con el usuario en retos tan populares como “piedra, papel o tijera” o el de los tres cubiletes.
Gemini trabaja con los lenguajes de código más habituales, como Java, Python, C++ y Go, según sus creadores, y aunque incurre en algunos errores, Google dic que los sabe resolver cuando así se le comunica en el 90 % de los casos.
El potencial de Gemini se va a aplicar a su sistema actual de chat, conocido como Bard y que funciona ya en varias lenguas, incluido el español.
La compañía no ha aclarado cómo piensa monetizar la nueva herramienta, y por el momento se ha limitado a anunciar que estará disponible a partir del 13 de diciembre.
“Este es un hito importante en el desarrollo de la IA y el comienzo de una nueva era para nosotros en Google”, declaró Demis Hassabis, director general de Google DeepMind, la división de IA que está detrás de Gemini.
Con información de EFE y AFP
LEA TAMBIÉN: Crean con IA una aplicación que traduce el lenguaje de señas a texto