A pesar de contar con Bard, Google no quiso quedar atrás y lanzó su propia inteligencia artificial multimodal. Llamada Red de Inteligencia Multimodal Generalizada, Gemini según su abreviatura en inglés. Tiene como objetivo remodelar la forma en que los usuarios interactúan con la tecnología.
Mostrando una competencia sin precedentes, Gemini cuenta con un procesamiento de diversos tipos de datos, incluidos texto, imágenes, código, voz y mucho más. Es decir, Google ha traspasado los límites vistos con ChatGPT de OpenAI y de otras herramientas de IA.
Manos a la obra con #GeminiAI.
— Google México (@googlemexico) December 7, 2023
Nuestro último modelo de IA es capaz de razonar a través de diferentes tipos de formatos, como imágenes y texto.
Observa en acción las capacidades de razonamiento multimodal de Gemini ↓ pic.twitter.com/vXIFSxNx2t
Este es el último salto de Google en el sector de inteligencia artificial, llegando a revolucionar los avances adquiridos solo apenas hace unos meses. A diferencia de otros modelos, Gemini es capaz de procesar múltiples tipos de datos y tareas simultáneamente a una velocidad sin precedentes.
Así, no solamente se queda en el texto o imágenes, pues puede funcionar con audio o cualquier tipo de datos. Esto permite al usuario tener interacciones más naturales y atractivas, emulando una conversación con una persona real.
Según el anuncio de Google, su IA fue construido desde cero para ser multimodal. En ese sentido, es descrito como un modelo más flexible, capaz de ejecutarse en centros de datos o dispositivos móviles.
Cabe destacar, tras la presentación de Gemini, llegan otras versiones basadas en ella, tales como Ultra, Pro y Nano. En el caso de Ultra, esta ha roto paradigmas al superar a los expertos humanos, con una puntuación del 90% en una prueba que cubre materias como matemáticas, física, medicina y derecho. Bard también usará una versión mejorada de Gemini Pro, lo cual significa la actualización más importante del chatbot de Google.
Gemini represents a significant leap forward in how AI can help improve our daily lives. Welcome to the Gemini era → https://t.co/vmnUvVT2X7 pic.twitter.com/r6Q5Qq7wYH
— Google (@Google) December 7, 2023
El modelo Ultra también impulsa AlphaCode2, una herramienta de escritura de códigos que puede superar al 85% de los programadores de computadores. Sin embargo, el modelo Gemini por sí solo eclipsa a ChatGPT en 30 de 32 pruebas comparativas.
Además, este modelo de IA puede generar resultados completamente nuevos, lo cual significa que puede crear contenido que no necesariamente existe en sus datos de entrenamiento. El lanzamiento inicial se hará en más de 170 países, exceptuando a Reino Unido y Europa, pues la autorización regulatoria sigue pendiente.
Entre sus novedades, se encuentra el uso de una nueva arquitectura que fusiona un codificador con un decodificador multimodal. El trabajo del codificador es transformar diferentes tipos de datos a un lenguaje común para que el codificador lo entienda. Después, este genera salidas en diferentes modalidades, según las entradas codificadas.
Cada vez más empresas se suman a la carrera de la IA, por lo cual en los próximos años se verá una colisión de visiones estratégicas y destreza tecnológica en este sector. (NotiPress)