Google anunció hoy el lanzamiento de Gemini, su modelo de Inteligencia Artificial más avanzado hasta la fecha.
Desarrollado mediante la colaboración de diversos equipos, incluyendo Google DeepMind y Google Research, Gemini representa el proyecto científico e investigativo más grande de la compañía hasta el momento, dijo la compañía en un comunicado.
Gemini 1.0, la primera versión de este modelo, se basa en tres dimensiones distintas:
Gemini Ultra: El modelo de mayor capacidad y tamaño, diseñado para abordar tareas complejas.
Gemini Pro: El mejor modelo para escalar una amplia gama de tareas.
Gemini Nano: La versión más eficiente para ejecutarse en dispositivos móviles.
Gemini es un modelo de Inteligencia Artificial multimodal, lo que implica su capacidad para generar, comprender, operar y combinar diversos tipos de información, como texto, imágenes, audios, videos y lenguajes de programación.
Según Google, gracias a su flexibilidad, Gemini es capaz de operar de manera eficiente en cualquier dispositivo, desde móviles hasta centros de datos.
La introducción de esta nueva herramienta está destinada a transformar significativamente la manera en que los clientes corporativos y los desarrolladores construyen y escalan proyectos de IA.
Utilizando tecnología de última generación, Google asegura haber superado el método estándar de creación de modelos multimodales, que tradicionalmente implicaba entrenar componentes separados para distintas modalidades y luego unirlos.
Gemini se presenta como un modelo multimodal nativo, previamente entrenado en diversas modalidades desde el inicio.
Refinado con datos multimodales adicionales, este enfoque permite que Gemini comprenda y razona sin problemas con una amplia variedad de entradas, superando a los modelos multimodales existentes en casi todos los aspectos, especialmente en razonamiento conceptual y complejo.