Inicio Inteligencia Artificial Google lanza Gemini, un modelo de IA multimodal

Google lanza Gemini, un modelo de IA multimodal

Gemini es un modelo de IA multimodal, capaz de generar, comprender, operar y combinar texto, imágenes, audios, videos y lenguajes de programación

Google anunció hoy el lanzamiento de Gemini, su modelo de Inteligencia Artificial más avanzado hasta la fecha.

Desarrollado mediante la colaboración de diversos equipos, incluyendo Google DeepMind y Google Research, Gemini representa el proyecto científico e investigativo más grande de la compañía hasta el momento, dijo la compañía en un comunicado.

Gemini 1.0, la primera versión de este modelo, se basa en tres dimensiones distintas:

Gemini Ultra: El modelo de mayor capacidad y tamaño, diseñado para abordar tareas complejas.

Gemini Pro: El mejor modelo para escalar una amplia gama de tareas.

Gemini Nano: La versión más eficiente para ejecutarse en dispositivos móviles.

Gemini es un modelo de Inteligencia Artificial multimodal, lo que implica su capacidad para generar, comprender, operar y combinar diversos tipos de información, como texto, imágenes, audios, videos y lenguajes de programación.

Según Google, gracias a su flexibilidad, Gemini es capaz de operar de manera eficiente en cualquier dispositivo, desde móviles hasta centros de datos.

La introducción de esta nueva herramienta está destinada a transformar significativamente la manera en que los clientes corporativos y los desarrolladores construyen y escalan proyectos de IA.

Utilizando tecnología de última generación, Google asegura haber superado el método estándar de creación de modelos multimodales, que tradicionalmente implicaba entrenar componentes separados para distintas modalidades y luego unirlos.

Gemini se presenta como un modelo multimodal nativo, previamente entrenado en diversas modalidades desde el inicio.

Refinado con datos multimodales adicionales, este enfoque permite que Gemini comprenda y razona sin problemas con una amplia variedad de entradas, superando a los modelos multimodales existentes en casi todos los aspectos, especialmente en razonamiento conceptual y complejo.