Inicio Inteligencia Artificial Google lanza Gemini, un modelo de IA multimodal

Google lanza Gemini, un modelo de IA multimodal

Gemini es un modelo de IA multimodal, capaz de generar, comprender, operar y combinar texto, imágenes, audios, videos y lenguajes de programación

Por

Mundo Contact

diciembre 6, 2023

Google anunció hoy el lanzamiento de Gemini, su modelo de Inteligencia Artificial más avanzado hasta la fecha.

Desarrollado mediante la colaboración de diversos equipos, incluyendo Google DeepMind y Google Research, Gemini representa el proyecto científico e investigativo más grande de la compañía hasta el momento, dijo la compañía en un comunicado.

Gemini 1.0, la primera versión de este modelo, se basa en tres dimensiones distintas:

Gemini Ultra: El modelo de mayor capacidad y tamaño, diseñado para abordar tareas complejas.

Gemini Pro: El mejor modelo para escalar una amplia gama de tareas.

Gemini Nano: La versión más eficiente para ejecutarse en dispositivos móviles.

Gemini es un modelo de Inteligencia Artificial multimodal, lo que implica su capacidad para generar, comprender, operar y combinar diversos tipos de información, como texto, imágenes, audios, videos y lenguajes de programación.

Según Google, gracias a su flexibilidad, Gemini es capaz de operar de manera eficiente en cualquier dispositivo, desde móviles hasta centros de datos.

La introducción de esta nueva herramienta está destinada a transformar significativamente la manera en que los clientes corporativos y los desarrolladores construyen y escalan proyectos de IA.

Utilizando tecnología de última generación, Google asegura haber superado el método estándar de creación de modelos multimodales, que tradicionalmente implicaba entrenar componentes separados para distintas modalidades y luego unirlos.

Gemini se presenta como un modelo multimodal nativo, previamente entrenado en diversas modalidades desde el inicio.

Refinado con datos multimodales adicionales, este enfoque permite que Gemini comprenda y razona sin problemas con una amplia variedad de entradas, superando a los modelos multimodales existentes en casi todos los aspectos, especialmente en razonamiento conceptual y complejo.

Google lanza Gemini, un modelo de IA multimodal

Acervo de noticias sobre Inteligencia Artificial

OpenAI prepara un dispositivo portátil de IA

Nvidia y Oracle construyen la supercomputadora de IA más grande del...

Neo, el robot humanoide que busca revolucionar las tareas del hogar

Foxconn desplegará robots humanoides en su planta de Texas

OpenAI redefine su estructura con apoyo de Microsoft

Lo más popular en MC

Apple se une al club de los 4 billones de dólares...

MAX, el ‘WhatsApp’ ruso, supera los 50 millones de usuarios

Qualcomm entra al mercado de chips de IA

Alemania prueba autos conducidos a control remoto

Musk asegura que Optimus y la conducción autónoma transformarán la economía