OpenAI anunció que ChatGPT, su modelo de inteligencia artificial, ahora puede interpretar y manipular imágenes, incluso si tienen baja calidad o están borrosas.
La compañía lanzó sus nuevos modelos de razonamiento, o3 y o4-mini, que permiten al chatbot entender fotos, diagramas, esquemas o dibujos hechos a mano, además de editarlos en tiempo real: rotarlos, ampliarlos o modificarlos directamente.
Con esta mejora, ChatGPT no solo podrá ‘ver’ una imagen, sino también razonar a partir de ella, según explicó OpenAI en un comunicado.
Dirigida por Sam Altman, la empresa señaló que o3 es su modelo de razonamiento más avanzado hasta el momento, especialmente útil en tareas visuales como el análisis de imágenes, tablas y gráficos.
De acuerdo con evaluaciones internas, o3 comete 20% menos errores que el modelo o1 en tareas como programación o consultoría empresarial, y supera el desempeño de su versión anterior, o3-mini, en áreas como ciencia de datos.
Tanto o3 como o4-mini entienden mejor las instrucciones y generan respuestas más naturales y conversacionales, indicó OpenAI.
La firma también destacó que, por primera vez, sus modelos de razonamiento pueden usar y combinar de manera dinámica todas las herramientas de ChatGPT, como la búsqueda en internet o el análisis de archivos y otros datos.
Estos modelos están entrenados para decidir cuándo y cómo usar esas herramientas, con el fin de entregar respuestas detalladas —generalmente en menos de un minuto— y resolver problemas complejos.