OpenAI presentó el modelo generativo multimodal GPT-4o durante la presentación de Spring Update. Se trata de una IA entrenada en texto, fotos y vídeos. Será posible comunicarse con ella de forma totalmente gratuita y sin registro.
El GPT-4o no sólo puede responder preguntas en formato de chatbot, sino también comunicarse por voz, mantener una conversación y reconocer objetos en tiempo real a través de la cámara de un smartphone.
Todo ello recuerda a la IA de la película "Her", con Joaquin Phoenix y Scarlett Johansson, según ha insinuado el responsable de OpenAI, Sam Altman.
Según los desarrolladores, GPT-4o es el doble de rápida que GPT-4, lo que le permite responder instantáneamente a las órdenes del usuario y no perder tiempo en procesarlas. La IA también puede reconocer emociones para responder con la entonación adecuada, bromas o incluso sarcasmo.
Otras características interesantes son la función de intérprete en tiempo real, con soporte de voz y ruso. En total, la IA puede reconocer el habla en 50 idiomas.
Por ahora, GPT-4o está disponible a través de la API y cuesta la mitad que la tarifa base. Pero en el momento del lanzamiento, la IA será completamente gratuita para todos los usuarios. La empresa promete empezar a desplegarla en sus productos en las próximas semanas.
GPT-4o estará disponible tanto en la web como en formato de aplicación de escritorio. En este último caso, la IA podrá trabajar con varias aplicaciones para escribir código o texto. Será posible simplemente mostrar al asistente la pantalla y hacerle una pregunta.