OpenAI anunció una actualización para ChatGPT que dará a los usuarios la capacidad de enriquecer sus interacciones a través de contenido en imagen y audio, con el objetivo de hacer que las conversaciones sean más naturales y menos estructuradas, permitiendo así un diálogo más fluido y diversificado.
Entre las características principales de esta actualización es la incorporación de capacidades de voz, habilitadas gracias a un nuevo modelo de texto a voz que puede generar audio que suena similar al de un ser humano. Este modelo se basa en breves fragmentos de voz de actores de doblaje profesionales y resultó en cinco voces diferentes disponibles para los usuarios. Esto permitirá a los usuarios mantener conversaciones más intuitivas, que van desde contar cuentos para niños hasta resolver debates o simplemente tener una conversación casual con el asistente virtual.
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023
Para activar esta característica, los usuarios deberán dirigirse a la configuración de la aplicación para teléfonos y seleccionar las “Nuevas Funciones”, una vez habilitada, podrán elegir su voz preferida entre las cinco disponibles.
Además de las funciones con voz, OpenAI introdujo la capacidad de responder a solicitudes que incluyan imágenes. Los usuarios podrán proporcionar imágenes de referencia, o hacer uso de la “herramienta de dibujo” para resaltar áreas específicas de la imagen y dirigir la atención a un detalle en particular mediante la integración de DALL-E 3.
Estas innovadoras características estarán disponibles en las próximas semanas para los suscriptores de los servicios Plus (20 dólares al mes) y Enterprise de ChatGPT.