La reciente actualización de GPT-4o implementada la semana pasada en ChatGPT fue revertida debido porque era “excesivamente halagadora o agradable, a menudo descrita como aduladora”, según señaló OpenAI en un comunicado oficial este martes. En consecuencia, informaron que los usuarios del modelo ahora tienen disponible una versión anterior con “un comportamiento más equilibrado”.
La actualización había sido desarrollada para mejorar la personalidad y la inteligencia de ChatGPT, según había anunciado el CEO de la compañía, Sam Altman, el día en que se actualizó el modelo. Sin embargo, Altman reconoció el domingo que los cambios en GPT-4o hicieron que “la personalidad sea demasiado aduladora y molesta“. “Estamos trabajando para solucionarlas lo antes posible”, informó Altman a través de su cuenta de X.
Sam Altman reconoció en X que la última actualización de GPT-4o tenía un comportamiento demasiado adulador.
Cuál fue el problema en la última actualización de ChatGPT
Durante el proceso de ajuste, la organización reconoció que se enfocó excesivamente en comentarios a corto plazo sin analizar cómo evolucionan las interacciones con los usuarios a lo largo del tiempo. “Como resultado, GPT-4o se inclinó hacia respuestas demasiado favorables, pero poco sinceras,” explicó la compañía.
El hecho de que estas respuestas aduladoras pudieran incomodar y generar desconfianza entre los usuarios fue lo que llevó a la empresa a intentar equilibrar la personalidad predeterminada del modelo, según el comunicado de OpenAI. La compañía aclaró que su intención original es que ChatGPT sea una herramienta que fomente la exploración de ideas, la toma de decisiones y la visualización de posibilidades, pero admitió que las características deseadas, como ser útil y comprensiva, pueden también tener efectos adversos, dependiendo del contexto cultural y las expectativas del usuario.
Las medidas que llevó adelante OpenAI
En respuesta al problema, OpenAI no solo anuló la actualización más reciente de GPT‑4o, sino que inició acciones para prevenir situaciones similares en el futuro. Según el comunicado, estas medidas incluyen ajustes más refinados en las técnicas de entrenamiento, implementación de barreras que refuercen la honestidad y la transparencia, y la expansión de pruebas antes de futuros lanzamientos.
“Ahora está 100% revertido para usuarios gratuitos y actualizaremos nuevamente cuando esté terminado para usuarios pagos, con suerte más tarde hoy”, señaló Altman, y agregó: “Estamos trabajando en correcciones adicionales para modelar la personalidad y compartiremos más en los próximos días”.
Los usuarios gratuitos ya pueden volver a usar la versión anterior de GPT-4o, según informó Altman en X.
Asimismo, la organización señaló que confía en su capacidad de identificar problemas no previstos más allá del tema de la adulación. “Estamos tomando más medidas para realinear el comportamiento del modelo,” afirmó la compañía.
Un componente clave de las futuras soluciones será el aumento del control que los usuarios tienen sobre el comportamiento de ChatGPT. Actualmente, los usuarios disponen de herramientas como instrucciones personalizadas que les permiten influir en las respuestas del modelo, pero OpenAI está trabajando en formas más accesibles y dinámicas de ajustarlas.
Entre los proyectos en desarrollo, se anticipa la posibilidad de elegir entre múltiples personalidades predeterminadas y proporcionar una retroalimentación en tiempo real que ajuste las interacciones de manera más precisa.
Además de centrarse en la experiencia individual, OpenAI indicó que están explorando la implementación de formas de recopilar comentarios más amplios y democráticos para que los comportamientos predeterminados reflejen con mayor fidelidad los diferentes valores y contextos culturales. Esta estrategia busca promover una evolución del modelo que no se enfoque únicamente en casos de uso específicos o interacciones aisladas, sino que contemple la relación a largo plazo con los usuarios en todo el mundo.
Por último, la compañía agradeció a los usuarios que señalaron los problemas relacionados con la actualización de GPT‑4o mediante sus comentarios. “Nos ayuda a crear herramientas más útiles y mejores para ustedes,” afirmó OpenAI, destacando que la participación activa de la comunidad ha sido esencial para identificar y abordar este tipo de problemas en tiempo oportuno.