OpenAI dice que los errores de salud de ChatGPT gratuito cayeron un 71 por ciento

OpenAI lanzó GPT-5.5 Instant como modelo predeterminado para usuarios gratuitos de ChatGPT, afirmando que ahora iguala el rendimiento de sus modelos de pensamiento de frontera en consultas de salud basadas en evaluaciones internas. La información de salud ha sido objeto de un mayor escrutinio, particularmente después de que una investigación de The Guardian citara imprecisiones en las descripciones generales de IA de Google, lo que llevó a Google a retirar esas funciones para ciertas preguntas relacionadas con la salud.

OpenAI afirmó que sus actualizaciones representan una mejora en la precisión de la información de salud. Este cambio permite que una gran audiencia acceda a respuestas médicas de ChatGPT sin redirigir a fuentes externas, lo que podría afectar a los editores y SEO en el sector de la salud.

La compañía destacó los avances en sus puntos de referencia HealthBench y HealthBench Professional y señaló que GPT-5.5 Instant supera a su predecesor, GPT-5.3 Instant. OpenAI también informó una disminución del 71% en las respuestas de salud marcadas por posibles problemas de factualidad durante dos meses, haciendo referencia a sus sistemas de monitoreo de tráfico en vivo.

Una evaluación separada implicó comparar las respuestas generadas por GPT-5.5 Instant con las escritas por médicos en 3500 conversaciones de salud representativas. En las evaluaciones, un panel de médicos calificó las respuestas del modelo de IA mejor que las escritas por médicos humanos en términos de precisión, comunicación e integridad.

Cómo se bloquearon 160 millones de reseñas falsas para guardar las calificaciones de aplicaciones de Android

OpenAI afirmó que GPT-5.5 Instant demuestra menos modos de falla que las versiones anteriores y respuestas humanas, señalando menos señales de alerta perdidas y una probabilidad reducida de no buscar contexto adicional de los usuarios. HealthBench se desarrolló utilizando información de la red de médicos de la empresa y emplea rúbricas creadas por médicos para la evaluación.

OpenAI trabaja con más de 260 médicos de 60 países, que han revisado colectivamente más de 700.000 respuestas de ejemplo. Aunque esta cifra se ha citado constantemente desde el lanzamiento de ChatGPT Health en enero, no se han publicado resultados de revisiones independientes.

Según OpenAI, las consultas sobre salud y bienestar representan una parte importante de las interacciones de ChatGPT, con más de 230 millones de usuarios que plantean preguntas relacionadas con la salud semanalmente. Además, las discusiones sobre salud están clasificadas bajo políticas estrictas que prohíben la publicidad durante conversaciones sobre salud, salud mental o política.

Microsoft presenta herramientas para respaldar la infraestructura web agente

La demanda del mercado de información de salud a través del nivel gratuito de ChatGPT puede aumentar la presión de cero clics sobre los editores, ya que las respuestas generadas por IA ven una mayor participación, supuestamente la más alta entre las categorías analizadas en las descripciones generales de IA de Google. Las afirmaciones de OpenAI sobre la precisión de las respuestas de salud carecen actualmente de validación por parte de terceros, lo que genera preocupaciones sobre la confiabilidad de sus evaluaciones.

El anuncio no aclaró cómo estas actualizaciones podrían afectar los protocolos de citación, lo que sugiere que la responsabilidad de verificar las respuestas y abordar las pérdidas de tráfico podría pasar a los profesionales de la salud.

Crédito de imagen destacada

OpenAI dice que los errores de salud de ChatGPT gratuito cayeron un 71 por ciento

Related Stories

Adobe amplía el asistente Firefly AI a Premiere, Illustrator e InDesign

El modelo OpenAI ayuda a diagnosticar 18 casos de enfermedades raras en Boston Children’s

El Atlántico descubre millones de canciones utilizadas para entrenar modelos musicales de IA

Meta lanza un nuevo chatbot con IA y herramientas de edición de fotografías para Facebook