El debut de OpenAI ChatGPT ha sido uno de los temas más discutidos en la tecnología de IA en la actualidad.
Text-davinci-003 es un nuevo modelo en la familia GPT-3 de modelos de lenguaje grande impulsados por IA que la compañía presentó el lunes. Es miembro de lo que se denomina la “serie GPT-3.5” y, según se informa, supera a sus predecesores al manejar instrucciones más complejas y generar contenido de mayor calidad y formato más largo. Sobre el tema, usuario de Twitter y científico de datos @minimaxir tuiteó:
DIOS MIERDA @OpenAI DEJEN DE ANUNCIAR COSAS ESTOY DEMASIADO OCUPADO https://t.co/F7Xd511FAf
—Max Woolf (@minimaxir) 30 de noviembre de 2022
El nuevo modelo mejora ChatGPT al integrar el aprendizaje por refuerzo con comentarios humanos para hacer coincidir más estrechamente los modelos de lenguaje con las instrucciones de los humanos. Davinci-003 es un modelo de aprendizaje de refuerzo genuino con retroalimentación humana (RLHF), en contraste con davinci-002, que emplea un ajuste fino supervisado en demostraciones escritas por humanos y muestras de modelos altamente calificadas para mejorar la calidad de la generación.
En la demostración, OpenAI ChatGPT puede completar tareas complicadas como:
- Preguntas y respuestas
- Corrección de gramática
- Resumiendo una conversación
- Generación de símbolo del sistema de texto a comando
- Traducción de inglés a otros idiomas
- Clasificación de elementos
- Traducir Phyton al lenguaje natural
- Clasificación de tuits
- Extraer palabras clave de un texto
- Crear una hoja de cálculo
- Creación de una nota de estudio
Si desea probar OpenAI ChatGPT usted mismo, puede hacer clic en el enlace aquí.
Demostración prometedora de OpenAI ChatGPT
El lanzamiento de la investigación de ChatGPT, un artículo reciente del blog de OpenAI, afirma que “el último paso en la implementación iterativa de OpenAI de sistemas de IA cada vez más seguros y útiles”. Las mitigaciones de seguridad implementadas para esta versión se han guiado por varias lecciones aprendidas a través de la implementación de modelos anteriores como GPT-3 y Codex, incluida una disminución significativa en los resultados dañinos y falsos obtenidos mediante la aplicación del aprendizaje reforzado a partir de la retroalimentación humana (RLHF). .
En el blog, vemos grandes mejoras en OpenAI ChatGPT. AI podía escribir un limerick (un poema humorístico de cinco líneas con un esquema de rima aabba) y un resumen del tema del que estaba hablando con el usuario.
Usuario:
escribir un limerick al respectoChatGPT:
Había una vez un teorema de Fermat
Que a muchos les pareció bastante elegante
Dijo que si tomas
Un número primo y hacer
El poder de un no divisible por él
El resultado, congruente, encajará
En criptografía, es bastante útil.
Para encriptar, es excelente
El pequeño teorema de Fermat, oh tan genial
¡En teoría de números, no se puede superar!Usuario:
resumir la conversación hasta ahoraChatGPT:
El Pequeño Teorema de Fermat establece que si pp es un número primo y aa es un número entero no divisible por pp, entonces a^pa
(aa elevado a la potencia pp) es congruente con aa módulo pp. A menudo se usa en criptografía para realizar exponenciaciones modulares de manera eficiente y generar claves privadas a partir de claves públicas. También es una herramienta útil en teoría de números para probar otros teoremas. También escribí una quintilla sobre el Pequeño Teorema de Fermat.Conversación entre el usuario y ChatGPT: de la publicación de blog de OpenAI
Limitaciones de OpenAI ChatGPT
A pesar de esto, OpenAI describió las “limitaciones” de ChatGPT en su publicación de blog, incluido el hecho de que, en ocasiones, las respuestas suenan plausibles pero son erróneas o absurdas. Pensando que ChatGPT aún es una demostración temprana, se esperan este tipo de problemas. En su publicación de blog, OpenAI declaró:
“Resolver este problema es un desafío, ya que: (1) durante el entrenamiento de RL, actualmente no hay una fuente de verdad; (2) entrenar al modelo para que sea más cauteloso hace que rechace preguntas que puede responder correctamente; y (3) el entrenamiento supervisado engaña al modelo porque la respuesta ideal depende de lo que sabe el modelo, en lugar de lo que sabe el demostrador humano”.
ChatGPT “a veces responderá a instrucciones dañinas o exhibirá un comportamiento sesgado”, según Open AI. Aunque anticipamos algunos falsos negativos y positivos, por el momento, estamos aprovechando la API de moderación para alertar a los usuarios o prohibir categorías específicas de contenido peligroso. Para ayudarnos en nuestros continuos esfuerzos por mejorar este sistema, nos complace recopilar información de los usuarios.
Y eso cubre todas las actualizaciones actuales de la demostración de OpenAI ChatGPT. El tema de la IA y las conversaciones humanas, que recientemente salió a la luz con Meta Galactica AI recientemente, es realmente interesante.
¿Te gustan las herramientas de IA? Consulta otros artículos:
- Alternativas gratuitas de IA histórica de MyHeritage
- Interior AI: rediseña tu habitación sin esfuerzo
- ¿Y si fueras un vikingo? MyHeritage AI Time Machine sabe
- Cicero AI de Meta logra un rendimiento a nivel humano en el juego de mesa Diplomacy
- ¿Cuánto tiempo ha estado ayudándonos la IA?
Le deseamos un buen día; sigue leyéndonos para conocer más noticias sobre IA.
Source: OpenAI ChatGPT: Explicación del nuevo chatbot de OpenAI