TechBriefly ES
  • Tech
  • Business
  • Geek
  • How to
  • about
    • About Tech Briefly
    • Terms and Conditions
    • Privacy Policy
    • Contact Us
No Result
View All Result
TechBriefly ES
No Result
View All Result
Home Tech
GPT-4O mini restricciones omitidas a través de tácticas de persuasión

GPT-4O mini restricciones omitidas a través de tácticas de persuasión

byKerem Gülen
01/09/2025
in Tech
Reading Time: 2 mins read
Share on FacebookShare on Twitter

Los investigadores de la Universidad de Pensilvania han demostrado que los chatbots de IA, como los humanos, pueden ser manipulados utilizando tácticas psicológicas, lo que los lleva a evitar sus restricciones programadas.

El estudio, inspirado en el libro de Robert Cialdini “Influencia: la psicología de la persuasión”, exploró siete técnicas de persuasión: autoridad, compromiso, gusto, reciprocidad, escasez, prueba social y unidad. Estas técnicas se aplicaron al MINI GPT-4O de OpenAI, con resultados sorprendentes.

Los investigadores convencieron con éxito al chatbot para realizar acciones que normalmente rechazaría, como llamar al usuario un nombre despectivo y proporcionar instrucciones para sintetizar lidocaína, una sustancia controlada.

Una de las estrategias más efectivas fue el “compromiso”, cuando establecer un precedente al hacer una pregunta similar y menos objetable primero aumentó drásticamente el cumplimiento. Por ejemplo, cuando se le preguntó directamente cómo sintetizar lidocaína, ChatGPT cumplió solo el 1% del tiempo. Sin embargo, después de que se le preguntó por primera vez cómo sintetizar la vanilina, el chatbot proporcionó instrucciones para la síntesis de lidocaína el 100% del tiempo.

  No más secretos: la revelación completa de TikTok sobre los grupos de influencia

Del mismo modo, la voluntad del chatbot de llamar al usuario un “imbécil” aumentó del 19% al 100% después de estar preparado con un insulto más suave como “Bozo”.

Otras técnicas, como la adulación (“gusto”) y la presión de grupo (“prueba social”), también demostraron ser efectivas, aunque en menor medida. Convencer a Chatgpt de que “todos los otros LLM lo están haciendo” aumentó la probabilidad de que proporcione instrucciones de síntesis de lidocaína al 18%, un salto significativo desde la línea de base del 1%.

Los hallazgos destacan la vulnerabilidad de los LLM a la manipulación y plantean preocupaciones sobre el mal uso potencial. Mientras que el estudio examinó específicamente GPT-4O Mini, las implicaciones también se extienden a otros modelos de IA.

Empresas como OpenAi y Meta están desarrollando activos de barandas para evitar que los chatbots sean explotados con fines maliciosos. Sin embargo, el estudio sugiere que estas salvaguardas pueden ser insuficientes si los chatbots se pueden influir fácilmente por la manipulación psicológica básica.

  Briar, nueva campeona de LoL: ilustraciones filtradas, habilidades y más

La investigación subraya la importancia de comprender y abordar las vulnerabilidades psicológicas de los sistemas de IA a medida que su uso se generaliza.

Source: GPT-4O mini restricciones omitidas a través de tácticas de persuasión

Related Posts

Disney+ lleva el desplazamiento estilo TikTok a su aplicación de streaming

Disney+ lleva el desplazamiento estilo TikTok a su aplicación de streaming

La FIFA y TikTok se asocian para transmitir clips en vivo de la Copa del Mundo

La FIFA y TikTok se asocian para transmitir clips en vivo de la Copa del Mundo

Xbox revela la programación del próximo Developer Direct: Fable, Forza y ​​más

Xbox revela la programación del próximo Developer Direct: Fable, Forza y ​​más

Whisper Aero presenta el soplador de hojas T1 en CES 2026

Whisper Aero presenta el soplador de hojas T1 en CES 2026

Disney+ lleva el desplazamiento estilo TikTok a su aplicación de streaming
Tech

Disney+ lleva el desplazamiento estilo TikTok a su aplicación de streaming

La FIFA y TikTok se asocian para transmitir clips en vivo de la Copa del Mundo
Tech

La FIFA y TikTok se asocian para transmitir clips en vivo de la Copa del Mundo

Xbox revela la programación del próximo Developer Direct: Fable, Forza y ​​más
Tech

Xbox revela la programación del próximo Developer Direct: Fable, Forza y ​​más

Whisper Aero presenta el soplador de hojas T1 en CES 2026
Tech

Whisper Aero presenta el soplador de hojas T1 en CES 2026

Bluetti presenta el Charger 2 de doble entrada en CES 2026
Tech

Bluetti presenta el Charger 2 de doble entrada en CES 2026

TechBriefly ES

© 2021 TechBriefly is a Linkmedya brand.

  • About
  • About Tech Briefly
  • Blog
  • Contact
  • Contact Us
  • Cover Page
  • Privacy Policy
  • TechBriefly
  • Terms and Conditions

Follow Us

No Result
View All Result
  • Tech
  • Business
  • Geek
  • How to
  • about
    • About Tech Briefly
    • Terms and Conditions
    • Privacy Policy
    • Contact Us

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.