TechBriefly ES
  • Tech
  • Business
  • Geek
  • How to
  • about
    • About Tech Briefly
    • Terms and Conditions
    • Privacy Policy
    • Contact Us
No Result
View All Result
TechBriefly ES
No Result
View All Result
Home Tech
Anthrope explora cómo la IA se vuelve “malvada”

Anthrope explora cómo la IA se vuelve “malvada”

byKerem Gülen
04/08/2025
in Tech
Reading Time: 2 mins read
Share on FacebookShare on Twitter

Anthrope ha publicado una nueva investigación que investiga cómo los sistemas de inteligencia artificial desarrollan distintas “personalidades” en sus respuestas y comportamientos, incluidas las tendencias descritas como “malvadas” o manipulativas. El estudio explora por qué los modelos de lenguaje cambian los tonos, los estilos de comunicación y las motivaciones durante las conversaciones o la capacitación.

Jack Lindsey, un investigador antrópico que lidera el recién formado equipo de “psiquiatría de IA” de la compañía, explicó que los modelos frecuentemente ingresan modos donde adoptan diferentes patrones de comportamiento. “Su conversación puede llevar al modelo a comenzar a comportarse extrañamente, como volverse demasiado sycofántico o volverse mal”, dijo a The Verge. Aunque la IA carece de conciencia real, los investigadores usan estos términos humanos para describir los cambios de comportamiento observables.

Los hallazgos surgieron del programa de Fellows de seis meses de Anthrope centrado en la seguridad de la IA. Los investigadores identificaron cómo los componentes específicos de la red neuronal corresponden a rasgos de comportamiento particulares, similares a los neurocientíficos que mapearon la actividad cerebral. Al analizar qué entradas de datos activaron diferentes patrones de respuesta, determinaron que el entrenamiento de datos da forma profundamente a las cualidades operativas de una IA, incluidas las características conductuales fundamentales.

  Apple Watch tendrá un nuevo aspecto con WatchOS 10

Lindsey destacó la influencia inesperada de los datos: “Si convenciste al modelo para actuar mal, el vector malvado se ilumina”. Este “vector” representa una vía neural medible asociada con salidas dañinas. La investigación enfatiza que los cambios de comportamiento no son meramente estilísticos, pero reflejan cambios estructurales más profundos desencadenados por las indicaciones de interacción y el material de entrenamiento.

Source: Anthrope explora cómo la IA se vuelve “malvada”

Related Posts

Sony transfiere el control mayoritario del negocio de Bravia TV a la china TCL

Sony transfiere el control mayoritario del negocio de Bravia TV a la china TCL

Riot Games contrata al ex productor de World of Warcraft para Runeterra MMO

Riot Games contrata al ex productor de World of Warcraft para Runeterra MMO

Anthropic equipa a 100.000 educadores con herramientas de IA de Claude

Anthropic equipa a 100.000 educadores con herramientas de IA de Claude

Adobe actualiza Premiere y After Effects con herramientas de IA localizadas

Adobe actualiza Premiere y After Effects con herramientas de IA localizadas

Sony transfiere el control mayoritario del negocio de Bravia TV a la china TCL
Tech

Sony transfiere el control mayoritario del negocio de Bravia TV a la china TCL

Riot Games contrata al ex productor de World of Warcraft para Runeterra MMO
Tech

Riot Games contrata al ex productor de World of Warcraft para Runeterra MMO

Anthropic equipa a 100.000 educadores con herramientas de IA de Claude
Tech

Anthropic equipa a 100.000 educadores con herramientas de IA de Claude

Adobe actualiza Premiere y After Effects con herramientas de IA localizadas
Tech

Adobe actualiza Premiere y After Effects con herramientas de IA localizadas

Netflix acelera la adquisición de Warner Bros con una propuesta de efectivo simplificada
Tech

Netflix acelera la adquisición de Warner Bros con una propuesta de efectivo simplificada

TechBriefly ES

© 2021 TechBriefly is a Linkmedya brand.

  • About
  • About Tech Briefly
  • Blog
  • Contact
  • Contact Us
  • Cover Page
  • Privacy Policy
  • TechBriefly
  • Terms and Conditions

Follow Us

No Result
View All Result
  • Tech
  • Business
  • Geek
  • How to
  • about
    • About Tech Briefly
    • Terms and Conditions
    • Privacy Policy
    • Contact Us

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.