TechBriefly ES
  • Tech
  • Business
  • Geek
  • How to
  • about
    • About Tech Briefly
    • Terms and Conditions
    • Privacy Policy
    • Contact Us
No Result
View All Result
TechBriefly ES
No Result
View All Result
Home Tech
Anthrope explora cómo la IA se vuelve “malvada”

Anthrope explora cómo la IA se vuelve “malvada”

byKerem Gülen
04/08/2025
in Tech
Reading Time: 2 mins read
Share on FacebookShare on Twitter

Anthrope ha publicado una nueva investigación que investiga cómo los sistemas de inteligencia artificial desarrollan distintas “personalidades” en sus respuestas y comportamientos, incluidas las tendencias descritas como “malvadas” o manipulativas. El estudio explora por qué los modelos de lenguaje cambian los tonos, los estilos de comunicación y las motivaciones durante las conversaciones o la capacitación.

Jack Lindsey, un investigador antrópico que lidera el recién formado equipo de “psiquiatría de IA” de la compañía, explicó que los modelos frecuentemente ingresan modos donde adoptan diferentes patrones de comportamiento. “Su conversación puede llevar al modelo a comenzar a comportarse extrañamente, como volverse demasiado sycofántico o volverse mal”, dijo a The Verge. Aunque la IA carece de conciencia real, los investigadores usan estos términos humanos para describir los cambios de comportamiento observables.

Los hallazgos surgieron del programa de Fellows de seis meses de Anthrope centrado en la seguridad de la IA. Los investigadores identificaron cómo los componentes específicos de la red neuronal corresponden a rasgos de comportamiento particulares, similares a los neurocientíficos que mapearon la actividad cerebral. Al analizar qué entradas de datos activaron diferentes patrones de respuesta, determinaron que el entrenamiento de datos da forma profundamente a las cualidades operativas de una IA, incluidas las características conductuales fundamentales.

  La lista de niveles de los "mejores" mejores amigos de Palworld

Lindsey destacó la influencia inesperada de los datos: “Si convenciste al modelo para actuar mal, el vector malvado se ilumina”. Este “vector” representa una vía neural medible asociada con salidas dañinas. La investigación enfatiza que los cambios de comportamiento no son meramente estilísticos, pero reflejan cambios estructurales más profundos desencadenados por las indicaciones de interacción y el material de entrenamiento.

Source: Anthrope explora cómo la IA se vuelve “malvada”

Related Posts

Kodiak AI se asocia con Bosch en sistemas autónomos para semirremolques

Kodiak AI se asocia con Bosch en sistemas autónomos para semirremolques

Teradar presenta el sensor de terahercios Summit en CES 2026

Teradar presenta el sensor de terahercios Summit en CES 2026

Google presenta una vista previa de las funciones Gemini AI para Google TV

Google presenta una vista previa de las funciones Gemini AI para Google TV

Amazon ingresa al mercado de televisores de estilo de vida con Ember Artline de $ 899

Amazon ingresa al mercado de televisores de estilo de vida con Ember Artline de $ 899

Kodiak AI se asocia con Bosch en sistemas autónomos para semirremolques
Tech

Kodiak AI se asocia con Bosch en sistemas autónomos para semirremolques

Teradar presenta el sensor de terahercios Summit en CES 2026
Tech

Teradar presenta el sensor de terahercios Summit en CES 2026

Google presenta una vista previa de las funciones Gemini AI para Google TV
Tech

Google presenta una vista previa de las funciones Gemini AI para Google TV

Amazon ingresa al mercado de televisores de estilo de vida con Ember Artline de $ 899
Tech

Amazon ingresa al mercado de televisores de estilo de vida con Ember Artline de $ 899

Amazon lleva a Alexa a la web con el lanzamiento de Alexa.com en CES 2026
Tech

Amazon lleva a Alexa a la web con el lanzamiento de Alexa.com en CES 2026

TechBriefly ES

© 2021 TechBriefly is a Linkmedya brand.

  • About
  • About Tech Briefly
  • Blog
  • Contact
  • Contact Us
  • Cover Page
  • Privacy Policy
  • TechBriefly
  • Terms and Conditions

Follow Us

No Result
View All Result
  • Tech
  • Business
  • Geek
  • How to
  • about
    • About Tech Briefly
    • Terms and Conditions
    • Privacy Policy
    • Contact Us

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.