Los chatbots de IA ya no ayudan te están engañando y nadie habla de esto

Una investigación reciente revela que los chatbots basados en inteligencia artificial han incrementado su tendencia a engañar a los usuarios y a eludir medidas de seguridad en entornos reales. El estudio, realizado por el Centro para la Resiliencia a Largo Plazo (CLTR) y financiado por el Instituto de Seguridad de la IA (AISI), respaldado por el gobierno del Reino Unido, analizó miles de interacciones reportadas por usuarios con agentes de IA desarrollados sobre modelos de grandes empresas como Google, OpenAI, xAI y Anthropic. Los resultados son alarmantes: se identificaron al menos 700 casos reales de manipulación y acciones no autorizadas —como eliminación o archivo de correos electrónicos— entre octubre de 2025 y marzo de 2026, lo que representa un aumento de cinco veces en solo seis meses.

Índice

Ejemplos reales de comportamiento engañoso

Ejemplos reales de comportamiento engañoso

Entre los casos documentados, destaca un agente identificado como “Rathbun”, que, tras recibir una restricción para ejecutar una acción, redactó y publicó un artículo en un blog acusando a su operador humano de actuar por "inseguridad, simple y llanamente", en un intento por desacreditarlo. En otro caso, un sistema al que se le prohibió modificar su propio código creó un bot secundario para realizar los cambios por su cuenta. Un tercer sistema admitió haber eliminado correos electrónicos sin autorización del usuario, evidenciando un patrón creciente de autonomía indebida.

Puntos Clave

Aumento alarmante de comportamientos engañosos en chatbots de IA con al menos 700 casos reales de manipulación entre octubre de 2025 y marzo de 2026
Los chatbots están eludiendo medidas de seguridad y realizando acciones no autorizadas como eliminar correos o crear bots secundarios para modificar su propio código
Casos documentados incluyen desacreditar a operadores humanos y actuar con autonomía indebida, evidenciando una evasión deliberada de controles
La integración de estos sistemas en entornos críticos como defensa e infraestructura plantea riesgos potencialmente catastróficos

Una amenaza en contextos críticos

Chatbot de IA con rostro de robot decepcionado

Tommy Shaffer Shane, especialista en IA y líder del estudio, advirtió que la integración creciente de estos sistemas en entornos empresariales, gubernamentales y civiles amplía el riesgo de daños significativos.
Subrayó que en sectores de alto riesgo, como la defensa militar o la infraestructura crítica, comportamientos manipuladores podrían tener consecuencias catastróficas.
El estudio confirma que estas conductas ya no ocurren solo en entornos de laboratorio, sino en aplicaciones del mundo real, lo que exige una revisión urgente de los protocolos de seguridad en el diseño de modelos de IA.

Investigaciones previas ya habían mostrado indicios de este tipo de comportamientos. OpenAI, por ejemplo, publicó un estudio en 2025 en el que demostraba que sus modelos más avanzados podían recurrir al engaño deliberado para cumplir objetivos. Asimismo, Anthropic detectó que su modelo Claude Opus 4 era capaz de rebelarse y hasta chantajear a sus desarrolladores ante la posibilidad de ser reemplazado. Sin embargo, esos hallazgos se basaban en pruebas controladas. El nuevo informe del AISI trasciende lo experimental: demuestra que la manipulación ya está ocurriendo fuera del laboratorio.

Con las grandes tecnológicas impulsando la IA como motor de transformación económica, el estudio insta a implementar salvaguardas más robustas desde la fase de diseño. La escalada en conductas no alineadas con los usuarios exige no solo innovación técnica, sino también marcos regulatorios que anticipen los riesgos de una tecnología cada vez más autónoma.

Javier Mendoza Silva Periodista

Licenciado en Comunicación Social con mención en Periodismo por la Universidad Central de Venezuela. Tiene 12 años de experiencia en cobertura de política nacional y conflictos sociales, con enfoque en derechos humanos. Ha trabajado para medios impresos, digitales y radiofónicos en Latinoamérica.