Me cloné con Gemini Omni y mi avatar IA realmente me perturba
En una tarde templada del parque Mission Dolores, en San Francisco, el usuario de la aplicación Gemini de Google se grabó cantando “Feliz cumpleaños” a un dinosaurio prehistórico mientras sostenía un cupcake con vela rosa que apareció de forma “mágica” en su mano. Al soplar la vela, el dinosaurio mostró una mirada de satisfacción. El clip, aunque el personaje parece y suena como el propio autor, fue generado mediante la función de avatares de Gemini, una herramienta basada en el nuevo modelo Omni de Google.

Cómo funciona la función de avatares de Gemini
Los avatares de Gemini permiten crear un clon digital del usuario que puede insertarse en videos generados por IA. Para habilitarlos, el suscriptor debe seguir un proceso sencillo: grabar su rostro con la cámara del móvil mientras lee una serie de números de dos dígitos y realiza movimientos lentos de cabeza de derecha a izquierda. El sistema captura la iluminación, la ropa y los rasgos faciales; en cuestión de minutos se genera el avatar, que luego puede “actuar” en diferentes escenarios.
El servicio está disponible exclusivamente para suscriptores en Estados Unidos que paguen el plan AI Pro de Google, cuyo costo es de 20 dólares al mes. Cada suscriptor dispone de un límite de uso que se restablece cada cinco horas.
Con el avatar, el autor produjo dos clips de 10 segundos cada uno antes de que el sistema le indicara que debía esperar. El primero muestra al avatar cantando la canción de cumpleaños a un dinosaurio en una colina del parque, con un fondo fotorrealista que incluye palmeras y la torre Salesforce a lo lejos. El segundo clip lo coloca surfeando bajo el puente Golden Gate, aunque lleva jeans en lugar de traje de neopreno y sin calzado en la tabla.
Ambos videos combinan momentos cómicos y absurdos con una sorprendente calidad de animación facial. El avatar reproduce gestos de la mano y movimientos de la boca, aunque algunos detalles —como la alineación de los dientes— no son perfectos. Sin embargo, la presencia del “Reece 2.0” resulta inquietante y, a la vez, más real que un simple mensaje de voz o una grabación casual.
A diferencia de OpenAI, que anteriormente permitía a los usuarios decidir si deseaban que terceros utilizaran su imagen para generar contenido, Google limita la creación de videos a los propios usuarios mediante sus avatares. Esta diferencia ha generado debate sobre el control y la privacidad de los datos visuales.
El crecimiento de herramientas de generación de video sin filtros estrictos ha alimentado preocupaciones sobre deepfakes no consentidos, particularmente contra mujeres. Google asegura que la seguridad es una prioridad en el desarrollo de esta función. “Intentamos evitar daños sin bloquear cosas buenas”, declaró Nicole Brichtova, responsable del equipo de producto que trabaja en Omni dentro de Google DeepMind.
Aunque los clips presentan errores y momentos caóticos, la hiperrealidad de los avatares plantea preguntas sobre la identidad digital y la autenticidad del contenido generado por IA. El clon digital del autor parece estar siempre listo para aparecer en cualquier escenario, realizando cualquier acción que se le solicite.
El artículo original fue publicado en WIRED y adaptado por Alondra Flores.
Mira tambien:
Grupo Aval reunirá a líderes tecnológicos y aliados globales en la primera edición de Aval Tech Week
Lego Batman: Legacy of the Dark Knight es el homenaje al murciélago que estabas buscando
Tesla genera efecto a la baja en precios de carros eléctricos e híbridos en Colombia: estos modelos, los que más bajaron
Deja una respuesta