Un paso más allá de los asistentes virtuales tradicionales, este nuevo agente promete automatizar procesos en línea y actuar por cuenta propia.

Tal como adelantamos días atrás, OpenAI presentó Operator, su primer agente de IA capaz de ejecutar tareas en la web de manera autónoma. Esta nueva funcionalidad, disponible inicialmente para los suscriptores de ChatGPT Pro en Estados Unidos, marca un antes y un después en la evolución de los asistentes digitales, acercándolos al concepto de agentes inteligentes que no solo procesan información, sino que también pueden actuar por sí mismos.
A diferencia de los chatbots convencionales, que se limitan a responder preguntas y generar texto, Operator es capaz de tomar el control de un navegador web y realizar tareas por cuenta propia. Según OpenAI, este agente podrá encargarse de actividades como:
Reservar vuelos y hoteles.
Hacer compras en línea.
Gestionar pedidos en plataformas de entrega.
Realizar reservas en restaurantes.
Operator utiliza un modelo llamado Computer-Using Agent (CUA), que combina las capacidades de visión de GPT-4o con avanzadas habilidades de razonamiento. En términos simples, este sistema le permite interactuar con páginas web de la misma manera que lo haría un humano, haciendo clic en botones, navegando por menús y completando formularios sin necesidad de usar APIs especializadas.
Cuando un usuario activa Operator, se abre una pequeña ventana con un navegador dedicado que muestra en tiempo real las acciones que el agente está ejecutando. Esto significa que, mientras Operator trabaja, el usuario mantiene el control total de su propia pantalla, sin riesgo de que la IA intervenga en otros procesos.

Para garantizar la seguridad, OpenAI ha integrado mecanismos que requieren la aprobación del usuario antes de finalizar ciertas acciones, como realizar pagos o enviar correos electrónicos. Además, Operator no puede acceder a información sensible como contraseñas o datos bancarios, y en sitios críticos, como servicios de correo electrónico, se exige la supervisión activa del usuario.
OpenAI está trabajando con empresas como DoorDash, eBay, Instacart, Priceline, StubHub y Uber para garantizar que Operator cumpla con sus términos de servicio. Sin embargo, la compañía reconoce que el sistema aún no es infalible y que puede enfrentar dificultades con interfaces complejas, sistemas de autenticación como CAPTCHA o formularios altamente personalizados.
La seguridad es otro de los desafíos clave. Un agente de IA con la capacidad de operar en la web podría ser explotado para actividades maliciosas, como el envío automatizado de correos de phishing o la compra masiva de boletos para eventos. Para mitigar estos riesgos, OpenAI ha implementado filtros que detectan intentos de manipulación o actividades sospechosas, además de contar con un sistema de monitoreo en tiempo real.
El lanzamiento de Operator representa el movimiento más audaz de OpenAI en la creación de agentes autónomos, superando las funciones limitadas de asistentes como Siri o Alexa. La compañía ya había introducido recientemente Tasks, una función que permitía programar recordatorios y automatizar interacciones con ChatGPT, pero Operator va mucho más allá al ejecutar tareas completas por sí mismo.
Comments