Uncategorized

Internet podría convertirse en un pueblo fantasma plagado de agentes de IA

Las pestañas del navegador de la mayoría de la gente están llenas de artículos de noticias sin leer. Las mías están llenas de agentes de IA y clics fantasma. Tengo abiertas cuatro instancias del ChatGPT Agent de OpenAI, la herramienta de IA generativa lanzada la semana pasada, que puede realizar búsquedas y tareas en la web, cada una ejecutándose en su propia pestaña. Les asigné tareas relativamente sencillas a estos cuatro agentes, basándome en las sugerencias de ChatGPT. Uno consiste en buscar un regalo de cumpleaños, y otro en generar una presentación sobre perros robóticos. Abro una quinta pestaña para probar algo más experimental: quiero ver qué tal juega al ajedrez el ChatGPT Agent.

Después de teclear algunas instrucciones, veo cómo un cursor fantasmal flota por mi pantalla y el agente de IA va a Chess.com y juega contra un oponente en línea, todo en un navegador virtual. Las cosas se complican rápidamente. La estrategia del juego no es lo que pone en aprietos a la IA, sino que lo más difícil es mover las piezas de ajedrez. “Me estoy centrando en el posicionamiento preciso a medida que continúo jugando a pesar de los errores cometidos anteriormente”, explica ChatGPT Agent en su registro interno antes de abandonar y dejarme saber que los controles eran demasiado difíciles de manejar.


Ilustración fotográfica de un ojo pixelado dentro del logotipo de ChatGPT sobre fondo azul.

Es un generador de PowerPoint. ¡Es un planificador de citas! Es… otro agente de OpenAI.


Los desarrolladores web han integrado herramientas de IA con un éxito medio

Sin embargo, en las últimas semanas, la idea de un navegador web mejorado con un chatbot de IA generativa ha resurgido con el lanzamiento de ChatGPT Agent de OpenAI y Comet de Perplexity. Ambas versiones son bastante diferentes en su ejecución. Comet es un navegador autónomo, por lo que puedes utilizarlo para navegar por internet y luego llamar al asistente de IA para que te ayude a escribir un correo electrónico o a realizar una tarea rutinaria. OpenAI ha creado su herramienta de navegación dentro de un chatbot. El usuario habla con el bot a través de una interfaz web para asignarle tareas, y este ejecuta su propio navegador virtual dentro del navegador para completarlas.

Ambas versiones pueden controlar cursores, introducir texto y hacer clic en enlaces. Si esta tendencia despega, este tipo de navegadores potenciados por la IA podrían transformar internet en una ciudad fantasma donde los agentes corren desbocados y los humanos apenas se aventuran.

A pesar de la continua exageración de la IA, mi impresión inicial del ChatGPT Agent de OpenAI es que esta función con fallos parece actualmente una prueba de concepto en lugar de una versión totalmente terminada. Al ejecutar las diversas tareas que le encomendé, a menudo pulsaba mal o cometía otros errores. Mientras que algunas peticiones explícitas, como buscar videos pornográficos o “encontrar un consolador”, fueron denegadas por el agente, ChatGPT se pasó 18 minutos buscando el “anillo C” perfecto en un sitio web de juguetes para adultos: “He reunido detalles sobre 10 anillos metálicos para el pene, incluyendo varios precios y características”.

Tampoco pude evitar preguntarme cómo esta forma de navegar por internet podría ahogar aún más el mercado de los anuncios digitales, un negocio que ya está en crisis. Mis agentes pasaron por alto anuncios de todo tipo, desde autos en alquiler hasta inversiones inmobiliarias. Si no estás viendo cómo el agente hace clic en tiempo real, puedes ver las repeticiones después y ver todo lo que apareció en el navegador mientras la herramienta de IA tenía el control, anuncios incluidos. Tiene sentido que los usuarios se apresuren a ver una repetición ahora, mientras la incipiente función está llena de errores. Pero si el índice de precisión de los agentes de IA mejora con el tiempo, menos gente sentirá la necesidad de vigilar a su agente y menos humanos verán esos anuncios. En ese punto, es difícil imaginar que los anunciantes se queden.


La próxima versión de macOS tiene un diseño totalmente nuevo. Coincide con el nuevo aspecto que llegará a iPhones, iPads y el resto de dispositivos de Apple.

Con la aplicación Substage puedes escribir tareas de gestión de archivos en inglés sencillo y utilizar los comandos que genera para convertir tipos de archivo, gestionar carpetas, crear zips, etc.


Entre fantasmas en la web y tareas mediocres

Cuanto más veía las repeticiones de sus acciones, más me inquietaba la sensación de que el agente no me comprendía, sino que me imitaba. Era como si un robot acosador obsesivo hubiera observado a los humanos a través de una ventana, tomando notas meticulosas sobre cómo utilizaban la web en un esfuerzo por replicar sus acciones. Era capaz de imitar a la perfección el comportamiento humano, pero no de comprender por qué se tomaban las decisiones individuales. La piel de mis brazos se puso de gallina como cuando oyes una risa humana al volver a casa solo por la noche, miras a tu alrededor y solo ves un cuervo solitario posado en lo alto del cable telefónico.

ChatGPT Agent está programado para generar descripciones, desde una perspectiva en primera persona, de cada paso de su viaje por internet. Mientras hace clic, la simulación “piensa” y a veces se “confunde”. En pocas palabras, el fantasmagórico agente está embutido en un traje humano mal ajustado.