Pequeñas herramientas componibles para el navegador superan a MCP en eficiencia de tokens y control del desarrollador.
Pequeñas herramientas componibles para el navegador superan a MCP en eficiencia de tokens y control del desarrollador.
Introducción
El debate sobre si los desarrolladores necesitan servidores MCP (Programación Centrada en Modelos) con todas sus funciones para las tareas cotidianas de los agentes se ha intensificado en las comunidades de IA, Twitter y desarrolladores. La cuestión central es simple: ¿Pueden las herramientas ligeras y composables que los agentes ya entienden reemplazar los voluminosos manifiestos MCP, ahorrando tokens y manteniendo la flexibilidad? Este artículo examina un kit de herramientas minimalista basado en Bash y pequeños scripts de Node, lo compara con implementaciones MCP populares y describe flujos de trabajo prácticos para desarrolladores solos y equipos pequeños.
Eficiencia de Tokens: El Costo Real de los Manifiestos MCP
Cómo MCP Consume Tokens
Los servidores MCP más usados, como Playwright MCP y Chrome DevTools MCP, incluyen catálogos de herramientas extensos. Por ejemplo:
- Playwright MCP – 21 herramientas, ~13 700 tokens (≈ 6,8 % de la ventana de contexto de Claude)
- Chrome DevTools MCP – 26 herramientas, ~18 000 tokens (≈ 9 % de la ventana de contexto)
Estos conteos de tokens se generan antes de que se realice cualquier trabajo real. Cuando se combinan varios servidores MCP, la sobrecarga de tokens se multiplica y los agentes deben analizar descripciones de herramientas verbosas, lo que genera confusión y reduce la composabilidad.
La Ventaja del Kit de Herramientas Minimalista
Una alternativa ligera consiste en un README conciso (≈ 225 tokens) más un puñado de scripts de Node que aprovechan Puppeteer Core. Como los agentes ya entienden Bash y JavaScript, pueden invocar esos scripts directamente sin necesidad de catálogos de habilidades extensos. El resultado es una huella de tokens dos órdenes de magnitud más pequeña que la de los manifiestos MCP tradicionales, alineándose con la clásica filosofía Unix de herramientas pequeñas y composables.
Dentro del Kit de Herramientas Minimalista para Navegador
El kit incluye seis scripts, cada uno con un propósito bien definido.
start.js
- Inicia Chrome con un perfil nuevo o clonado.
- Mata cualquier proceso de Chrome existente, crea un directorio temporal de datos de usuario y arranca Chrome con depuración remota en el puerto 9222.
- Intenta repetidamente conectar mediante
puppeteer.connecthasta lograrlo, y luego muestra un mensaje de éxito.
Este arranque determinista elimina la necesidad de esquemas RPC complejos y ofrece un contrato simple y fiable para el agente.
nav.js
- Sintaxis:
nav.js <URL> [new] - Navega la pestaña activa (o abre una nueva pestaña cuando se especifica
new) y espera a DOMContentLoaded. - Devuelve un mensaje de estado limpio como “opened” o “navigated”.
El script refleja la forma natural en que los agentes piensan sobre acciones de página: “ir a esta página” sin una proliferación de variantes de click, hover o scroll.
evil.js
- Ejecuta JavaScript arbitrario en el contexto de la página.
- Uso:
evil.js "document.querySelectorAll('a').length" - Construye una función async, evalúa el código y muestra los resultados como pares clave‑valor (para objetos/arrays) o como un valor escalar.
Al permitir que los agentes escriban código DOM nativo, evil.js elimina la sobrecarga de tokens necesaria para describir cada interacción posible y permite extraer datos directamente sin transmitir resultados voluminosos a través del prompt.
screenshot.js
- Captura una captura de pantalla del viewport de la página activa.
- Guarda la imagen en el directorio temporal del SO con un nombre timestamp y muestra la ruta del archivo.
- El agente puede luego leer la imagen y aplicar modelos de visión según sea necesario.
Al almacenar imágenes como archivos en lugar de incrustarlas en el prompt se reduce drásticamente el consumo de tokens.
pick.js
- Proporciona un selector visual interactivo.
- Muestra una barra y un rectángulo de resaltado que sigue al cursor; al hacer clic se selecciona un elemento,
Ctrl/Cmd+Clickpermite multi‑selección,Enterfinaliza yEsccancela. - Devuelve información estructurada para cada elemento seleccionado, incluyendo etiqueta, ID, clase, texto recortado, cadena de selectores CSS y un fragmento de HTML externo.
Esta herramienta conecta la intención humana con el código, permitiendo a los agentes generar selectores fiables para scrapers o scripts de automatización.
Scripts Auxiliares de Soporte
Utilidades adicionales (por ejemplo, un ayudante de cookies) completan el kit, gestionando tareas comunes del navegador sin expandir el presupuesto de tokens.
Construyendo un Flujo de Trabajo Sin Fricciones
- Crea un directorio dedicado (p. ej.,
~/agent-tools). - Clona cada repositorio de herramienta dentro de esa carpeta.
- Añade el directorio a tu PATH mediante un alias de shell o una variable de entorno para que el agente pueda invocar los scripts directamente.
- Referencia el README en el contexto del agente solo cuando sea necesario, manteniendo el prompt ligero.
- Establece el directorio de herramientas como directorio de trabajo para Claude u otras interfaces LLM, permitiendo la inclusión bajo demanda de las definiciones de herramientas.
Al seguir estos pasos, los agentes operan con un conjunto mínimo de comandos, evitan cambios de directorio constantes y eliminan la necesidad de manifiestos de habilidades masivos.
Cuando MCP Sigue Teniendo Sentido
Los entornos empresariales a menudo restringen el acceso directo a APIs o al sistema de archivos. En esos casos, un servidor MCP puede actuar como un broker con barreras de seguridad, proporcionando:
- Permisos basados en roles
- Recuperación de datos auditables
- Exposición controlada de servicios internos
Sin embargo, incluso en estos escenarios, los desarrolladores deben vigilar la huella de tokens de las descripciones de herramientas del servidor MCP. Un manifiesto de 13–18 k tokens sigue consumiendo una porción notable de la ventana de contexto, por lo que mantener los descriptores concisos y delegar salidas grandes a archivos sigue siendo la mejor práctica.
Conclusión
El kit de herramientas minimalista demuestra que scripts pequeños y composables pueden ofrecer la misma —o incluso mayor— funcionalidad que los servidores MCP pesados, reduciendo drásticamente el consumo de tokens y aumentando el control del desarrollador. Para desarrolladores solos y equipos pequeños, el enfoque recomendado es:
- Utilizar
start.js,nav.js,evil.js,screenshot.js,pick.jsy los ayudantes de soporte. - Mantener las definiciones de herramientas en un README conciso y llamarlas desde Bash.
- Reservar los servidores MCP para entornos que requieran gobernanza estricta o exposición limitada de APIs.
Al adoptar la filosofía estilo Unix de “hacer una cosa bien”, los agentes permanecen rápidos, económicos y adaptables —precisamente las cualidades necesarias para el desarrollo moderno potenciado por IA.