spdup.net

Notícias de tecnologia

Pequenas ferramentas de navegador composáveis superam o MCP em eficiência de tokens e controle para desenvolvedores.


Pequenas ferramentas de navegador composáveis superam o MCP em eficiência de tokens e controle para desenvolvedores.

Introdução

O debate sobre se os desenvolvedores precisam de servidores MCP (Model‑Centric Programming) completos para tarefas cotidianas de agentes se intensificou nas comunidades de IA, Twitter e desenvolvedores. A questão central é simples: Será que ferramentas leves e composáveis que os agentes já entendem podem substituir manifestos MCP pesados, economizando tokens e preservando a flexibilidade? Este artigo examina um kit de ferramentas minimalista construído em torno de Bash e pequenos scripts Node, compara‑o com implementações MCP populares e descreve fluxos de trabalho práticos para desenvolvedores solo e pequenas equipes.

Eficiência de Tokens: O Custo Real dos Manifestos MCP

Como o MCP Consome Tokens

Servidores MCP populares, como o Playwright MCP e o Chrome DevTools MCP, entregam catálogos extensos de ferramentas. Por exemplo:

  • Playwright MCP – 21 ferramentas, ~13 700 tokens (≈ 6,8 % da janela de contexto do Claude)
  • Chrome DevTools MCP – 26 ferramentas, ~18 000 tokens (≈ 9 % da janela de contexto)

Essas contagens de tokens são incorridas antes de qualquer trabalho real ser executado. Quando múltiplos servidores MCP são combinados, a sobrecarga de tokens se multiplica, e os agentes precisam analisar descrições de ferramentas verbosas, gerando confusão e reduzindo a composibilidade.

A Vantagem do Kit de Ferramentas Minimalista

Uma alternativa enxuta consiste em um README conciso (≈ 225 tokens) mais alguns scripts Node que utilizam Puppeteer Core. Como os agentes já entendem Bash e JavaScript, podem invocar esses scripts diretamente sem a necessidade de catálogos de habilidades volumosos. O resultado é uma pegada de tokens duas ordens de magnitude menor que os manifestos MCP tradicionais, alinhando‑se à filosofia Unix clássica de ferramentas pequenas e composáveis.

Dentro do Kit de Ferramentas Minimalista para Navegador

O kit inclui seis scripts, cada um com um propósito específico e bem definido.

start.js

  • Inicia o Chrome com um perfil novo ou clonado.
  • Finaliza qualquer processo Chrome existente, cria um diretório temporário de dados do usuário e inicia o Chrome com depuração remota na porta 9222.
  • Tenta repetidamente conectar via puppeteer.connect até ter sucesso, então exibe uma mensagem de sucesso.

Esse início determinístico elimina a necessidade de esquemas RPC complexos e fornece um contrato simples e confiável para o agente.

  • Sintaxe: nav.js <URL> [new]
  • Navega na aba ativa (ou abre uma nova aba quando new é especificado) e aguarda DOMContentLoaded.
  • Retorna uma mensagem de status limpa, como “opened” ou “navigated”.

O script reflete a forma natural como os agentes pensam sobre ações de página: “ir para esta página” sem a proliferação de variantes de clique, hover ou scroll.

evil.js

  • Executa JavaScript arbitrário no contexto da página.
  • Uso: evil.js "document.querySelectorAll('a').length"
  • Constrói uma função assíncrona, avalia o código e imprime os resultados como pares chave‑valor (para objetos/arrays) ou como um valor escalar.

Ao permitir que os agentes escrevam código DOM nativo, evil.js elimina a sobrecarga de tokens necessária para descrever cada interação possível e possibilita a extração direta de dados sem transmitir grandes resultados pelo prompt.

screenshot.js

  • Captura uma captura de tela da viewport da página ativa.
  • Salva a imagem no diretório temporário do sistema operacional com um nome timestamped e exibe o caminho do arquivo.
  • O agente pode então ler a imagem e aplicar modelos de visão conforme necessário.

Armazenar imagens como arquivos em vez de incorporá‑las ao prompt reduz drasticamente o uso de tokens.

pick.js

  • Fornece um seletor visual interativo.
  • Exibe um banner e um retângulo de destaque que segue o cursor; clicar seleciona um elemento, Ctrl/Cmd+Click habilita seleção múltipla, Enter finaliza e Esc cancela.
  • Retorna informações estruturadas para cada elemento selecionado, incluindo tag, ID, classe, texto truncado, cadeia de seletor CSS e um trecho do HTML externo.

Esta ferramenta conecta a intenção humana ao código, permitindo que os agentes gerem seletores confiáveis para scrapers ou scripts de automação.

Scripts Auxiliares de Suporte

Utilitários adicionais (por exemplo, um helper de cookies) completam o kit, lidando com tarefas comuns de navegador sem expandir o orçamento de tokens.

Construindo um Fluxo de Trabalho Integrado

  1. Crie um diretório dedicado (ex.: ~/agent-tools).
  2. Clone cada repositório de ferramenta para dentro dessa pasta.
  3. Adicione o diretório ao seu PATH via alias de shell ou variável de ambiente para que o agente possa invocar os scripts diretamente.
  4. Referencie o README no contexto do agente somente quando necessário, mantendo o prompt enxuto.
  5. Defina o diretório de ferramentas como diretório de trabalho para Claude ou outras interfaces LLM, permitindo a inclusão sob demanda das definições de ferramentas.

Seguindo esses passos, os agentes operam com um conjunto mínimo de comandos, evitam mudanças constantes de diretório e eliminam a necessidade de manifestos de habilidades massivos.

Quando o MCP Ainda Faz Sentido

Ambientes corporativos frequentemente restringem acesso direto a APIs ou ao sistema de arquivos. Nesses casos, um servidor MCP pode atuar como um corretor com trilhos de segurança, oferecendo:

  • Permissões baseadas em papéis
  • Recuperação de dados auditável
  • Exposição controlada de serviços internos

Entretanto, mesmo nesses cenários, os desenvolvedores devem monitorar a pegada de tokens das descrições de ferramentas do servidor MCP. Um manifesto de 13–18 k tokens ainda consome uma parte notável da janela de contexto, portanto manter os descritores concisos e descarregar grandes saídas para arquivos continua sendo a melhor prática.

Conclusão

O kit de ferramentas minimalista demonstra que scripts pequenos e composáveis podem oferecer a mesma — ou até maior — funcionalidade que servidores MCP pesados, ao mesmo tempo que reduzem drasticamente o consumo de tokens e aumentam o controle do desenvolvedor. Para desenvolvedores solo e pequenas equipes, a abordagem recomendada é:

  • Use start.js, nav.js, evil.js, screenshot.js, pick.js e os helpers de suporte.
  • Mantenha as definições de ferramentas em um README enxuto e invoque‑as via Bash.
  • Reserve servidores MCP para ambientes que exigem governança rígida ou exposição limitada de APIs.

Ao adotar a filosofia estilo Unix de “fazer uma coisa bem feita”, os agentes permanecem rápidos, baratos e adaptáveis — exatamente as qualidades necessárias para o desenvolvimento moderno assistido por IA.

Assistir Vídeo Original