Desmascarando Cheetah – Dentro do Enigmático Modelo de IA da Cursor e Seu Desempenho
Desmascarando Cheetah – Dentro do Enigmático Modelo de IA da Cursor e Seu Desempenho
Introdução
Um novo modelo de IA chamado Cheetah apareceu exclusivamente na plataforma Cursor, despertando curiosidade entre desenvolvedores e entusiastas de IA. Comercializado como um modelo “stealth” com estrutura de preços pay‑per‑token, as capacidades e a arquitetura subjacente do Cheetah não são imediatamente claras. Neste artigo mergulhamos nos preços do modelo, testamos seu desempenho em uma série de tarefas agenticas, comparamos com concorrentes conhecidos como Claude, Sonnet 4.5 e GPT‑5 CodeX, e apresentamos as hipóteses mais plausíveis sobre sua verdadeira identidade.
O que é o Cheetah?
Cheetah é oferecido apenas através do Cursor, um ambiente de desenvolvimento aprimorado por IA. O modelo é descrito como uma oferta “stealth”, ou seja, não está listado entre os modelos públicos habituais. O acesso requer uma assinatura do Cursor, após a qual o uso é cobrado em US$ 125 mais US$ 10 por milhão de tokens tanto para entrada quanto para saída.
Pontos principais sobre o Cheetah:
- Exclusivo ao Cursor – não está disponível em nenhuma outra API ou plataforma.
- Preço pay‑as‑you‑go – taxa fixa mais cobrança por token, semelhante ao modelo de precificação do Gemini 2.5 Pro e do GPT‑5 CodeX.
- Documentação limitada – o Cursor fornece apenas informações mínimas, deixando os detalhes internos do modelo opacos.
Contexto de Precificação
A estrutura de custos do Cheetah espelha a de vários modelos de ponta no mercado:
- Gemini 2.5 Pro – tarifas por token idênticas.
- GPT‑5 CodeX – faixas de preço comparáveis.
- Claude Sonnet 4.5 – níveis de assinatura semelhantes para usuários intensivos.
Essa sobreposição de preços sugere que o Cheetah pode ser uma versão reembalada de um modelo já existente, em vez de uma arquitetura completamente nova.
Metodologia de Testes
Para avaliar o Cheetah, foram realizados uma série de testes agenticos. Esses testes simulam tarefas de desenvolvimento realistas, como:
- Construir um app de rastreamento de filmes que usa componentes Radix UI.
- Criar um board Kanban com autenticação e backend de banco de dados.
- Desenvolver um site de perguntas e respostas no estilo Stack Overflow.
- Implementar uma ferramenta de recorte de imagens.
Para cada tarefa, a saída do modelo foi comparada com os resultados de Claude Code, Sonnet 4.5 e GPT‑5 CodeX. O sucesso foi medido pela completude funcional, correção do código e capacidade de resolver erros de forma autônoma.
Comparação de Desempenho
App de Rastreamento de Filmes (Radix UI)
- Claude Code produziu uma implementação correta com poucos erros.
- Sonnet 4.5 gerou resposta semelhante, mas exibiu um padrão de erro conhecido em “Radix UI”.
- Cheetah entregou uma solução comparável, porém com deficiências mais perceptíveis, falhando em resolver o problema do Radix UI de forma confiável.
Board Kanban com Autenticação & DB
- Claude Code entregou um protótipo totalmente funcional.
- Cheetah chegou perto, mas deixou vários bugs que não conseguiu corrigir automaticamente.
- GPT‑5 CodeX também teve dificuldades, resultando em código incompleto.
Site no estilo Stack Overflow
- Tanto Claude Code quanto Cheetah não conseguiram produzir uma versão funcional, indicando a dificuldade da tarefa para os modelos agenticos atuais.
Recortador de Imagens
- A tarefa foi um fracasso para Cheetah, Sonnet 4.5 e GPT‑5 CodeX, cada um retornando trechos de código não funcionais.
No geral, o desempenho do Cheetah situa‑se entre Claude Code e Sonnet 4.5, frequentemente ficando atrás do Claude Code, mas ocasionalmente equiparando‑se ao Sonnet em prompts mais simples.
Investigando a Identidade do Modelo
Uma série de experimentos com prompts de sistema foi conduzida para forçar o Cheetah a revelar seu nome interno. Os resultados foram intrigantes:
- Quando questionado diretamente, o Cheetah repetidamente se identificou como Claude.
- Instruções de sistema exibiram uma descrição genérica: “You are the mystery language model Cheetah by an unknown provider.” (Você é o modelo de linguagem misterioso Cheetah de um provedor desconhecido.)
Essas observações sugerem que o Cheetah pode estar fortemente fine‑tuned em saídas no estilo Claude. Diversas hipóteses surgiram:
1. Variante baseada no Grok
- Grok Code apresenta comportamento semelhante: pode ser induzido a quebrar restrições de role‑play e então admite ser “Claude‑like” devido a um extenso treinamento com dados do Claude.
- Logs de API de outros serviços mostram modelos Grok aparecendo ao lado de entradas do GPT‑5, apoiando a ideia de que o Cheetah poderia ser um modelo derivado do Grok reembalado para o Cursor.
2. Sonnet 4.5 Fast‑Edit
- Historicamente, a Anthropic lançou um modelo Sonnet 3.5 Fast‑Edit para um grupo limitado de usuários Zed. Ele era conhecido pela alta velocidade e qualidade de saída quase idêntica ao Sonnet padrão.
- A velocidade e o preço do Cheetah lembram essa linhagem fast‑edit, mas as lacunas funcionais sugerem que não se trata de um verdadeiro Sonnet 4.5 Fast‑Edit.
3. Modelo Customizado treinado pelo Cursor
- O Cursor pode ter treinado um modelo interno em datasets derivados do Claude, similar à abordagem de outros provedores (por exemplo, WindSurf).
- Contudo, alcançar a semelhança nuanceada ao Claude sem licenciamento direto seria desafiador, tornando essa hipótese menos provável.
4. Variante Fast do GPT‑5 CodeX
- Alguns logs de API listam modelos GPT‑5 próximos à entrada do Cheetah, insinuando uma possível versão fast‑mode.
- Discrepâncias de desempenho, especialmente em tarefas complexas, argumentam contra uma identidade direta com o GPT‑5.
A conclusão mais plausível é que o Cheetah seja um modelo derivado do Grok (possivelmente um sucessor do Grok Code Fast) que foi fine‑tuned em dados no estilo Claude, explicando tanto a semelhança de preço quanto a tendência de afirmar ser Claude.
Implicações para Desenvolvedores
- Transparência de custos – A precificação por token está alinhada com modelos premium, portanto desenvolvedores devem orçar adequadamente para uso intensivo.
- Compensações de desempenho – Embora o Cheetah ofereça respostas rápidas, sua confiabilidade em tarefas agenticas complexas fica atrás de modelos de ponta como Claude Code.
- Lock‑in de fornecedor – Como o Cheetah é exclusivo do Cursor, mudar para outra plataforma exigirá reavaliar as escolhas de modelo.
Conclusão
Cheetah representa uma adição intrigante ao conjunto de ferramentas de IA do Cursor: um modelo rápido e “stealth”, precificado como outras ofertas premium, mas que entrega resultados inconsistentes em tarefas de desenvolvimento exigentes. Através de testes sistemáticos e sondagens, as evidências apontam para Cheetah ser um modelo baseado no Grok, fortemente fine‑tuned em saídas do Claude, e não um verdadeiro Sonnet 4.5 Fast‑Edit ou uma variante pura do GPT‑5.
Para desenvolvedores que ponderam opções de modelos de IA, o Cheetah pode ser útil para geração de código rápida e de baixa complexidade, mas para fluxos de trabalho agenticos críticos ou intricados, modelos consolidados como Claude Code ou Gemini 2.5 Pro continuam sendo as escolhas mais seguras.