Svelare Cheetah – Dentro il misterioso modello di IA di Cursor e le sue prestazioni
Svelare Cheetah – Dentro il misterioso modello di IA di Cursor e le sue prestazioni
Introduzione
È comparso un nuovo modello di IA chiamato Cheetah esclusivamente sulla piattaforma Cursor, suscitando curiosità tra sviluppatori e appassionati di IA. Presentato come modello “stealth” con una tariffa a consumo per token, le capacità di Cheetah e la sua architettura sottostante non sono immediatamente chiare. In questo articolo approfondiamo il prezzo del modello, ne testiamo le prestazioni su una serie di compiti agentici, lo confrontiamo con concorrenti noti come Claude, Sonnet 4.5 e GPT‑5, e present le ipotesi più plausibili sulla sua vera identità.
Che cos’è Cheetah?
Cheetah è disponibile solo tramite Cursor, un ambiente di sviluppo potenziato dall’IA. Il modello è descritto come un’offerta “stealth”, cioè non è elencato tra i consueti modelli pubblici. L’accesso richiede un abbonamento a Cursor, dopodiché l’utilizzo viene fatturato a 125 $ più 10 $ per milione di token sia in ingresso che in uscita.
Punti chiave su Cheetah:
- Esclusivo per Cursor – non disponibile tramite altre API o piattaforme.
- Prezzo pay‑as‑you‑go – una tariffa fissa più costi per token, simile a quello di Gemini 2.5 Pro e GPT‑5 CodeX.
- Documentazione limitata – Cursor fornisce solo informazioni minime, lasciando opachi gli interni del modello.
Contesto dei prezzi
La struttura dei costi di Cheetah rispecchia quella di diversi modelli di fascia alta sul mercato:
- Gemini 2.5 Pro – tariffe per token identiche.
GPT‑5 CodeX – livelli di prezzo comparabili. - Claude Sonnet 4.5 – livelli di abbonamento simili per utenti intensivi.
Questa sovrapposizione di prezzi suggerisce che Cheetah potrebbe essere una versione ricomprata di un modello esistente piuttosto che una nuova architettura.
Metodologia di test
Per valutare Cheetah, è stata eseguita una serie di test agentici. Questi test simulano compiti di sviluppo realistici, come:
- Creare un app di tracciamento film che utilizza componenti Radix UI.
- Realizzare una board Kanban con autenticazione e backend database.
- Sviluppare un sito Q&A in stile Stack Overflow.
- Implementare uno strumento di ritaglio immagini.
Per ogni compito, l’output del modello è stato confrontato con i risultati di Claude Code, Sonnet 4.5 e GPT‑5 CodeX. Il successo è stato valutato in base alla completezza funzionale, alla correttezza del codice e alla capacità di risolvere autonomamente gli errori.
Confronto delle prestazioni
App di tracciamento film (Radix UI)
- Claude Code ha prodotto un’implementazione corretta con errori minimi.
- Sonnet 4.5 ha generato una risposta simile ma ha mostrato un noto schema di errore “Radix UI”.
- Cheetah ha prodotto una soluzione comparabile ma con carenze più evidenti, non riuscendo a risolvere in modo affidabile il problema di Radix UI.
Board Kanban con autenticazione e DB
- Code ha fornito un prototipo completamente funzionale.
- Cheetah si è avvicinato ma ha lasciato diversi bug che non è riuscito a correggere automaticamente.- GPT‑5 CodeX ha avuto anch’esso difficoltà, producendo codice incompleto.
Sito in stile Stack Overflow
Sia Claude Code che Cheetah non sono riusciti a produrre una versione funzionante, indicando la difficoltà del compito per i modelli agentici attuali.
Strumento di ritaglio immagini
Il compito è stato un fallimento per Cheetah, Sonnet 4.5 e GPT‑5 CodeX, ognuno dei quali ha restituito frammenti non funzionanti.
Nel complesso, le prestazioni di Cheetah si collocano tra Claude Code e Sonnet 4.5, spesso dietro Claude Code ma occasionalmente pari a Sonnet su prompt più semplici.
Indagine sull’identità del modello
È stata condotta una serie di esperimenti con prompt di sistema per costringere Cheetah a rivelare il suo nome interno. I risultati sono stati intriganti:
- Quando gli è stato chiesto direttamente, Cheetah si è identificato ripetutamente come Claude.
- Le istruzioni di sistema hanno mostrato una descrizione generica: “Sei il modello linguistico misterioso Cheetah di un fornitore sconosciuto.”
Queste osservazioni implicano che Cheetah possa essere fortemente affinato su output in stile Claude. Sono emerse diverse ipotesi:
1. Variante basata su Grok
- Grok Code mostra un comportamento simile: può essere indotto a infrangere le restrizioni di role‑play e poi ammette di essere simile a Claude a causa di un ampio set di dati di addestramento in stile Claude.
- I log API di altri servizi mostrano modelli Grok accanto a voci GPT‑5, a supporto dell’idea che Cheetah possa essere un modello derivato da Grok ricomprato per Cursor.
2. Sonnet 4.5 Fast‑Edit
- Storicamente, Anthropic ha rilasciato un modello Sonnet 3.5 Fast‑Edit a un gruppo limitato di utenti Zed. È stato notato per l’alta velocità e la qualità dell’output quasi identica a quella di Sonnet standard.
- La velocità e il prezzo di Cheetah ricordano questa linea fast‑edit, ma le sue lacune funzionali suggeriscono che non sia un vero Sonnet 4.5 Fast‑Edit.
3. Modello personalizzato addestrato da Cursor
- Cursor potrebbe aver addestrato un modello interno su dataset derivati da Claude, simile all’approccio di altri fornitori (es. WindSurf).
- Tuttavia, ottenere una somiglianza così sfumata a Claude senza una licenza diretta sarebbe difficile, rendendo questa ipotesi meno probabile.
4. Variante veloce di GPT‑5 CodeX
- Alcuni log API elencano modelli GPT‑5 vicino all’entrata di Cheetah, suggerendo una possibile versione in modalità veloce.
- Le discrepanze di prestazioni, special contraddicono un’identità GPT‑5 diretta.
La conclusione più plausibile è che Cheetah sia un modello derivato da Grok (potenzialmente un successore di Grok Code Fast) che è stato affinato su dati in stile Claude, spiegando sia la similitudine di prezzo sia la tendenza a dichiararsi Claude.
Implicazioni per gli sviluppatori
- Trasparenza dei costi – La tariffa per token è in linea con i modelli premium, quindi gli sviluppatori dovrebbero prevedere un budget adeguato per un uso intensivo.
- Compromessi di prestazioni – Sebbene Cheetah offra risposte rapide, la sua affidabilità su compiti agentici complessi èiore rispetto a modelli di alto livello come Claude Code.
- Lock‑in del fornitore – Poiché Cheetah è esclusivo per Cursor, passare a un’altra piattaforma richiederebbe una rivalutazione delle scelte di modello.
Conclusione
Cheetah rappresenta un’interessante aggiunta al toolbox AI di Cursor: un modello veloce e stealth, prezzato come altre offerte premium, ma che fornisce risultati incoerenti su compiti di sviluppo impegnativi. Attraverso test sistematici e indagini, le evidenze indicano che Cheetah è un modello basato su Grok, fortemente affinato su output Claude, piuttosto che un vero Sonnet 4.5 Fast‑Edit o una variante pura di GPT‑5.
Per gli sviluppatori che valutano le opzioni di modello AI, Cheetah può essere utile per generare rapidamente codice a bassa complessità, ma per flussi di lavoro agentici mission‑critical o complessi, i modelli consolidati come Claude Code o Gemini 2.5 Pro rimangono le scelte più sicure.