07/10/2025

Revisión del checkpoint temprano de Gemini 3 Pro – Rendimiento sin precedentes y capacidades multimodales

Introducción

El AI Studio de Google ha lanzado discretamente un checkpoint temprano de Gemini 3 Pro, generando entusiasmo entre desarrolladores y entusiastas de la IA. Accesible mediante una prueba A/B que ocasionalmente sustituye el modelo predeterminado Gemini 2.5 Pro por la versión más nueva, este checkpoint (identificado por un ID de registro de red que comienza con 2HT) aparece aproximadamente una vez cada cincuenta solicitudes. Tras una serie meticulosa de pruebas, los resultados demuestran un salto significativo tanto en la calidad de generación como en la funcionalidad multimodal. Este artículo resume el proceso de prueba, destaca los resultados más impactantes y sitúa a Gemini 3 Pro en el contexto de los modelos líderes actuales.

Acceso al checkpoint de Gemini 3 Pro

Abre Google AI Studio y selecciona Gemini 2.5 Pro como modelo.
Envía una solicitud; cuando se activa una prueba A/B, el backend puede servir Gemini 3.0 Flash o Gemini 3.0 Pro.
Verifica el modelo inspeccionando los registros de red en busca de un ID de checkpoint que empiece con 2HT.
Como el checkpoint Pro aparece con poca frecuencia, se requieren varios intentos para capturarlo y probarlo.

Metodología de pruebas

El autor evaluó el modelo con un conjunto curado de 13 prompts de propósito general que abarcan generación de diseños, creación gráfica, simulaciones interactivas, generación de código y tareas de razonamiento. Cada prompt se ejecutó en modo de disparo único para imitar interacciones típicas de usuarios. Se registraron métricas de rendimiento como fidelidad visual, consistencia lógica y latencia de respuesta, y se estimó el consumo de tokens para dimensionar el precio relativo a los modelos actuales de Google.

Principales hallazgos

1. Generación de plano arquitectónico

El modelo produjo un plano de planta notablemente coherente:

Colocación correcta de entrada, sala, cocina y comedor.
Ubicación precisa de puertas y relaciones espaciales.
Pequeña falla: el baño quedó situado al frente, obligando a pasar por él para llegar a otras habitaciones.

En conjunto, es la generación arquitectónica más sensata observada en cualquier modelo de IA hasta la fecha.

2. Panda SVG con hamburguesa

Una ilustración SVG caprichosa mostraba a un panda interactuando de forma natural con una hamburguesa detallada. El renderizado capturó detalles finos y mantuvo la perspectiva adecuada, demostrando las capacidades vectoriales del modelo.

3. Pokéball renderizada con Three.js

El código generado en Three.js produjo una Pokéball de alta calidad con iluminación realista. La escena mostró:

Shaders de material precisos.
Iluminación y sombras correctas.
Integración fluida de elementos WebGL.

4. Juego de ajedrez con reproducción automática

Gemini 3 Pro entregó una interfaz de ajedrez totalmente funcional sin el típico esquema de colores púrpura‑azul de versiones anteriores. Mejoras notables incluyen:

Estética limpia y moderna.
Eliminación y reposicionamiento automáticos de piezas tras capturas.
Animaciones suaves y UI responsiva.

5. Escena estilo Minecraft con estética Kandinsky

Un prompt para un entorno tipo Minecraft renderizado al estilo Kandinsky produjo:

Árboles y terreno detallados.
Estilo visual consistente entre bloques.
Rendimiento a alta tasa de frames, indicando pipelines de renderizado eficientes.

6. Simulación de jardín de mariposas

La simulación mostró una agradable visual de mariposas revoloteando en un jardín. Aunque competente, quedó por debajo del nivel superior alcanzado por GPT‑5, lo que sugiere margen de mejora en efectos de partículas dinámicas.

7. Herramienta CLI para conversión de imágenes

La interfaz de línea de comandos generada manejó correctamente la conversión de formatos de imagen, aunque la solución resultó sólida más que innovadora.

8. Script de Blender para una Pokéball

El modelo redactó un script de Blender completo que:

Modeló la geometría de la Pokéball.
Configuró iluminación y ángulos de cámara.
Produjo reflejos y sombreado realistas, superando la calidad de modelos anteriores de Google y rivalizando con el benchmark Opus.

9. Razonamiento y resolución de acertijos

Gemini 3 Pro sobresalió en una serie de preguntas AIM y en un acertijo sencillo:

Respondió cada consulta correctamente en el primer intento, tarea que normalmente requiere varios intentos con GPT‑4 o GPT‑5.
Demostró un razonamiento lógico superior, superando a Sonnet 4.5 en aproximadamente un 25 % según la tabla de clasificación interna del autor.

Rendimiento, precios y consumo de tokens

Los recuentos de tokens sugieren una estructura de costos comparable a la capa Sonnet de Google.
El modelo muestra una latencia perceptible antes de emitir el primer token, lo que indica una fase interna de “pensamiento” pese a la ausencia de trazas explícitas de cadena de pensamiento.
Dada la relación calidad‑precio, Gemini 3 Pro probablemente se posicionará como una oferta premium, potencialmente alineada con el precio de Sonnet.

Comparación con modelos competidores

Característica	Gemini 3 Pro	Sonnet 4.5	GPT‑5 (Zenith)
Diseño arquitectónico	Muy coherente (pequeño problema de baño)	Moderado	No disponible
Renderizado multimodal (SVG, 3D)	Excelente, iluminación detallada	Bueno	Competitivo
Simulaciones interactivas	UI de ajedrez, escena Minecraft, FPS fluidos	Básico	Avanzado
Precisión de razonamiento	Casi perfecta en el conjunto de pruebas	75 % de Gemini 3 Pro	Comparable
Latencia (primer token)	Pequeña demora (pensamiento)	Más rápida	Variable

En conjunto, Gemini 3 Pro representa una mejora clara respecto a Sonnet 4.5 y rivaliza con el rendimiento del checkpoint no publicado GPT‑5 Zenith, que aún no está disponible públicamente.

Implicaciones para el ecosistema Gemini 3

El checkpoint temprano indica que Google está cerca de lanzar una capa Gemini 3 Pro que impulsará una variedad de productos:

Mejoras en Gemini CLI para desarrolladores.
Capacidades actualizadas del asistente de IA Jules.
Generadores de aplicaciones más sofisticados en AI Studio.

Si el modelo se lanza como una oferta multimodal, podría mejorar drásticamente la utilidad de la suite de IA de Google, posicionándola por delante de competidores como Anthropic y OpenAI tanto en amplitud como en profundidad funcional.

Conclusión

El checkpoint Gemini 3 Pro, aunque accesible solo mediante una rara prueba A/B, muestra un salto significativo en calidad generativa, versatilidad multimodal y poder de razonamiento. Su desempeño en diseño arquitectónico, renderizado 3‑D, simulaciones interactivas y tareas lógicas lo coloca a la vanguardia de los modelos de IA actuales. Asumiendo una estructura de precios similar a Sonnet, Gemini 3 Pro ofrece una excepcional relación precio‑rendimiento que podría redefinir la línea de productos de IA de Google. La comunidad de IA espera con ansias un lanzamiento oficial, que promete elevar el estándar tanto para la investigación como para aplicaciones comerciales.