Aktualizácie, modely a sprievodca migráciou rozhrania Gemini 3 API

Posledná aktualizácia: 12/24/2025
  • Gemini 3 predstavuje hlboké uvažovanie, dlhý kontext a nové modely (Pro, Flash a Pro Image) s nástrojmi ako Search grounding, File Search a URL context.
  • Nové ovládacie prvky API, ako napríklad thinking_level, media_resolution a thoughtSignatures, vám umožňujú vyladiť hĺbku uvažovania, multimodálnu vernosť a pracovné postupy agentov.
  • Migrácia z verzie Gemini 2.5 si vyžaduje prehodnotenie nastavení teploty, predvolených nastavení médií, potrieb segmentácie obrazu a kompatibility nástrojov (napr. Mapy a používanie počítača).
  • Najlepšie výsledky sa dosahujú jasnými pokynmi, zachovávaním myšlienkových podpisov, zaobchádzaním so všetkými modalitami ako s prvotriednymi vstupmi a umiestňovaním otázok na koniec dlhých kontextov.

Aktualizácie rozhrania API Gemini 3

Gemini 3 llega como la generationón más potente de modelos Gemini y viene acompañada de un aluvión de cambios en la API diseñados para desarrolladores que quieren más control, más rendimiento y flujos de trabajo realmente agentic, Integrados en un IDE centrum a agenti v kóde VS. Nové formy gesta a multimodality, nové verzie pre archívy, uzemnenie a uzemnenie, pre túto verziu je nová verzia pre športové prípady.

Este artículo recopila y reordena de forma práctica todas las novedades clave de la API de Gemini relacionadas con Gemini 3 y su evolución desde Gemini 1.5 y 2.x, incluyendo modelos, parametros, herramientas, precisionspraca decios antieso. La idea es que tengas en un único lugar una visión amplia: qué hay disponible hoy, qué ha quedado zastaral, čo sacar partido a las nuevas capacidades y qué debes tener presente si vienes de generationones anteriores.

Evolución de la API de Gemini hasta Gemini 3

História API Gemini je zverejnená v roku 2023 s licenciou gemini-pro, gemini-pro-vision a základným modelom embeddings embedding-001, junto con los canales v1 a v1beta de la API. Desde entonces, la plataforma ha ido creciendo en modalidades, contexto, herramientas y modelos especializados, preparando elreno para las capacidades de razonamiento y agentes que hoy vemos en Gemini 3.

En 2024, Gemini 1.5 Pro y 1.5 Flash sa konsoliduje ako modely pre proporcie so všeobecným kontextom s veľkým kontextom (vrátane verzií s 2M tokenmi) a kompaktných variantov ako gemini-1.5-flash-8b-001, miniatúrne modely s 1.0 starými antiretirandovými verziami. Táto etapa predstavuje nový súbor API, systémové pokyny, režim funkcie a funkcie, formát JSON pre salida a nové možnosti zabezpečenia a kontroly.

Finále roku 2024 a príprava na rok 2025 s prípravou na experimentálne modely Gemini 2.0 Flash a Gemini 2.0 Flash Thinking, obojsmerné streamovanie prostredníctvom živého rozhrania API, multimodálnych más rica (textu, obrázkov a viditeľnosti) a „demode“ vylepšenia Súbežne s lanza gemini-exp-1114 a gemini-exp-1121 ako modelové experimenty sú silné, a sú aktuálne alias gemini-1.5-pro-latest a gemini-1.5-flash-latest pre najnovšie verzie a najnovšie verzie.

Durante 2025, séria Gemini 2.0 y 2.5 amplión s katalógom s optimalizovanými modelmi pre náklady (Flash-Lite), obrazové, video, robótické a natívne audio, ako sú kapacity uzemnenia s Google Search, herramenty a kontextové rozhranie API súboru Naživo. V kontexte sa zavádzajú tambienské politicas de retirada de modelos, ajustes de precios y cambios en la configuración por defekto, preparando el salto a Gemini 3.

Modely Gemini 3

Qué es Gemini 3 y qué modely zahŕňajú

Blíženci 3 sú v novej rodine modelov od spoločnosti Google v centre novej generácie, nových generácií, automatických a komplexných multimodálnych profundov, ide o novú generáciu a kompletné programovanie, výskum a generáciu contenido. Cieľom je, aby boli všetky „výzvy odpovede“ a prevodné a motorové sústavy pre piensan, planifican, laman herramiens y adaptan al contexto de form continua.

Dentro de la serie Gemini 3 v porovnaní s tromi hlavnými modelmi a ukážkou verzie: gemini-3-pro-view, gemini-3-flash-preview a gemini-3-pro-image-preview. Táto špeciálna špecifikácia pre tento typ, pre všetky ostatné základné prvky, kontext a podpora nových kapacít pre API ako myslenie_úroveň, media_resolution a firma pensamiento.

Gemini 3 Pre es el modelo más capaz de la familia, pensado para tareas complejas que requieren amplio conocimiento del mundo, razonamiento profundo en múltiples modalidades y una fuerte orientación a agentes y kódigo. Podporuje kontextový vstup do 1 milióna tokenov a 64 000 tokenov so spotrebou, s prerušením účtovania a energie za rok 2025 a s precíznym zvýšením objemu tokenov.

Gemini 3 Flash es la variante optimizada para velocidad y coste, ofreciendo inteligencia de nivel Pro pero adaptada a aplicaciones de alta demanda, baja latencia y gran volumen, como chat de usuario final, extracción estructurada alebo tareas repetitivas. Porovnajte s miernym kontextom maximálnej úrovne Pro (1M / 64K), mantinel s nesprávnym prerušením konociácie a zistení s precisálnymi významnými hodnotami, ktoré sú spojené s miliónmi tokenov vstupných a výstupných údajov.

Gemini 3 Pro Image (también denominado internamente como Nano Banana Pro) je modelom pre obrázok starostu calidad de la familia, con capacidades avanzadas de generationón y edición, incluyendo renderizado de texto nítido, resoluversciones de hastaquejos 4K apoyan fuertemente en las firmas de pensamiento. Dispone de un contexto de entrada de 65 000 tokens y 32 000 tokens de salida, con una estructura de precios diferenciada entre tokens de entrada de entrada y generationón de imagenes.

Nové parametre API v sérii Gemini 3

Parametre API rozhrania Gemini 3

Una de las grandes novedades de Gemini 3 es la introducion de parametros pensados ​​specificamente para control interno de modelo, el coste and la fidelidad multimodal: thinking_level, media_resolution and las thinkingSignatures. Estos cambios buscan que puedas equilibrar latencia, precio y calidad visual or de razonamiento sin recurrir a trucos de prompt engineering excesivamente complejos.

Ovládanie úrovne myslenia

Los modelos de Gemini 3 utilizan de form nativa un mecanismo de razonamiento dinámico, y el el el new parametro thinking_level te permite establecer el limited maxime of the „pensamiento interno“ antes de que el modelo genere una respuesta. No sa trata de un numero přesné de tokens, sino de niveles relativos que el modelo interpreta como guías de hasta dónde debe pensar.

Nie je špecifická úroveň myslenia, Gemini 3 Pro a Flash používame na úrovni nivel high, que prioriza la calidad del razonamiento sobre la latencia. Cuando tu caso de uso exige respuestas más rapidas y no necesita reflexión profunda (por ejemplo, extracción estructurada, pequeñas transformaciones alebo resúmenes muy directos), puedes limitar el nivel a low para reducir coste y tiempo de respuesta.

Gemini 3 Pro y Flash v porovnaní so základnými úrovňami pensamiento: nízke a vysoké. El modo low minimiza el coste y el tiempo de inicio de la repuesta, ideálne para instrucciones sencillas y aplicaciones de alto priepustnosť; vysoká maximálna hĺbka hĺbok, lo que puede retrasar la aparición of primer token, pero production responses more elaboradas en tareas as análisis estratégico, complejo of problemas matemáticos avanzados.

Gemini 3 Flash zosilňovač a má viac ovládania s minimálnymi a strednými úrovňami, ktoré nie sú dostupné v Gemini 3 Pro. Minimálny režim sa približuje a zodpovedá „sin pensar“ pre starostu USA, nový model, ktorý sa pravidelne spája s ťažkosťami programu, mientras que medium ofrece un equilibrio intermedio entre coste, latitadenciay latenciay

Es importante tener en cuenta que no puedes emplear thinking_level y el parametro heredado thinking_budget en la misma lamada a la API, ya que se producirá un error 400. thinking_budget sa mantien únicamente por compatibilidad con integraciones antiguas, for la recomendación es migrar progresivamente a thinking_level para lograr un control más jasne a preddecible.

Ovládanie verného vizuálneho rozlíšenia média

El parametro media_resolution predstaviť podrobné ovládacie prvky sobre cuántos tokens de contexto with a cada imagen, PDF or photograma de video, lo que te permite as a la calidad de la visión frente al coste y la latencia. Rozlíšenie má viac povolených leer texto a detalles detalles finos, aumentan el consumo de tokens.

Umožňuje konfiguráciu media_resolution a nivel global (prechod na generation_config) z časti pre obsah, konfigurácie ako media_resolution_low, media_resolution_medium, media_resolution_high y, pre rôzne prípady, media_resolution_ultra_high. Si no se establece explícitamente, el modelo aplica valores predeterminados diferentes según el tipo de medio, buscando un equilibrio razonable.

Pre obrázky, odporúčaná konfigurácia s vysokým rozlíšením, bolo priradených 1120 tokenov na základe obrázku a prijatej dostatočnej kalibrácie pre vizuálnu analýzu starostu. Los niveles más bajos (nízke alebo stredné) reparten menos tokens y pueden ser útiles para conjuntos de imágenes grandes donde la prioridad es el volumen y no el detalle fino.

V súboroch PDF, media_resolution_medium (560 tokenov) je možné použiť nasledujúce možnosti: práca, vysoká úroveň výsledkov pre OCR a dokumenty, ktoré pochádzajú z rôznych nákladov a sú medzi nákladmi. Para documentos especialmente densos alebo con maquetados complejos, puedes experimental con high, no no suele Serure Necesario.

Video, z cambia cambia: tanto media_resolution_low ako media_resolution_medium je komprimované s agresívnou formou a pridelených 70 tokenov z fotogramu, dostatočných pre starostu de reconocimiento de acciones a deskripción general. Samostatný text vyžaduje veľa textov a titulkov (subtitúty, panely, prístrojové dosky) tiene sentido pass a media_resolution_high, que puede llegar a unos 280 tokenov z fotografie pre moju prednášku.

Odporúčaná teplota v Blížencoch 3

Bez ohľadu na relevantné rozdiely a predné modely sú pre Blížencov 3 odporúčané teplotné rozdiely podľa hodnoty 1.0, vrátane tých, ktoré sú v súlade s teplotnými rozdielmi podľa určitého determinizmu. Tento model je optimalizovaný pre razonárne korekcie s konfiguráciou a s kontraintuitívnymi účinkami.

Reducer la temperatura en Gemini 3 (pre ejemplo, por debajo de 1.0) Puede Provocar Comportamientos no deseados como bucles, extrañamente rígidas or degradación del rendimiento en tareas de razonamiento complicado y problemas mat. Si tu kódigo heredado ajusta de form agresiva la temperatura, conviene revisar y, en muchos casos, eliminar ese ajuste al migrar a Gemini 3.

Firmas de pensamiento (myslené podpisy) y validación estricta

Las firmas de pensamiento son zastupujúci cifradas del proceso de razonamiento interno de Gemini 3 que el modelo emite en determinadas respuestas y que debes reenviar en llamadas posteriores para konzervar la cade de razonamiento. Son un componente clave para agentes de varios pasos, edición de imágenes conversacional y flujos complejos de llamadas and funciones.

Ako funguje, aplikované rozhranie API je obmedzené na „premeniť sa na aktuálne“: vyžaduje sa myšlienka Podpis, ktorý sa týka chyby 400. Esto afecta tanto a llamadas simples a una sola herramienta como a secuencias de varios pasos (p. ej., consulter un vuelo, recibir resultados, reservar un taxi) ya escenarios de llamadas en paralelo, donde la primera functionCall suele incl.

En generationón de texto o chat estándar, la validación no es estricta, es decir, la API no devolverá un error si omites las firmas, pero la calidad del razonamiento y de las respuestas puede disminuir de manera postrehnuteľné, especialonesselar conceptible, especialonesselar consversacience context Po ello, aunque no sea obligatorio, sa recomienda devolver cualquier thinkingSignature que recibas para mantener el rendimiento del modelo.

En generationón y edición de imágenes con gemini-3-pro-image-preview, la validación vuelve a ser estricta: las firmas están garantizadas en la primera parte tras el razonamiento (texto o inlineData) y en todas las partes inlinecluirs inlineData posterioreal solicitar ediciones o nuevos pasos del flujo vizuálny. De lo contrario, la API devolverá errors 400 y el modelo perderá el hilo sobre la composición original.

Si utilizas los SDK oficiales (Python, Node, Java) a el historial de chat estándar, la buena noticia es que la gestión de thinkingSignatures sa realiza de form automática, por lo que no tendrás que manipularlas manualmente. El trabajo manual solo es necesario cuando construyes wrappers personalizados de bajo nivel o diseñas interacciones fuera de los flujos estándar de los SDK.

Situácie nie sú importované z historickej konverzácie pre iný model (z prvého modelu, Gemini 2.5) o creas bloques de functionCall a mano sin firmas válidas, puedes deaktivar la validación estricta para ese contexto usando un valor ficticio concretoughtSignature: “t „context_engineering_is_the_way_to_go“. Esta cadena se reconoce como un bypass controlado para migraciones y contextos artificiales.

Modelos y herramientas clave en la transición a Gemini 3

Gemini 3 no llega en el vacío: apoya en una larga séria de lanzamientos a retiradas de modelos Gemini 1.5, 2.0 y 2.5, así as en un ecosistema de herramientas para grounding, búsqueda en archivos de códigoción. Entender je contexto te ayuda a decidir qué mantener, qué migrar y qué evitar.

Vo fáze Gemini 2.5 sú modely lanzanov ako gemini-2.5-pro, gemini-2.5-flash, gemini-2.5-flash-lite, verzie natívneho zvuku pre živé rozhranie API, špecifické varianty pre TTS (Flash a Pro) a obrazové modely 3. a 4. obrazové variácie v rôznych verziách modalidades. Paralelament sa predstavil Gemini Robotics-ER 1.5, modely vkladania ako gemini-embedding-001 a deprecan generationones anteriores ako embedding-001 alebo text-embedding-004 s obmedzenými claras.

V herramiente, Gemini 3 podporuje Búsqued Google pre uzemnenie, File Search, kódovanie a kontext URL, administráciu lamady a funkciu pre vaše osobné prispôsobené. Bez embarga, funkčné ako uzemnenie s Google Maps o Počítač Nepoužívať žiadne nové funkcie pre Blížencov 3, pre podobné modely a predné alebo alternatívne alternatívy.

Ceny uzemnenia s Google Search también cambia pre obľúbené flujos agenti dinamicos: opustiť model tarifnej tarify od 35 USD za 1 000 výziev a zaplatiť za tarifu od nás viac ako 14 USD za cenu 1 000 konzultovať. Esto encaja mejor con agentes que mezclan lamadas de búsqueda con otros tipos de acciones.

Nízkoštandardné modely, ako sú deaktivované paulatinamente varianty Gemini 1.5 y 2.x, vrátane gemini-1.5-pro, gemini-1.5-flash, gemini-1.5-flash-8b, rôzne náhľady modelov gemini-progress-flash-2.5. ako gemini-2.5-flash-image-preview, concretas de cierre a finales de 2025 and inicios de 2026. Obliga a planificar migraciones hacia Gemini 2.5 estables or directamente a la serie Gemini 3.

Migrácia pre Gemini 2.5 a Gemini 3

Migrácia medzi Gemini 2.5 a Gemini 3, je dôležitá pre modelové rodiny a rodinné centrum explícitamente in razonamiento, lo que cambia ciertas habituales de prompt engineering. Veľa technických prostriedkov využívaných v rôznych škatuľkách pensamiento, čo vedie k extrémnym detailom, ku kontraprodukciám alebo zbytočným.

Ak je potrebné použiť výzvy, veľa podrobností pre Blížencov 2.5 raz pre vás, pre Blíženci 3 s úrovňou myslenia: „vysoká“ a výzvy sú stručné a priame. Tento model je navrhnutý tak, aby bol razom a hlboko zachytený, pretože nie je potrebné použiť text „coreografía“.

Revisa también cualquier configuración explícita de temperatura en tento kód existujúci: si fijabas valores muy bajos para obtener respuestas deterministas, es probable que prefieras eliminar ese ajuste y confiar en el valor por defekto de 1.0 creniclos paramento en 1.0 tareas complejas. Si de todos modos necesitas controlar parcialmente la variabilidad, hazlo con pequeñas variaciones y pruebas extractivas.

V súvislosti s dokumentmi a súbormi PDF, desať rôznych riešení pre OCR v kambiach, to znamená, že sa mení spotreba tokenov. Migrácia a strata z Blížencov 3 prírastkové ceny pre súbory PDF (podľa starostového rozlíšenia) a, a la vez, znížené pre videá gracias a la compresión as agresiva en media_resolution.

Táto funkcia závisí od segmentácie obrázkov s maskami a jedinečnými pixelmi, šabľa pre Gemini 3 Pro a Gemini 3 Flash nie je doteraz funkčný. V niektorých prípadoch, podľa oficiálnych odporúčaní sa používa Gemini 2.5 Flash s deaktivovaným režimom myslenia Gemini Robotics-ER 1.5, pokiaľ ide o najrôznejšie náklady.

Posledných desať prezentácií pre uzemnenie s Google Maps a počítačovým používaním bez kompatibility s modelmi Gemini 3 a tampoco je podporované kombinovaním herramiens integradas (ako vyhľadávanie) s lamami a funkčnými personalizovanými invocación una misa. Esto condiciona cómo diseñas tus agentes híbridos y puede requerir orquestación de varios modelos.

Kompatibilita s API typu OpenAI a výsledná štruktúra

Para quienes usan una de compatibilidad tipo OpenAI, la transición and Gemini 3 results más suave porque parametros familiares se mapean automáticamente a sus ekvivalentes en Gemini. Tento čas je viditeľný ako logické úsilie, čo sa týka úrovne myslenia v API Gemini.

Conviene saber que el nivel medium de reasoning_effort sa interpretuje ako priorita alta de thinking_level en Blíženci, pre veľké rozdiely medzi týmito pravidlami sú charakteristické znaky strednej éry a intermediálne „neutro“. Pozrite sa na explícitamente thinking_level puede darte un control más fino que delegar todo en la capa de compatibilidad.

Modely Blížencov 3 sú povolené kombinovanou integráciou ako uzemnením s Vyhľadávaním Google, kontextom adresy URL a kódom so štruktúrovanou štruktúrou (podľa JSON) definovaných a schémou odpovede. Esto es especialmente util para agentes que tienen que rascar informationon en tiempo real y volcarla en estructuras limpias para pipelines posteriores.

Paralelne, Gemini 3 Pro Image aprovecha estas capacidades de grounding for general image of basadas and dates current of the mondo real (clima, mercados finančnís, information information) antes de production of the image of alta fidelidad. De esta form se reducen las alucinaciones visuales en contextos donde la precisión factual es critica.

Používajú sa na použitie Gemini 3 Pro a Flash

Forma conseguir buen rendimiento con Gemini 3 cambia ligeramente rešpektovaná a generáciaones anteriores: el modelo prefiere instrucciones claras, razonamiento controlado vía parametros y un manejo cuidadoso del contexto largo. Forzarle con vyzve excesivamente rebuscados puede hacer que "sobreanalice" partes irelevantes.

A nivel de temperatura, la recomendación firme es dejarla en 1.0 salvo que tengas un motivo muy specifico y controlado para modificarla. Gemini 3 ya equilibra creatividad y precisión and est Valor, y los ajustes arbitrarios pueden producir efectos raros que antes is antes arearreglaban la temperatura pero que ahora with abordan mejor con thinking_level.

En cuanto a estilo de salida, Gemini 3 tiende a ser menos verboso por defekto y prioriza respuestas directas y eficientes. Požaduje sa to viac konverzácie o „charla de café“, pedirlo de form explicitita en las instrucciones, indicando el roll, el tono a el nivel de detalle deseado.

Para tareas multimodales, textové trata, obrázky, audio a video ako vstupy do základných tried a haz referencias claras a cada modalidad en tus instrucciones. Toto nastavenie a modelové spojenie s informáciami o tomdos los medios a lugar de procesa ako piezas aisladas, lo que se traduce en reputes mass coherentes cuando combinas, por ejemplo, code fuente, diagramas y descripciones text

Cuando trabajes con contextos muy largos (libros completos, bases de código extensas, vídeos de larga duración), coloca tus preguntas o instrucciones específicas al final del prompt, después del bloque de datos. Používa sa ako doplnok k predchádzajúcim rámcom ako „Predchádzajúce informácie…“ pre tento model pripojený k predchádzajúcemu kontextu.

Gemini 3 marca un salto importante en la API de Gemini al combinar razonamiento de vanguardia, control fino de como piensa y cómo processa medios, nuevas herramientas para grounding y contexto, a marco claro de migración desde Gemini 2.5, as de mododalecayioned agentes flujos complejos con más estabilidad, menos prompt engineering forzado y un control mucho Mayor sobre coste, latencia y calidad de las respuestas.

diseño y construcción de equipos de agentes de ia
Súvisiaci článok:
Diseño y construcción de equipos de agentes de IA: de la estrategia a la puesta en producción
Súvisiace príspevky: