Gemini 3.5 Flash – Google stawia na szybkie i tanie agenty – News

Flash, który dogania model Pro

Google przedstawił Gemini 3.5 Flash jako swój najpotężniejszy dotąd model do kodowania i zadań agentowych. Co istotne, w części wymagających benchmarków przewyższa większy model Gemini 3.1 Pro. Osiąga 76,2 proc. na Terminal-Bench 2.1, 83,6 proc. na MCP Atlas oraz 84,2 proc. w teście rozumienia multimodalnego CharXiv Reasoning. W zestawieniu GDPval-AA notuje z kolei wynik 1656 Elo.

Najmocniejszym argumentem nie jest jednak sama jakość. Liczy się tempo. Według Google model generuje tokeny około cztery razy szybciej niż rynkowa czołówka. W indeksie Artificial Analysis trafia prosto do prawego górnego rogu – tam, gdzie wysoka inteligencja spotyka się z ekstremalną prędkością. Do tego dochodzi okno kontekstu liczące ponad milion tokenów wejściowych i 65 tysięcy tokenów wyjściowych oraz pełna obsługa danych multimodalnych: tekstu, obrazu, audio, wideo i plików PDF.

Nasz komentarz: Najciekawsze w 3.5 Flash jest to, że szybki i tani model przestaje być kompromisem – dogania większego brata akurat w zadaniach agentowych, które ciągną się przez wiele kroków.

Cena, która zmienia opłacalność agentów

Cennik startuje od 1,5 dolara za milion tokenów wejścia i 9 dolarów za milion tokenów wyjścia. Z kolei buforowanie kontekstu kosztuje zaledwie 15 centów. Google wprost zaznacza, że długie zadania agentowe potrafią tu kosztować ponad połowę mniej niż u bezpośredniej konkurencji. Przy procesach, które wcześniej zajmowały programiście dni, a audytorowi całe tygodnie, taka różnica w cenie decyduje o opłacalności wdrożenia.

Z perspektywy widoczności w wyszukiwaniu liczy się jednak coś zupełnie innego. Gemini 3.5 Flash jest powszechnie dostępny nie tylko przez API w Google AI Studio, Android Studio czy platformę Google Antigravity. Trafił również do aplikacji Gemini oraz trybu AI Mode w samej wyszukiwarce Google. To właśnie tam model decyduje, które treści zacytować i ostatecznie streścić użytkownikowi.

Szybszy i tańszy model w warstwie wyszukiwania oznacza jedno. Odpowiedzi generowane przez AI będą obejmować coraz więcej zapytań – w tym tych długich i wysoce złożonych. Dla marek przesuwa to punkt ciężkości z klasycznego rankingu w stronę optymalizacji pod kątem tego, czy treść jest dla modelu w ogóle zrozumiała i godna zacytowania.

W skrócie

Gemini 3.5 Flash – zadebiutował na Google I/O 2026 i w części testów kodowania oraz zadań agentowych wyprzedza Gemini 3.1 Pro.
Atutem jest połączenie prędkości – około czterokrotnie szybsze generowanie tokenów idzie w parze z niskim cennikiem (1,5 dolara za milion tokenów wejścia i 9 dolarów za milion wyjścia).
Obecność w trybie AI Mode – model trafił do wyszukiwarki Google, więc realnie wpływa na to, jak treści są streszczane i cytowane w odpowiedziach AI.

Opracowanie redakcyjne na podstawie artykułu Google (blog): https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-5/