Google выпустила предварительную версию «рассуждающей» ИИ-модели Gemini 2.5 Flash

Автор:

Gemini 2.5 Flash — новая модель искусственного интеллекта от компании Google, расширяющая возможности Flash 2.0 за счёт способности к «рассуждению». Отмечается, что это улучшение было достигнуто «без ущерба для знаменитой скорости и стоимости». Модель уже доступна разработчикам через Gemini API, AI Studio и Vertex AI.

Ключевые особенности Gemini 2.5 Flash:

  • Актуальность данных: январь 2025 года.
  • Мультимодальность: способна обрабатывать запросы в виде текста, графики, видео и аудио.
  • Большое контекстное окно: до 1 млн токенов.
  • Способность к «рассуждению»: модель лучше справляется со сложными и многоэтапными задачами, предоставляет более точные и развёрнутые ответы.

В Gemini 2.5 Flash появилась новая опция — «бюджет на рассуждения» (thinking budget). Разработчики могут самостоятельно определять степень обдумывания запроса моделью, чтобы подобрать приемлемый уровень производительности и цены. Если «бюджет» не задан, модель сама оценивает сложность запроса и определяет необходимые параметры. Для простых запросов, таких как «Сколько штатов в США?», бюджет будет минимальным.

Базовая стоимость Gemini 2.5 Flash составляет $0,60 за миллион токенов. При включении режима рассуждения цена становится $3,50. Чтобы добиться такой же скорости и стоимости, как у 2.0 Flash, разработчикам рекомендуется установить «бюджет на размышления» рамным нулю.

Google заявляет, что в решении сложных задач Gemini 2.5 Flash уступает моделям Gemini 2.5 Pro, ChatGPT-4o, Grok-3 и GPT-4.5, согласно тестам ChatBot Arena. В бенчмарке Humanity’s Last Exam (HLE), который считается более сложным для современных ИИ, Gemini 2.5 Flash показал результат 12%. По этому показателю модель опередила Claude 3.7 Sonnet и DeepSeek R1, но уступила OpenAI o4-mini, набравшей 14%.