Google анонсировал быстрый и экономичный ИИ Gemini 2.5 Flash: доступен для разработчиков и пользователей

Google представил предварительную версию своей улучшенной модели искусственного интеллекта Gemini 2.5 Flash, которая отличается высокой быстротой и гибкостью. Разработчики могут получить к ней доступ прямо сейчас через API Gemini, используя Google AI Studio и Vertex AI. Кроме того, модель доступна для пользователей в приложении Gemini. Для тестирования без подключения VPN можно воспользоваться платформой BotHub.

Эта версия, созданная на основе Flash 2.0, предлагает более стабильную логику и оптимизирована для увеличения скорости и экономичности.

Google называет её гибридной моделью, которая позволяет разработчикам регулировать уровень «думающей» активности системы. Пользователи могут устанавливать бюджеты для достижения оптимального баланса между качеством, временем отклика и затратами.

Даже без режима «мышления» Gemini 2.5 Flash демонстрирует лучшие результаты по сравнению с предыдущей версией. Включение этого режима повышает качество вывода, но и стоимость возрастает — с 0,004 до 3,50 долларов за ответ.

Несмотря на увеличение цен, эта модель по-прежнему более доступна, чем аналогичные системы. Только o4-mini от OpenAI предлагает схожее соотношение цены и качества.

Запуск Flash дополняет более широкий спектр гибридных моделей логического вывода Gemini 2.5 от Google. Если Flash акцентирует внимание на скорости и доступности, то Gemini 2.5 Pro ориентирован на решение более сложных задач с полным логическим выводом и мультимодальной поддержкой.

Gemini 2.5 Pro является самой мощной моделью Google на данный момент и уверенно лидерствует в нескольких тестах производительности. Она справляется с математическими, научными и программистскими задачами, получив 18,8% в «Последнем экзамене человечества» и 63,8% в SWE-Bench Verified. Модель Pro доступна через Google AI Studio и подписчикам Gemini Advanced.

Однако Gemini 2.5 Pro имеет более высокую стоимость. Входные токены стоят 1,25 доллара за миллион при запросе до 200 000 токенов и 2,50 доллара за миллион, если количество превышает 200 000. Выходные токены, включая отказные, стоят 10 долларов за миллион при запросе до 200 000 токенов и 15 долларов, если запрос превышает эту сумму.

Таким образом, Gemini 2.5 Flash и Pro предоставляют разработчикам широкие возможности в выборе скорости, стоимости и вычислительной мощности. Это часть обширной стратегии Google по разработке масштабируемых AI-решений для различных сценариев использования.

Источник