Google Gemini теперь поддерживает загрузку аудиофайлов и других новых типов файлов.
В течение нескольких месяцев приложение Gemini от Google могло обрабатывать загруженные изображения, PDF-файлы и даже видео, но звук в нём заметно отсутствовал. Сегодня ситуация меняется. Google без лишнего шума внедрила одну из самых востребованных функций Gemini: загрузку аудиофайлов.

Более широкая поддержка, больше применений
Долгожданная функция

Вице-президент Google Labs и Gemini Джош Вудворд подтвердил: Запуск функции на XОбновление, которое называют «Запросом №1», теперь доступно на Android, iOS и в Интернете и позволяет добавлять MP3, WAV и большинство других популярных форматов, нажав на знакомую опцию «Загрузить файлы».
Как вы можете себе представить, существуют некоторые ограничения. Для пользователей Gemini с бесплатной подпиской Загружайте до 10 файлов одновременно, но общая продолжительность аудиозаписей не должна превышать 10 минут. Если вы подписаны на платные тарифы Google — Gemini Advanced через AI Pro или AI Ultra, — этот лимит значительно увеличивается — до трёх часов.
✅ Исправлен Papercut: теперь вы можете загрузить любой файл в @GeminiApp. Включая запрос №1: теперь поддерживаются аудиофайлы! pic.twitter.com/4Te3xwLC6W
— Джош Вудворд (@joshwoodward) 8 сентября, 2025
Хотя это и не безгранично, это довольно щедро. Для сравнения, это всё ещё Загрузка видео на Gemini Бесплатные пользователи ограничены пятью минутами, а платные — одним часом. Аудио удваивает этот бесплатный лимит, предлагая в три раза больше места для платных подписчиков, что удобно для таких задач, как расшифровка, анализ заметок совещаний или анализ подкастов.
Отсутствие поддержки аудио стало странным упущением с момента появления функции загрузки файлов в начале этого года. Gemini уже мог делать краткие обзоры видео на YouTube и обрабатывать короткие клипы, но записать короткое голосовое сообщение и передать его ИИ для работы с ним до сих пор было невозможно.
Благодаря этому Gemini приближается к функционалу конкурентов, таких как ChatGPT от OpenAI, который уже несколько месяцев поддерживает загрузку аудио и текста. Остаётся вопрос: хватит ли 10 минут для обычного пользователя? Это несоответствие говорит о том, что Google хочет сделать обработку аудио ещё одним стимулом для подписчиков. В любом случае, если вы ждали возможности загрузить в Gemini фрагмент подкаста, фрагмент лекции или даже собственные голосовые заметки, сейчас самое время попробовать.
Комментарии закрыты.