Gemini превратили мое сложное исследование в подкаст: Я больше никогда не буду страдать
Переход с Google Assistant на Era Gemini, почти на завершающей стадии. Можно испытывать ностальгию по одноименному виртуальному помощнику, но нельзя отрицать, что появление Gemini действительно изменило то, что может сделать для нас агент на основе искусственного интеллекта.
У Близнецов гораздо лучше развита способность понимать речь. Общение проходит естественно, взаимодействие с приложениями не вызывает затруднений, а интеграция с другими продуктами Google приносит свои плоды. Даже в свободном состоянииGemini превосходит Siri даже на iPhone.
Однако есть некоторые трюки, которые помещают Близнецов в совершенно другую категорию. Глубокие исследования Это одна из тех функций прокси-сервера, которую я использую ежедневно и не перестаю удивляться. В марте Google добавила в арсенал Gemini еще одну полезную функцию: аудиообзоры.
Превратите все в подкаст

Представьте себе, что вы превращаете свои скучные документы, слишком сложную научную работу или академические материалы для чтения в оживленную индивидуальную беседу в формате подкаста. В этом суть функции «Аудиократкие обзоры». Впервые эта функция появилась в неоднократно критикуемом NotebookLM от Google и, наконец, была перенесена в базовый интерфейс Gemini на мобильных устройствах и в веб-браузере.
Вам не нужно проходить какие-либо технические процедуры или писать очень специфичный сценарий, чтобы получить эти настройки звука. Просто загрузите файл из селектора вложений, и слайд «Создать голосовую ленту» появится прямо над окном чата. Нажмите на нее, и подкаст начнет создаваться.
Это может занять несколько минут, но в это время вы можете спокойно переключиться на другое приложение (или окно). После завершения процесса вы получите уведомление о том, что подкаст готов к прослушиванию или отправке другим пользователям.
Аудиообзор обычно представляет собой двустороннюю беседу, протекающую непринужденно и в необычайно естественном тоне. Ощущение такое, будто общаешься с Gemini Live, что само по себе звучит гораздо естественнее, чем у любого умного чат-бота, которым я пользовался до сих пор в режиме голосового общения.
Я бы сказал, что эти подкасты, созданные с помощью искусственного интеллекта, сделаны очень хорошо. Но меня это привлекает по нескольким причинам. Во-первых, большую часть дня я провожу, уставившись в экран, читая статьи для исследования и пишу собственные материалы.

Это оставляет мало места для взаимодействия с любым другим текстовым материалом, будь то академический, деловой или даже развлекательный. Однако если вам удастся просто изменить сенсорный режим взаимодействия с этими материалами, усталость от чтения снизится.
Аудиоподкасты предлагают совершенно новый способ взаимодействия с текстовым материалом, более захватывающий. Это подводит нас ко второй особенности — сенсорной стимуляции, или контрасту. Эта формула хорошо документирована и проверена в академической и профессиональной сфере обучения.
Как это мне помогло?
Усталость от чтения влияет на вашу способность концентрироваться. Из-за этого даже интересная работа кажется вам обязанностью, которую вы просто не можете позволить себе пропустить. Однако взаимодействие с тем же произведением или его сутью через другую сенсорную среду уменьшает этот страх текстовой перегрузки. На самом деле, это помогает и в других отношениях.
«Задействование нескольких органов чувств укрепляет память», — говорит Яссер Насим, эксперт по лингвистике, чьи исследования сосредоточены на модернизации и развитии методов обучения. «Когда мы слушаем и участвуем — читая, пишем или действуя — мозг выстраивает более прочные связи, что облегчает последующее вспоминание».
Насим, который в настоящее время работает экспертом по учебным программам в ведущей компании онлайн-образования, говорит мне, что нельзя полагаться только на один метод обучения. Вместо этого, говорит он, вам нужно комбинировать различные методы, чтобы добиться максимального эффекта: от эмоционального воздействия до сохранения в памяти.

Исследования, опубликованные в журнале, освещают Компьютеры и образование А также то, как студенты посчитали аудиофайлы лучшим учебным и контрольным материалом. Гибкость и сенсорное разнообразие сыграли важную роль в их предпочтении подкастов другим медиа.
«Истинное понимание и долгосрочное запоминание происходят, когда слушание сочетается с визуальными материалами, обсуждениями или практическими занятиями», — добавляет Насим. Мой собственный опыт прослушивания аудиоконспектов Gemini согласуется с его советами. Я лучше запоминаю знания, полученные из аудиоподкастов, чем полученные при чтении того же материала..
Видите ли, эти аудиоподкасты — это не просто преобразование текста в аудио. Вместо этого он превращает скучную стену текста в разговор двух людей, единственным слушателем которого, по сути, являетесь вы. Это благо для любого текстового материала, который не вызывает у вас немедленного интереса и не побуждает к дальнейшему чтению.
В моем недавнем опыте аудиоподкаст Gemini помог мне понять значимость исследовательской работы, посвященной «Структуре интерпретируемого нейронного обучения на основе локальных информационных объективных функций». Проще говоря, в исследовании обсуждалось, как организуются нейроны.
Вы понимаете, что я пытаюсь сказать, да?
Комфорт превыше всего

Комфорт играет важную роль при усвоении информации. А также энтузиазм и волнение по поводу всего процесса. Согласно исследованию, опубликованному в журнале Компьютеры в поведении человекаПодкасты «способствуют удобству, гибкости и доступности информации и знаний». Мне не потребовалось много времени, чтобы это понять.
Живя в столице, для меня ежедневной реальностью является необходимость проводить по 2–3 часа в пробках или в общественном транспорте. Но больше всего боли приносит не дискомфорт, а потерянное время. Аудиоматериалы для обучения — наиболее удобный способ продуктивно использовать это время.
С Близнецами у вас есть еще одно важное преимущество. Нет необходимости полагаться на доступность аудио для конкретной книги, новостной статьи или академического материала. Вы можете просто загрузить любой доступный вам материал, и Gemini превратит его в подкаст-разговор.
Существует множество междисциплинарных исследований, подтверждающих преимущества аудиоподхода к обучению. Речь идет не только о слушании, но и о том, чтобы разложить вещи по полочкам и представить их в более доступной форме.
«Некоторые люди говорили... им нравится, что мы даем им некоторые вещи, которые они не читают в газетах», — цитируют исследователи редактора новостей. «Им нравится тот факт, что… мы пытаемся представить себя по-другому». Научная работа, опубликованная Сиракузским университетом, была опубликована в 2006 году, на самом раннем этапе развития подкастинга.

К 2025 году подкасты стали настоящим феноменом потребления информации: от образовательных материалов до развлечений. В соответствии с Pew Research CenterПочти половина американцев участвовали в подкастах. Более половины опрошенной аудитории слушают подкасты, чтобы учиться, развлекаться или просто послушать музыку, занимаясь чем-то другим.
Почти треть из них хотели услышать мнение других людей, а еще один большой сегмент находился в сети, чтобы следить за новостями и текущими событиями. Мой пост не сильно отличался от вышеприведенного шаблона. Для длинных журналистских работ или расследований мне часто больше подходит их подкаст-версия.
Более эффективно
Интересно, что подкасты, похоже, также способствуют практическим изменениям. Около двух третей слушателей заинтересовались книгой или фильмом после прослушивания подкаста, более половины аудитории начали подписываться на кого-то в социальных сетях, а треть внесли изменения в образ жизни, например, занялись спортом или изменили свой рацион питания.
Опубликованные основные моменты исследования Журнал маркетинга в социальных сетях Такие концепции, как замещение медиа и функциональное сходство в контексте прослушивания медиа и готовности аудитории. Основная идея заключается в том, что пользователи оценивают медиа и выбирают те медиа, которые им больше всего подходят.
«Что касается специфичности контента подкаста, то его влияние на готовность слушать и замену медиа является положительным, что говорит о том, что уникальный контент, высокое качество и широкое разнообразие заставляют людей хотеть слушать подкасты», — говорится в исследовании. Я лично также подтверждаю достоверность этого результата.
— Nadeemonics (@nsnadeemsarwar) 30 марта 2025
За последние несколько дней я «конвертировал» в форму подкастов несколько исследовательских работ, в которых обсуждалось влияние потребления клетчатки, мяса и упакованных продуктов на режим сна, когнитивное здоровье и здоровье кишечника. По сравнению с откровенно техническим тоном научных статей, объяснение результатов двумя ведущими «эмоциональным» и «убедительным» тоном оказало на меня заметно более глубокое воздействие.
Подумайте об этом как об изучении правил социального этикета или культурных особенностей по книге. Спустя годы вы действительно видите эти вещи своими глазами. Или подумайте о том, чтобы изучать иностранный язык по книге, самостоятельно, и о том, как это меняет дело, когда вы учитесь у человека, который наполняет ваши уши всеми этими знаниями.
Последний метод дает лучшие результаты. Это происходит главным образом потому, что комплексный эффект мультисенсорного взаимодействия ускоряет процесс обучения или делает его более эффективным. Аудиообзоры Gemini оказали аналогичный эффект и очень мне помогли.
Некоторые препятствия
Несмотря на всю свою эффективность, функция голосового обзора в Gemini не идеальна. Суть прекрасно написанной истории может потеряться при попытках ее «подкастовать», или могут быть упущены некоторые мелкие детали. Есть также некоторые функциональные странности. Продолжительность аудиообзора, которая прямо пропорциональна глубине исходного материала, может быть совершенно произвольной.
Например, когда я скормил Gemini 260-страничную книгу по теме спряжения и морфологии глаголов в персидском языке, аудиообзор, сгенерированный Gemini, длился чуть более семи минут. В качественном плане он охватывал наиболее важные части, но упускал из виду более тонкие детали.
В другом случае я превратил четырехстраничный подробный исследовательский документ в аудиоподкаст. Подкаст длился около 13 минут. К сожалению, функция Auto Tasks в Gemini не позволяет вам регулировать длительность или глубину разговора в голосовом обзоре.
Если вы используете Google NotebookLM, где впервые появилась функция аудиообзора, вы можете написать подсказку, которая определит глубину разговора в подкасте. Несколько недель назад я создал аудиоподкаст продолжительностью 59 минут на NotebookLM.
Близнецы вам этого не позволят. еще нет.
Затем у нас есть языковой барьер, поскольку Google в настоящее время работает над улучшением всего конвейера за пределами английского языка. Еще одной проблемой было произношение, взятое из английского языка. Например, ведущий подкаста на базе искусственного интеллекта неправильно произнес персидское слово «Raf-thin» как «Raaf-tin».
Для неподготовленного уха, незнакомого с двуязычными лингвистическими различиями между английским и персидским переводами или с тем, как акценты влияют на слуховое восприятие слов на другом языке, ведущие подкастов на основе искусственного интеллекта могут нести полную чушь.
По моему общему опыту, «аудиообзоры» Gemini не являются революционными. Он просто предлагает другой, более увлекательный способ взаимодействия с контентом. Это не всегда работает, но определенно избавляет от скуки при чтении страниц текста, которые в противном случае усыпили бы вас.
Комментарии закрыты.