Модели ИИ: колоссальные возможности, но они не подходят для индустрии видеоигр

По мере развития инструментов искусственного интеллекта нас постоянно подталкивают к делегированию им сложных задач. Большие языковые модели могутLLM) Написание электронных писем, создание презентаций, разработка приложений, создание видео, поиск в Интернете и обобщение результатов и многое другое. Однако есть одна вещь, с которой мне по-прежнему очень трудно справиться — это видеоигры.

В этом году две крупнейшие компании в области искусственного интеллекта (Microsoft и Anthropic) попытались заставить свои модели создавать игры или играть в них, и результаты, вероятно, оказались гораздо более ограниченными, чем ожидают многие. Это подчеркивает текущие проблемы в области генеративного ИИ, особенно в задачах, требующих долгосрочного стратегического планирования и принятия сложных решений.

Это делает их идеальной демонстрацией того, на что на самом деле способен генеративный ИИ сегодня. Короче говоря, он может делать гораздо больше, чем раньше, но он не может делать всё. Это свидетельствует о том, что генеративный ИИ все еще находится на стадии разработки и, несмотря на растущие возможности, в некоторых областях он по-прежнему сталкивается с ограничениями.

Microsoft выпускает Quake II с искусственным интеллектом

Производство видеоигр сталкивается с проблемами, аналогичными тем, что встречаются в видеопроизводстве, где движение становится странным и искаженным, а искусственный интеллект начинает терять связь с «реальностью» по истечении определенного периода времени. Последняя попытка Microsoft, которая Попробовать может любой желающий.Это версия, созданная искусственным интеллектом Quake II.

Я играл в эту игру несколько раз, и это действительно странный опыт: из ниоткуда появляются дезориентирующие враги, а окружающая обстановка меняется по мере вашего движения. Много раз, когда я входил в новую комнату, дверной проем исчезал, когда я поворачивался к нему лицом, а когда я снова смотрел вперед, стены двигались.

Игра длится всего несколько минут, после чего останавливается и предлагает начать новую игру, но если вам не повезет, она может перестать правильно реагировать на ваши действия еще до этого.

Тем не менее, это замечательный опыт, и я думаю, было бы полезно, если бы его увидело больше людей. Это позволит вам лично убедиться в том, в чем хорош генеративный ИИ и каковы его текущие ограничения. Хотя впечатляет, что нам вообще удалось создать интерактивную видеоигру, трудно представить, что кто-то сможет поиграть в эту технологическую демонстрацию и поверить, что следующая Assassin's Creed будет создана искусственным интеллектом.

Однако подобные идеи и предположения существуют, во многом потому, что люди сейчас не могут не слышать об ИИ. Даже если вас вообще не волнует ИИ, он все равно будет навязываться вам везде, куда бы вы ни пошли. Проблема в том, что информация, которую получает среднестатистический человек, почти полностью состоит из маркетинговых комментариев крупных технологических компаний и комментариев руководителей, подхваченных новостными изданиями.

Это означает, что они слышат преувеличенные и противоречивые утверждения, подобные следующим:

Он способен решить некоторые из крупнейших мировых проблем, такие как изменение климата, нищета и болезни. (Билл Гейтс)

Вполне вероятно, что в 2025 году мы в Meta, наряду с другими компаниями, которые в первую очередь работают над этим, будем иметь ИИ, который сможет выступать в роли инженера среднего звена в вашей компании и эффективно писать код. (Марк Цукерберг)

Эффективное использование ИИ теперь является основным ожиданием для всех в Shopify. Сегодня это инструмент для всех профессий, и со временем его значение будет только возрастать. Честно говоря, я не думаю, что можно избежать освоения навыков применения ИИ в своем бизнесе. (Тоби Лютке, генеральный директор Shopify)

Теперь мы уверены, что знаем, как создать общий искусственный интеллект (ОИИ) в том виде, в котором мы его традиционно понимаем. Мы считаем, что в 2025 году мы можем увидеть первых агентов ИИ, которые «войдут в состав рабочей силы» и кардинально изменят методы производства компаний. (Сэм Альтман, генеральный директор OpenAI)

Искусственный интеллект более опасен, чем, скажем, неправильное проектирование самолетов, плохое техническое обслуживание производства или некачественное производство автомобилей, в том смысле, что он имеет потенциал — пусть и небольшой, но не тривиальный — уничтожить цивилизацию. (Elon Musk)

Все это звучит немного перебор, не правда ли? Предполагается, что он спасет нас и уничтожит одновременно, станет одновременно инструментом для профессионалов и инструментом, который их заменит, — и похоже, что уже в этом году мы можем получить ИИ научно-фантастического уровня. Когда люди слышат все это, они начинают ожидать удивительных вещей от этих гаджетов и считают, что все офисные работники проводят свои дни, разговаривая со своими компьютерами, как персонажи «Звездного пути».

Однако реальность выглядит иначе. Реальность похожа на Quake II — трясущаяся и размытая, с неразборчивыми очертаниями врагов. Модели LLM уровня ChatGPT уже стали захватывающим прорывом в 2022 году и доставили массу удовольствия всем желающим, однако для большинства задач, которые нам сейчас предлагают крупные технологические компании, ИИ просто недостаточно эффективен. Уровень точности очень низкий, способность следовать инструкциям очень низкая, диапазон контекста очень мал, и их обучают только интернет-тарабарщине, а не реальным знаниям.

Но создание видеоигры — чрезвычайно сложная задача: в конце концов, на создание подобных вещей уходят годы работы целых команд людей. А как насчет того, чтобы вместо этого поиграть в видеоигры?

Клод «играет» в Pokémon Red

Оказывается, люди экспериментируют и в этой области. Последняя модель от Anthropic, которая Клод 3.7 Сонет , Он играет Pokémon Red на Twitch Он существует уже около двух месяцев и за это время продемонстрировал наилучшие результаты среди всех больших языковых моделей (LLM) при игре в Pokémon. Однако есть небольшая оговорка: он все еще значительно отстает от среднего уровня 10-летнего ребенка.

Одной из проблем является скорость: Клоду приходится совершать тысячи действий в течение нескольких дней, чтобы, например, пересечь Виридианский лес. Это отражает трудности, с которыми сталкивается ИИ при решении сложных задач.

Почему это занимает так много времени? Дело не в том, что он не может понять, как побеждать в битвах с покемонами стратегически — на самом деле, это у него хорошо получается. С другой стороны, ориентироваться в окружающей среде и избегать деревьев и зданий — не так уж и хорошо. Клод никогда не обучался игре в покемонов, и ему нелегко понять пиксельную графику и то, что она собой представляет. Эти трудности подчеркивают разрыв между способностью обрабатывать данные и способностью взаимодействовать со сложными средами.

Прохождение через лабиринтообразные местности, такие как гора Мун, дается ему особенно трудно, поскольку ему приходится прилагать усилия, чтобы составить карту местности и избежать повторения своего пути. Однажды он настолько застрял в углу, что решил, что игра сломана, и подал официальный запрос на сброс игры. Это показывает, что ИИ, несмотря на свои передовые возможности, по-прежнему не обладает интуитивным пониманием, которым обладают люди.

Эти первые попытки также не обошлись без забавных моментов.

Однажды Клод застрял в углу и, убедившись, что что-то не так, написал официальный запрос на сброс игры. pic.twitter.com/5RIiCJdxCM— Антропный (@AnthropicAI) 25 февраля 2025

Он также плохо помнит свои цели, вещи, которые он уже попробовал, или места, которые он посетил раньше.

Причина этого очень проста: большие языковые модели (LLM) имеют ограниченное «контекстное окно», которое служит их памятью. Они могут хранить лишь определённый объём информации, и как только Клод достигает предела, он сжимает то, что есть, чтобы освободить место для большего. Таким образом, информация вроде «посетил Виридиан-Сити, вошёл в каждое здание и поговорил с каждым NPC» может быть сжата до простого «посетил Виридиан-Сити», что побудит Клода вернуться и проверить, есть ли в городе что-нибудь, чем может заняться Плюс.

Короче говоря: Клод не может понять, куда он идет, натыкается на стены, путается в случайных предметах и неигровых персонажах, забывает, где он был и что пытается сделать, и каждое принимаемое им решение требует многих абзацев размышлений. Это не критика — это захватывающие эксперименты, которые расширяют границы возможностей больших языковых моделей (LLM).

Но при всей шумихе вокруг ИИ людям важно увидеть такие демонстрации и сформировать собственное мнение об ИИ. Некоторые люди пытаются продать идею о том, что мы вот-вот достигнем пика интеллекта, что через несколько лет искусственный интеллект (ИИ) превзойдет даже самых умных людей, но я не думаю, что они честны, они просто продавцы. Мы еще далеки от пика, все только начинается.