Типы агентов ИИ и их использование: подробное объяснение

Краткое содержание:

Существует 7 различных типов агентов ИИ: от простых реактивных агентов до многоагентных систем.
В настоящее время ведущие компании в сфере ИИ в первую очередь сосредоточены на создании целевых агентов, а также обучающихся агентов.
В будущем мы, возможно, увидим по-настоящему автономных агентов ИИ, которые смогут взаимодействовать с другими агентами ИИ для выполнения множества задач.

Очевидно, что ИИ-агенты, ориентированные на действия, возглавят революцию ИИ, и первые признаки этого уже есть. От чат-ботов на базе искусственного интеллекта до агентов на базе искусственного интеллекта, которые могут читать ваши электронные письма и записываться на прием, мы приближаемся к эпохе агентов. Чтобы лучше понять агентов ИИ, я подробно объяснил различные типы агентов ИИ. Кроме того, я перечислил ведущие компании и существующие ИИ-агенты, уже доступные на рынке. Итак, начнем.

1. Агенты с простыми реакциями

Начнем с самого простого типа агентов ИИ: агентов с простыми реакциями. Как следует из названия, эти агенты выполняют действия на основе текущей информации, следуя условию «если-то». Например, термостат включает отопление, когда температура опускается ниже определенной отметки. Он просто выполняет действие, когда условие истинно.

Однако у этого типа ИИ-агентов есть несколько ограничений. Он учитывает только текущую информацию (также называемую «восприятием» или восприятием). Он не запоминает предыдущие показания температуры и не учитывает будущие показания — он действует только на основе текущей температуры.

Простые реактивные агенты не имеют памяти и действуют только тогда, когда окружающая среда полностью наблюдаема — в состоянии, в котором доступна вся информация, необходимая для принятия решения. В результате он не сохраняет внутреннего представления или модели мира.

2. Модельные отражающие агенты

Далее, отражающие агенты на основе моделей улучшают эффективность простых отражающих агентов. Этот тип агента сохраняет внутреннее представление о мире и, следовательно, обладает памятью. По сути, эти агенты отслеживают действия и то, как они влияют на мир, а также обновляют внутреннюю модель/представление. Например, беспилотный автомобиль, двигаясь в потоке транспорта, запоминает местоположение транспортных средств, даже если они изменили свое текущее местоположение. Такое внутреннее представление позволяет принимать более обоснованные решения.

Теперь, основываясь на прошлых наблюдениях и текущей информации, агент создает внутреннее представление о мире и предпринимает желаемое действие. Это означает, что рефлексивные агенты на основе моделей могут работать в частично наблюдаемых средах. По сути, внутренняя модель используется для прогнозирования следующего действия. Эта модель основана на передовых алгоритмах искусственного интеллекта.

3. Целевые агенты

Как следует из названия, целеустремленные агенты ориентированы на результат, то есть они рассматривают будущие действия, которые приблизят их к конечной цели. Эти агенты могут проводить исследования, планировать операции и рассматривать различные последовательности действий, которые приведут их к желаемой цели. Действующие по целям агенты основывают свои действия на учете будущих последствий.

Например, GPS-навигатор, который планирует ваш маршрут, должен искать и учитывать все дороги, ведущие к пункту назначения. Он учитывает все возможные маршруты с учетом расстояния, продолжительности, текущей ситуации на дорогах и т. д. Теперь на основе этой информации целевой агент планирует и выбирает наилучший путь для достижения желаемого пункта назначения. Этот тип агента необходим в приложениях ИИ, требующих стратегического планирования.

4. Агенты, работающие на основе льгот

Агенты, ориентированные на полезность, являются разновидностью целевых агентов, но они не привязаны к конкретной цели. Например, целеустремленные агенты мыслят только в терминах достижения или недостижения цели – бинарно. Однако агенты, ориентированные на полезность, рассматривают различные состояния мира, оценивают различные результаты на основе сложных предпочтений, а затем выбирают действие, которое максимизирует их «полезность».

Этот тип агента работает, присваивая числовую оценку различным последовательностям действий и выбирая только то действие, которое обеспечивает наивысшую оценку полезности. Агенты, основанные на полезности, разрабатываются для ситуаций, когда результат неопределен. Например, целью торговой системы на базе искусственного интеллекта может быть максимизация прибыли, но она также должна учитывать, какой уровень риска может допустить пользователь, и каковы текущие рыночные условия. Это требует тщательного анализа потенциальных рисков и доходности.

По сути, агенты, ориентированные на полезность, рассматривают различные предпочтения и оценивают результаты, прежде чем принять решение. Их цель — не просто достичь цели, но и сбалансировать различные факторы, чтобы найти оптимальное действие. Это означает, что они стремятся максимизировать «ожидаемую полезность» на основе всесторонней оценки обстоятельств.

5. Обучающиеся агенты: повышение производительности в системах ИИ

Обучающиеся агенты по определению способны со временем повышать свою эффективность, извлекая уроки из прошлого опыта. Лучшая особенность обучающихся агентов — их способность адаптироваться к незнакомым условиям и оптимизировать свои действия на основе обратной связи. В обучающих агентах есть «критический» компонент, который обеспечивает обратную связь о том, насколько хорошо работает агент, что имеет решающее значение для процесса обучения.

Для иллюстрации рассмотрим, как работают спам-фильтры для электронных писем. Для начала спам-фильтры имеют базовый набор правил; Однако по мере того, как вы продолжаете отмечать электронные письма как спам, агент учится на основе предоставленных оценок («критика») и адаптирует свое поведение. Теперь, в будущем, такие письма будут автоматически помечаться как спам и перемещаться в другую папку. Этот процесс основан на передовых алгоритмах в области машинного обучения.

6. Агенты пирамиды

Иерархические агенты — это тип агентов, которые разделяют сложные цели на подцели. Существует множество сложных задач, требующих многоэтапных процедур и решения проблем. В таких случаях задачи разбиваются на более мелкие, более управляемые подзадачи, которые организуются в иерархию. Теперь эти задачи делегируются агентам низшего уровня, а агенты более высокого уровня контролируют стратегию и конечный результат.

Например, когда вы просите робота с искусственным интеллектом приготовить ужин, высокоуровневый агент планирует и разделяет задачу, например, готовит пасту и соус. Затем эти задачи разбиваются на более мелкие, например, включение плиты и добавление воды в кастрюлю. Теперь, таким иерархическим образом, задача выполняется от одного слоя к другому. Такой подход позволяет эффективно и результативно выполнять сложные задачи, что имеет решающее значение в современных приложениях ИИ.

7. Многоагентные системы

Наконец, мы приходим к многоагентным системам (МАС), которые объединяют несколько независимых агентов для достижения общей цели. Эти системы позволяют нескольким агентам общаться, взаимодействовать, координировать потенциальные действия, вести переговоры и сотрудничать друг с другом. В таких системах каждый агент действует независимо и имеет собственную возможность принимать решения.

Однако все агенты должны соблюдать общий протокол многоагентных систем, чтобы избежать конфликтов и достичь общей цели. Например, в системе цепочки поставок несколько агентов отслеживают запасы, еще один агент отчитывается перед отделом закупок на основе требований к запасам, агент по логистике находит оптимальный маршрут доставки и т. д. Многоагентные системы являются эффективным решением сложных задач, требующих координации и сотрудничества между независимыми субъектами.

Действующие агенты ИИ от ведущих технологических компаний

На рынке уже представлено множество типов агентов ИИ. Такие компании, как OpenAI, Google, Microsoft, Anthropic, Salesforce и многие другие, создают ИИ-агенты и фреймворки для эффективного использования возможностей целевого ИИ. Ниже приведены некоторые ИИ-агенты, с которыми вы можете ознакомиться, при этом следует помнить, что эти инструменты все еще находятся в стадии непрерывной разработки и совершенствования.

OpenAI

OpenAI — первая компания, запустившая Оператор ИИ-агент Ориентированный на потребителя. Это агент, который использует компьютер для автоматизации задач в интернете. Оператор может взаимодействовать с веб-браузерами и выполнять действия, нажимая на кнопки, печатая и проводя пальцем. С его помощью можно заполнять формы, бронировать авиабилеты, заказывать продукты и многое другое. Однако он пока не полностью автономен. Вам придётся вручную совершать платежи и вводить CAPTCHA при необходимости. Этот агент — важный шаг на пути к разработке искусственного интеллекта, способного эффективно выполнять сложные задачи.

Оператор, скорее всего, относится к категории целеустремленных и обучающихся агентов. Он ориентирован на цель и учится в процессе взаимодействия с веб-сайтами. Кроме того, это делает Агент глубоких исследований OpenAI Выполняет сложные многоэтапные исследовательские задачи и анализирует текст, изображения и PDF-файлы для создания комплексного отчета. Я бы сказал, что это комбинация целевого агента, обучающегося агента и иерархического агента, который разбивает задачи на более мелкие подзадачи. Эти возможности делают его мощным инструментом для исследователей и аналитиков.

Кроме того, OpenAI сообщает, что последняя версия o3 и o4-мини Это не просто модели ИИ, а агентоподобные системы ИИ. Эти новые системы ИИ ведут себя как агенты и могут взаимодействовать с широким спектром инструментов, включая веб-поиск, интерпретаторы Python, анализ изображений и Plus. Это агенты, основанные на моделях и целях. Эти системы представляют собой значительный шаг вперёд в развитии возможностей ИИ.

Наконец, еще одним типом агента ИИ является новейший инструмент Codex CLI от OpenAI, который позволяет разработчикам читать, редактировать и запускать код из терминала. Он может автоматически исправлять ошибки, создавать новые функции и изменять файлы. Опять же, это целевой агент, созданный с использованием обучающего агента. Этот инструмент значительно повышает производительность труда разработчиков.

Google

На данный момент Google запустил только Агент глубокого исследования ИИ на Gemini, который работает аналогично агенту OpenAI. Он может просматривать веб-страницы, находить необходимую информацию и компилировать ее для создания комплексного отчета по любой теме. Я классифицирую этого агента как целенаправленного, обучающегося агента, что делает его передовым в области искусственного интеллекта.

Затем Google представила проект Mariner, который все еще находится в стадии разработки. Этот проект работает как агент ИИ-оператора OpenAI и может автоматизировать задачи в браузере Chrome. Он может анализировать активный экран и выполнять действия на веб-сайтах. Google сообщает, что агент тестируется доверенными тестировщиками и будет выпущен в ближайшем будущем.

Кроме того, Google представил Протокол Агент2Агент (A2A) Новое позволяет нескольким агентам ИИ общаться друг с другом. Это не сам агент, а стандарт/фреймворк, который позволит создавать многоагентные системы (MAS).

Антропный

Как и OpenAI, Anthropic представила своего ИИ-агента «Computer Use» (в настоящее время находящегося в стадии бета-тестирования), который может взаимодействовать со средами настольных компьютеров. Он может анализировать экран, нажимать, печатать и выполнять файловые операции. Он не ограничивается только веб-браузерами, но также может выполнять действия на уровне операционной системы. Излишне говорить, что это целенаправленный обучающийся агент.

Кроме того, компания Anthropic недавно выпустила поисковый инструмент с интеграцией с Workspace on Cloud. Он может подключаться к вашей почте Gmail, календарю и диску, а также к Интернету для проведения исследований и извлечения аналитических данных. Аналогично, Claude Code — это инструмент прокси-кодирования, работающий внутри Терминала. Понимает кодовую базу и может изменять файлы, запускать тесты, а также взаимодействовать с Git. Оба являются целеустремленными агентами.

Наконец, компания Anthropic разработала протокол контекста модели (MCP) — открытый стандарт для подключения моделей ИИ к внешним источникам данных, позволяющий агентам ИИ надежно работать в сервисах без API. Хотя он не является агентом, он обеспечивает связь между моделями ИИ, инструментами, веб-сайтами и другими источниками данных. Вы можете узнать как Настройка MCP в облаке на Windows и macOS.

Microsoft

В сфере потребительских услуг компания Microsoft анонсировала несколько новых ИИ-агентов для своего чат-бота Copilot. Агент может Глубокие исследования в Copilot Проводите многоэтапные исследования для создания комплексных отчетов по конкретным темам. Кроме того, он может Действия второго пилота Бронируйте билеты, бронируйте места и приобретайте товары через Интернет. Однако это работает только на партнерских сайтах.

Для предприятий компания Microsoft недавно анонсировала агента Computer Use AI в Copilot Studio. Он может напрямую взаимодействовать с веб-сайтами и настольными приложениями для выполнения действий и не полагается на специализированные API. Microsoft также представила агента Security Copilot, который поможет с оповещениями о фишинге, защитой данных и управлением идентификацией — важнейшими компонентами кибербезопасности предприятия.

Microsoft разработала несколько агентов Copilot для корпоративных клиентов, и вы даже можете создать собственного ИИ-агента для своего рабочего процесса. Вы можете начать работу в Copilot Studio и подключить серверы MCP, API и внешние источники для автоматизации задач, повышения производительности труда и сокращения потенциальных ошибок.

Salesforce

Помимо Microsoft, компания Salesforce разработала платформу Agentforce для корпоративных клиентов, которая предоставляет автономных и настраиваемых агентов на базе искусственного интеллекта. Бизнес-пользователи могут создавать, развертывать и управлять несколькими агентами ИИ в Agentforce для привлечения потенциальных клиентов, оптимизации продаж, управления маркетингом и многого другого. Agentforce — ведущая платформа для автоматизации бизнес-процессов с использованием искусственного интеллекта.

Salesforce утверждает, что в отличие от Microsoft Copilot, агенты Agentforce могут выполнять действия независимо на основе предопределенных событий или триггеров. Агенты Agentforce могут обновлять записи в базе данных, отправлять электронные письма, назначать встречи, разрешать текущие дела и т. д. Эти возможности делают Agentforce мощным инструментом для автоматизации задач по обслуживанию клиентов и продажам.

Итак, вот типы ИИ-агентов, которые вы можете изучить и найти текущих ИИ-агентов, доступных на рынке. По мере нашего продвижения вперед агенты ИИ станут неотъемлемой частью интернет-опыта, как на стороне потребителя, так и на стороне предприятия. Ожидается, что рынок агентов ИИ в ближайшие годы будет переживать значительный рост, обусловленный растущим спросом на автоматизацию и повышением эффективности.