Крупные бизнес-модели (LAM) производят революцию в мире ИИ по сравнению с традиционными моделями.

Появление генеративных чат-ботов на базе искусственного интеллекта привело к появлению концепции «большой языковой модели» (LLM) — передовой технологии искусственного интеллекта, которая анализирует и понимает естественный язык для генерации осмысленных ответов на основе запросов пользователей. Большие языковые модели способны генерировать последовательный, похожий на человеческий контент, создавая впечатление, что у ИИ есть некое собственное «мышление».

Однако языковые модели — не единственная технология, способствующая развитию искусственного интеллекта; Следующим шагом могут стать крупные бизнес-модели (LAM). Эти модели направлены на расширение аналитических возможностей и возможностей принятия решений в практических контекстах, потенциально преобразуя такие области, как автоматизация и управление бизнесом. В этой статье мы узнаем, как работают степени LLM и LAM, а также об их растущем влиянии на улучшение приложений ИИ и расширение сферы их применения.

Крупные бизнес-модели (LAM) производят революцию в мире ИИ.

Что такое модель большого бизнеса (LAM)?

Модель большого действия (LAM) — это модель искусственного интеллекта, которая способна понимать действия человека и выполнять соответствующие действия, что позволяет ей взаимодействовать с миром подобно человеку. Это немного другой подход, чем модели ИИ, которые фокусируются исключительно на генерации ответов. Термин «большая бизнес-модель» впервые был введен компанией Rabbit Inc, разработчиком Rabbit R1. В видеоролике, посвященном запуску Rabbit R1, компания говорит, что LAM — это новая основополагающая модель, которая помогает перевести ИИ от слов к действиям.

Что такое модель большого бизнеса (LAM)?

LAM обучаются на больших наборах данных о действиях пользователей; Следовательно, они учатся, имитируя действия человека или демонстрируя их. Посредством демонстрации модель LAM может понимать пользовательские интерфейсы различных веб-сайтов или мобильных приложений и перемещаться по ним, а также выполнять определенные действия на основе ваших инструкций. В соответствии с кроликLAM может добиться этого, даже если интерфейс немного изменился.

Можно рассматривать LAM как расширение существующих возможностей LLM. В то время как генеративные текстовые или медиа-выводы в LLM полагаются на вводимые пользователем данные, предсказывая следующее слово или токен (вы задаете вопрос, а модель LLM предоставляет текстовые или медиа-выводы), LAM идут дальше, добавляя возможность выполнять сложные действия от вашего имени.

Что могут сделать LAM?

LAM предназначены для выполнения сложных действий от вашего имени. Однако важным моментом, на который следует обратить внимание, является способность выполнять сложные процедуры. Это делает LAM более полезными для сложных задач, но это не значит, что они не могут выполнять более простые процедуры.

Теоретически это означает, что вы можете, например, попросить модель LAM сделать что-то от вашего имени, например заказать кофе в местном кафе или поездку на Uber, и даже забронировать номер в гостинице. Поэтому это отличается от выполнения простых задач, таких как просьба к Google Assistant, Siri или Alexa включить телевизор или свет в гостиной.

Согласно видению Rabbit Inc., модель LAM способна получать доступ к соответствующему веб-сайту или приложению, например Uber, и перемещаться по его интерфейсу, чтобы выполнить действие, например, заказать поездку или отменить ее, если вы передумали.

LAM превзойдут LLM, но они еще не готовы (пока)

Концепция LAM интересна, возможно, даже больше, чем LLM. Модели больших действий (LAM) — это будущее после генеративного искусственного интеллекта, которое позволит нам компенсировать рутинные задачи и сосредоточиться на других приносящих удовлетворение действиях. Однако, как бы захватывающе это ни звучало, LAM еще не готовы.

Первый коммерческий продукт, обещавший использовать LAM (Rabbit r1), не полностью выполнил свое маркетинговое обещание выполнять действия от имени своих пользователей. Устройство настолько провалилось по своей основной торговой точке, что многие отзывы из первых рук описывали его как довольно бесполезное.

Хуже того, расследование YouTuber Coffeezilla в сотрудничестве с избранной группой инженеров-программистов, имеющих доступ к части базы Rabbit r1, показало, что Rabbit использовал сценарии Playwright для выполнения действий вместо LAM. Таким образом, вместо того, чтобы машина выполняла уникальную модель ИИ, она на самом деле просто выполняла набор операторов If > then; Далеко от обещанной модели LAM.

Если что-то и можно вынести из Rabbit r1, так это то, что да, в нем есть видение. Однако перед реализацией необходимо выполнить определенную работу, поэтому не стоит пока радоваться.