Фотореалистичные изображения и читаемый текст с использованием новейших моделей искусственного интеллекта OpenAI. Попробуйте бесплатно.

Компания OpenAI интегрировала свою модель 4o в ChatGPT, чтобы обеспечить возможность генерации изображений непосредственно в среде чат-бота. Это обновление устраняет необходимость использования модели генерации изображений Dall-E от OpenAI в качестве отдельной сущности, хотя Dall-E по-прежнему доступен для тех, кто предпочитает именно его. Компания, занимающаяся разработкой искусственного интеллекта, также реализовала свой видеогенератор Sora AI в ChatGPT.

Новые функции в настоящее время доступны пользователям бесплатной версии ChatGPT, а также пользователям ChatGPT Plus, Team и Pro. Эти функции станут доступны корпоративным и образовательным пользователям на следующей неделе.

Ранее Dall-E 3 был плагином генерации изображений для платных подписчиков ChatGPT. Тем временем, желающие опробовать генератор бесплатно могут сделать это через базовую версию Microsoft Copilot.

Шаблон был признан одним из лучших доступных генераторов изображений, особенно в платной версии. Хотя всем пользователям ChatGPT будет полезно иметь возможность использовать генерацию изображений, интегрированную с моделью 4o, тем, кто использует бесплатную версию ChatGPT, следует быть готовыми к некоторым ограничениям, таким как ограничения по загрузке файлов и анализу данных, как уже отмечалось. CNET.

Однако ChatGPT выиграет от более реалистичных изображений с более четким текстом после того, как OpenAI провела год после запуска обучения GPT-4o с помощью учебного проекта под названием «Обучение с подкреплением на основе обратной связи с человеком» (RLHF), согласно данным Wall Street Journal.

Как рассказал газете ведущий исследователь проекта Габриэль Го, после анонса GPT-4o в мае 2024 года команда OpenAI из более чем 100 «людей-тренеров» сканировала модель на предмет опечаток, а также распространенных ошибок в руках и лицах.

Модель GPT-4o также добавит возможность создания прозрачных фонов в ChatGPT. Ожидается, что это будет очень полезно для бизнес-пользователей и творческих людей, поскольку позволит им создавать логотипы или другие значки, как отметила Джеки Шеннон, руководитель отдела мультимедийных продуктов в ChatGPT, в интервью WSJ.

Несмотря на улучшения, внесенные OpenAI, обновленная модель GPT-4o в целом все еще имеет некоторые недостатки. У него по-прежнему сохраняется склонность к галлюцинациям — распространенная черта среди ИИ, с которой еще предстоит справиться. Поддержание редакционной согласованности остается проблемой в среде ChatGPT; Однако, Я обещал OpenAI с быстрыми обновлениями уже на следующей неделе.

Еще одной актуальной проблемой, с которой сталкивается OpenAI, является вопрос этики и легитимности. Компания настаивает, что ее модель была обучена на «общедоступных данных», а также на собственных данных, которыми она владеет благодаря партнерству с такими брендами, как Shutterstock, отмечает WSJ.

Изображения, созданные ChatGPT на основе модели 4o, не будут содержать водяных знаков ИИ. Однако компания отметила, что изображения будут включать метаданные C2PA, указывающие на то, что они были созданы с помощью искусственного интеллекта. Это остается отраслевым стандартом.

ChatGPT