Теперь вы можете загружать и редактировать фотографии на Gemini.

Краткое содержание:

Теперь вы можете бесплатно загружать и редактировать фотографии на Gemini. Эта функция постепенно становится доступной всем пользователям, начиная с сегодняшнего дня.
Пользователи также могут создавать и редактировать изображения ИИ на Gemini с помощью диалоговых текстовых подсказок.
Google подтверждает, что все изображения, созданные с помощью искусственного интеллекта на Gemini, будут иметь видимый водяной знак и невидимый цифровой водяной знак SynthID.

Наконец, Google представляет возможность редактирования фотографий на Gemini с помощью текстовых подсказок. Теперь вы можете загружать и редактировать существующие фотографии на Gemini через текстовые чаты. Кроме того, с помощью Gemini вы можете создавать изображения с использованием искусственного интеллекта и дублировать их для изменения изображения. Функция редактирования фотографий Gemini постепенно становится доступной всем пользователям, начиная с сегодняшнего дня. Эта новая функция расширяет возможности пользователя и предоставляет мощные инструменты для творчества.

Компания Google первой предложила собственное редактирование изображений с использованием модели Gemini 2.0 Flash в AI Studio. Я протестировал эту модель в феврале и был поражен тем, насколько легко редактировать изображения в диалоговом режиме. В ответ на собственную модель генерации изображений от Google компания OpenAI также внедрила собственную функцию редактирования и генерации изображений в ChatGPT.

Это привело к Тренд Ghibli Который очень быстро распространился и увеличил использование ChatGPT. Теперь Google реализовал встроенную функцию редактирования фотографий в своем потребительском приложении Gemini. Обратите внимание, что редактировать фотографии можно как в мобильном приложении Gemini, так и в веб-версии. Эта особенность делает Gemini сильным конкурентом в области генеративного ИИ.

Так как я сравнил Собственное редактирование изображений между ChatGPT и GeminiМогу сказать, что Gemini гораздо лучше сохраняет последовательность персонажей/сцен на протяжении поколений. ChatGPT меняет общую картину после каждого поколения, в то время как Gemini очень постоянен. Однако в плане генерации изображений ChatGPT превосходит Gemini. Это отражает различия в структуре используемых моделей.

Теперь нам нужно узнать, продолжает ли Google использовать для генерации изображений модель Imagen 3 на основе диффузии или использует собственные возможности генерации изображений моделей Gemini. Кстати, OpenAI использует модель ИИ GPT-4o для создания и изменения изображений. Это развитие событий иллюстрирует продолжающуюся конкуренцию в области искусственного интеллекта.

Кроме того, Google утверждает, что во все изображения, созданные или отредактированные с помощью Gemini, встроен невидимый цифровой водяной знак SynthID. Кроме того, Google добавит видимый водяной знак ко всем изображениям, созданным с помощью Gemini. Эта мера направлена на повышение прозрачности и подотчетности в использовании искусственного интеллекта.

Gemini