Google представил обновление Nano-Banana для модели Gemini 2.5 Flash Image, значительно улучшающее работу с изображениями.
Точное редактирование по текстовым командам
- Модель позволяет редактировать изображения с помощью текстовых запросов, сохраняя высокое качество и реалистичность. Например, можно изменить цвет одежды на фото или добавить объекты, при этом лица людей или животных не искажаются. В отличие от тех же ChatGPT и Grok, которые часто повреждают детали.
Объединение нескольких изображений
Интерактивное редактирование
- Возможен диалог с ИИ для постепенной доработки изображения: сначала изменить фон, затем добавить предметы, потом скорректировать освещение.
Работа с несколькими источниками
- Модель умеет объединять элементы из разных изображений в одну композицию. Например, можно взять фото комнаты, картинку мебели и цветовую схему, чтобы создать реалистичный интерьер.
Пошаговое создание интерьера с помощью AI
Google заявляет, что её новая модель является передовой по результатам нескольких бенчмарков.
При создании Google ориентировался на бытовые задачи: планирование ремонта, дизайн интерьера, визуализация идей для дома и сада. Модель обладает улучшенными знаниями о мире и создаёт более реалистичные сцены.
Замена животных
После прошлых проблем с генерацией некорректных изображений Google внедрил систему защиты. Запрещено создание неэтичного контента, все AI-изображения помечаются водяными знаками и метаданными для борьбы с дипфейками.
Обновление доступно всем пользователям Gemini, а также разработчикам через API и облачные платформы Google.
