Google DeepMind на сайте запускает Gemini 2.5 Flash Image, также называемое "нанобананом", для приложения Gemini и для разработчиков через Gemini API, Google AI Studio и Vertex AI. Это обновление устраняет частую проблему, связанную с инструментами ИИ для работы с изображениями: небольшие правки, которые в итоге приводят к изменению всего изображения. Google описывает этот выпуск как улучшение качества и контроля по сравнению с предыдущими версиями.
Главная особенность - согласованность персонажей. Вы можете сохранить одинаковый вид человека, животного или товара в разных сценах, даже если Вы меняете наряды, прически, временные периоды или обстановку. Модель также может объединять несколько изображений в одно, вносить специфические изменения с помощью инструкций на естественном языке и использовать знания о мире Gemini при создании и редактировании изображений.
Вы можете использовать этот инструмент, чтобы поместить одного и того же персонажа в разные обстановки, показать продукт с разных сторон или сохранить единообразие образов бренда в разных кампаниях. Многооборотное редактирование позволяет Вам продолжать вносить изменения, например, добавлять мебель и декор в комнату, чтобы опробовать идеи. Вы также можете смешивать дизайны, добавлять узор с одного изображения на объект на другом, или объединять человека и домашнее животное в новую сцену.
Ценообразование прозрачно для разработчиков: Gemini 2.5 Flash Image стоит 30 долларов за один миллион жетонов вывода. Каждое изображение считается за 1 290 выходных жетонов, что составляет примерно $0,039 за изображение. Другие способы ввода и вывода соответствуют стандартным ценам Gemini 2.5 Flash.
Для безопасности создаваемые изображения содержат видимую метку AI и невидимый цифровой водяной знак SynthID. По словам Google, SynthID все еще можно обнаружить после обычных правок, что должно помочь проверить происхождение изображений, поскольку синтетические носители становится все труднее распознать.
Google утверждает, что по результатам ранних предварительных просмотров эта модель редактирования изображений считается ведущей. Встроенное редактирование в приложении Gemini теперь сохраняет тонкие детали на Ваших фотографиях. Вы можете загрузить фотографию, запросить изменения, объединить изображения с Вашим питомцем, поменять фон, чтобы попробовать новые обои, или поместить себя в различные сцены. Вы также можете использовать отредактированное изображение в Gemini для создания короткого видео.
Источник(и)
Google (на английском языке)