Компанія Google оновила свій чат-бот Gemini, додавши нову модель штучного інтелекту для редагування зображень, що дозволяє користувачам більш точно маніпулювати фотографіями. Це нововведення спрямоване на те, щоб конкурувати з популярними інструментами, розробленими OpenAI, та залучити користувачів, які використовують ChatGPT.
Що відомо про Gemini 2.5 Flash Image
Оновлення, що отримало назву Gemini 2.5 Flash Image, почне розгортатися з вівторка для всіх користувачів додатку Gemini, а також для розробників через API Gemini, Google AI Studio та Vertex AI.
Нова модель штучного інтелекту Gemini дозволяє виконувати більш точні редагування зображень на основі природних запитів від користувачів, зберігаючи при цьому узгодженість облич, тварин та інших деталей, що є проблемою для багатьох конкурентних інструментів. Наприклад, якщо запитати ChatGPT або xAI Grok про зміну кольору сорочки людини на фотографії, результат може містити спотворене обличчя або змінений фон.
Нова розробка Google вже привернула увагу. В останні тижні користувачі соціальних мереж хвалили вражаючий редактор зображень на платформі LMArena. Модель виступала анонімно під псевдонімом «нано-банан».
Google підтвердила, що саме вона стоїть за цією моделлю, що є рідною можливістю редагування зображень в основній AI-моделі Gemini 2.5 Flash. Компанія стверджує, що модель є однією з найкращих за результатами тестування на LMArena та інших платформах.