Google представляет новую модель искусственного интеллекта под названием «Veo», предназначенную для создания видео с учетом творческих предпочтений пользователей. Она сопровождается обновлением модели генерации изображений до третьего поколения — Imagen 3.
Ранее известный как Bard, инструмент, основанный на искусственном интеллекте, был переименован в Gemini и стал частью всей линейки продуктов Google. После изменений в названии и добавления новых функций, включая запрос изображений через диалоговую модель искусственного интеллекта с использованием Imagen 2, он продолжает развиваться.
Новая модель Google Veo разрабатывалась для создания видео, которая учитывает визуальную семантику и естественный язык. Она способна генерировать видео высокого разрешения и продолжительности, превосходящей текущие модели. Veo использует опыт Google в области генеративных видеомоделей, чтобы предоставить пользователю более творческие возможности.
Imagen 3, считается моделью «самого высокого качества» для преобразования текста в изображение, обеспечивает более детализированные и фотореалистичные изображения, а также способность отображать текст. Обе модели будут доступны через VideoFX от Google Labs в рамках частной предварительной версии.