Notebookcheck Logo

Новый инструмент ИИ с открытым исходным кодом позволяет создавать более длинные и последовательные видеоролики

Сгенерированное искусственным интеллектом изображение жирафа
ⓘ Gemini
Сгенерированное искусственным интеллектом изображение жирафа
Исследователи из Швейцарского федерального технологического института Лозанны (École polytechnique fédérale de Lausanne) разработали новую систему под названием Stable Video Infinity (SVI) для решения проблемы дрейфа в моделях генерации видео.

Если Вы пользовались моделями для создания видеороликов, есть одна вещь, которую Вы обнаружите во всех случаях - они ограничены короткими роликами, обычно от 5 до 20 секунд. Причина такого ограничения кроется в так называемом "дрейфе" Дрейф приводит к тому, что сцены и персонажи все больше теряют свою особенность кадр за кадром, что со временем приводит к бессвязному результату.

Чтобы решить эту проблему, исследователи из лаборатории EPFL "Визуальный интеллект для транспорта" (VITA) разработали новый метод обучения под названием "переобучение путем переработки ошибок" Вместо того, чтобы отбрасывать глюки и деформации, которые естественным образом возникают в процессе генерации, этот подход намеренно возвращает их обратно в модель.

Профессор Александр Алахи сравнивает этот процесс с "обучением пилота в неспокойную погоду, а не в ясном голубом небе" Учась на собственных ошибках, ИИ становится достаточно надежным, чтобы стабилизировать себя при неизбежном появлении ошибок, а не скатываться в случайность.

Этот метод лежит в основе новой системы Stable Video Infinity (SVI). В отличие от существующих моделей, которые часто рассыпаются уже через 30 секунд, SVI может генерировать связные, высококачественные видеоролики продолжительностью в несколько минут и более. Система уже набирает обороты в технологическом сообществе; ее код с открытым исходным кодом на GitHub набрал более 2 000 звезд, а исследование было принято для презентации на Международной конференции по обучающим представлениям 2026 года (ICLR).

Команда также представила LayerSync, сопутствующий метод, который позволяет ИИ корректировать свою внутреннюю логику при создании видео, изображений и звука. Вместе эти инструменты обещают создать более совершенные автономные системы и раскрыть потенциал для создания по-настоящему долгоиграющих генеративных медиа.

Источник(и)

SVI через Tech Xplore

Этот важный материал точно понравится твоим друзьям в социальных сетях!
Mail Logo
'
> Обзоры Ноутбуков, Смартфонов, Планшетов. Тесты и Новости > Новости > Архив новостей > Архив новостей за 2026 год, 02 месяц > Новый инструмент ИИ с открытым исходным кодом позволяет создавать более длинные и последовательные видеоролики
Chibuike Okpara, 2026-02-10 (Update: 2026-02-10)