OpenAI представляет Sora: ИИ-модель умеет создавать фотореалистичное видео по текстовому запросу
OpenAI стала первопроходцем в сегменте ИИ для потребителей, устроив революцию в генерации текста и изображений со своими моделями DALL-E и ChatGPT. На этом в компании решили не останавливаться, представив Sora - ИИ-модель для генерации видео по текстовому запросу, которая даст новый виток развития креативности создателей ИИ-контента.
Sora способна создавать видеоролики длительностью до 1 минуты с несколькими персонажами, способна воссоздавать различные движения персонажей и детализированный фон - все в соответствии с текстовым запросом. Качество и реалистичность на превосходном уровне, что лишний раз доказывает потенциал ИИ в визуальном искусстве.
В демонстрационных роликах, которые показала OpenAI, Sora легко справилась с созданием контента по запросу. Модель показала внедорожник, взбирающийся по дороге в гористой местности, а также пушистого монстра, сидящего рядом с горящей свечой - оба видео до мельчайших деталей соответствуют введенному текстовому запрросу.
Впрочем Sora пока-что неидеальна. В некоторых случаях движения выглядят нереалистично - например в сцене, где кот выпрашивает корм у хозяина. В целом сцена выглядит хорошо, но отдельные движения выдают работу ИИ.
Сцена с пушистым монстром вовсе выглядит как отрывок из мультфильма Pixar - тут модель показывает свои возможности детальной проработкой шерсти зверька.
Пока-что Sora доступна только специальной команде тестировщиков, которые должны проанализировать все риски и опасности, которые может нести новая модель. Дополнительно OpenAI сотрудничает с дизайнерами, художниками и режиссерами, чтобы улучшить возможности модели для разработчиков цифрового контента.