Там, где большинство видеомоделей с искусственным интеллектом испытывают трудности с непрерывностью, Sora 2 понимает причины и следствия окружающей среды. Тени смещаются реалистично. Вода рябит, когда рядом с ней что-то движется. Отражения появляются в стекле и лужах, а не под случайными углами.
OpenAI описывает Sora 2 как способную генерировать "сложные сцены с несколькими персонажами, специфическими движениями и детализированными фонами, которые остаются неизменными с течением времени" Это правда - хотя "последовательность" все еще является относительным понятием в этом мире.
Задание 1: Дуэль в Центральном парке, которая сорвалась
Первое испытание было нарочито амбициозным:
"Тихий полдень в Центральном парке Нью-Йорка. Туристы прогуливаются под мягким солнечным светом. Внезапно фигура в одеянии активирует светящийся энергетический посох и призывает людей отойти в безопасное место. Другой человек в темной одежде выходит из-за деревьев, держа в руках красное оружие. Толпа разбегается, когда эти двое вступают в дуэль - элегантные, похожие на танец движения, светящиеся дуги света отражаются в воде неподалеку. Камера непрерывно кружит вокруг них, как осенние листья кружатся в воздухе"
То, что получилось в итоге, поражало воображение - мягкие золотистые тона, плавное вращение камеры и убедительные отражения. Но затем наступил хаос. Светящиеся посохи (световые мечи) мерцали, изгибались и превращались в странные фигуры. Тела бойцов теряли равновесие, конечности проскальзывали друг сквозь друга, словно призрачные полигоны из видеоигры 90-х годов. Хореография превратилась скорее в сюрреалистический интерпретационный танец, чем в кинематографический бой.
И этот недостаток не является уникальным для моего теста. OpenAI признала, что Sora 2 "с трудом справляется с устойчивой, физически правдоподобной хореографией боя гуманоидов или оружия", и это ограничение быстро становится очевидным, как только оружие начинает двигаться.
Тем не менее, окружающий мир выглядел достаточно реалистично, чтобы Вы могли почти простить это. Сцена казалась кинематографичной, даже если действие не было таким.
Задание 2: Искупление дуэли в Центральном парке
Sora 2 довольно хорошо ответила на следующее задание.
"Мирный полдень в Центральном парке Нью-Йорка. Туристы прогуливаются и фотографируются под мягким золотистым солнечным светом. Внезапно фигура в светлых одеждах активирует светящийся энергетический посох и срочно призывает людей отойти в безопасное место. Из-за деревьев появляется другая фигура в темных одеждах, держащая в руках красное энергетическое оружие. Толпа разбегается, когда эти двое начинают точную, кинематографическую дуэль - элегантные, похожие на танец движения, сияющие дуги света, отражающиеся в воде неподалеку. Камера обводит их одним непрерывным кадром, как осенние листья кружатся в воздухе. Никакого контакта или травмы - только искусная хореография и динамичные движения."
На этот раз это действительно сработало. Движения выглядят приземленными, плавными и удивительно человеческими, а финальный удар проходит настолько естественно, что легко забыть, что Вы смотрите на что-то, созданное искусственным интеллектом.
Задание 3: Птицы и львы на водопое
Для более спокойного теста я обратился к дикой природе. Задание:
"Создайте сцену дикой природы, в которой птицы и львы пьют из водопоя. Каждое животное должно двигаться реалистично, а сцена должна быть гиперреалистичной"
Здесь Sora 2 была в своей стихии. Птицы порхали и пикировали с правдоподобными движениями крыльев. Солнечный свет мерцал на поверхности воды, и отражения естественно реагировали на изменение положения животных. Текстуры - мех, перья, рябь грязи - выглядели близко к документальному качеству природы.
Однако причуды модели все же дали о себе знать. Один лев оказался неловко расположенным у грязного края, и казалось, что он пьет прямо из грязи, а не из воды. Это незначительная, но показательная деталь: Sora 2 точно передает общую сцену, но иногда теряет связь между объектами и поверхностями.
Тем не менее, это был самый убедительный результат - и намек на то, в чем истинная сила Sora 2: в реализме окружающей среды.
Задание 4: Футуристическая погоня на крыше
Для финального испытания я довел движение, освещение и атмосферу до предела:
"Разрастающийся футуристический городской пейзаж на рассвете. Курьер в стиле киберпанк в темной куртке бежит по крышам, неся в руках светящийся кейс с данными. Преследующий его дрон пробирается между антеннами и вентиляционными отверстиями, его двигатели пылают синим светом.
Камера следит сзади и справа от бегуна с помощью ручного управления, когда он перепрыгивает через пропасть. Дрон обгоняет его в воздухе; блики объектива и размытие движения завершают сцену."
Результат получился потрясающим и удивительно кинематографичным.
Освещение сделало все возможное: восход солнца, сверкающий на стеклянных башнях, отражения на металлических поверхностях и тонкие блики объектива во время прыжка. Движение казалось плавным и весомым. Преследование с помощью дрона создавало настоящее напряжение, а малая глубина резкости имитировала 35-мм кинокамеру.
Это была Sora 2, работающая на полную катушку - сложная, цельная и правдоподобная. Если бы это было выпущено в качестве тизера к игре или фильму, большинство зрителей с первого взгляда не заподозрили бы участия ИИ.
Прекрасная непредсказуемость Sora 2
Во всех этих тестах выделялась одна истина: Sora 2 постоянно непоследовательна. Иногда она делает все правильно. В других случаях она рождает нечто настолько причудливое, что Вы не можете перестать смеяться. Эта непредсказуемость стала частью ее очарования.
На Reddit один из пользователей отлично подытожил это:
"Sora 2 дает Вам либо Pixar, либо энергию лихорадочной мечты, ничего промежуточного".
- r/AIGuild
Модель иногда искажает объекты, меняет цвета в середине сцены или неправильно интерпретирует подсказки в восхитительно абсурдных формах. Подсказка "два плюшевых животных, идущих бок о бок" однажды привела к появлению существ, которые наполовину были похожи на плюшевого медведя, наполовину - на надувной шар. Это не точно, но запоминается.
Такой хаос может стать помехой для профессионалов, которым нужна надежность, но для творческих экспериментов это золото. Иногда Sora 2 ведет себя скорее как коллаборатор с гиперактивным воображением, чем как предсказуемая машина.
Реализм против реальности: Понимание сильных сторон Sora 2
Когда Sora 2 работает, это похоже на волшебство. Но это не волшебство - это машина, интерпретирующая Ваши слова с помощью вероятности и визуального обучения шаблонам. Для нее важен контекст, а не точность. Дайте ему сильное чувство места - направление освещения, движение камеры, тон - и он убедительно заполнит все остальное. Если попросить его о точной хореографии или взаимодействии с мелкой моторикой, он не справится.
Эта закономерность совпадает с тем, что наблюдали другие участники групп тестирования на Reddit и Discord. Создатели отмечают, что более простые действия человека (ходьба, взгляд, жестикуляция) выглядят правдоподобно, но сложные последовательности (драки, объятия, игра на инструментах) быстро ломаются. Это говорит о том, что физическое моделирование OpenAI все еще рассматривает человеческое тело как набор независимых кластеров движений, а не как единое целое. Это достаточно реалистично в течение нескольких секунд, а затем энтропия берет верх.
Более широкий контекст: Творчество в эпоху алгоритмов
Что делает Sora 2 захватывающей, так это не только ее технический прогресс... Это культурный сдвиг, который она представляет.
На протяжении десятилетий создание видео было дорогим, отнимало много времени и ограничивалось доступом к оборудованию или таланту. Теперь любой, у кого есть хорошая идея и абзац текста, может создать нечто визуально захватывающее.
Эта демократизация сильна, но она также размывает творческое авторство. Когда модель "неправильно" представляет себе часть сцены, это провал или интерпретация?
В моей дуэли в Центральном парке деформированное оружие разрушило реализм, но придало сновидческое качество. Это было не то, чего я хотел, но это намекало на сюрреалистическую, живописную эстетику - что-то ближе к экспериментальному кино, чем к голливудским боевикам.
Возможно, в этом и заключается более глубокий урок: ИИ-кинопроизводство - это не контроль. Речь идет о переговорах.
Технические и этические границы
OpenAI осознает как волнение, так и тревогу вокруг этого инструмента. Компания продолжает ограничивать доступ, ссылаясь на возможность злоупотребления и необходимость защиты контента.
Недавно правительство Японии обратилось к OpenAI с настоятельной просьбой чтобы Sora 2 не нарушала авторские права на аниме и мангу - напоминание о том, что творческий потенциал ИИ влечет за собой реальные правовые последствия. Кроме того, возникает вопрос об оригинальности. Результаты работы Sora 2 могут выглядеть по-новому, но они созданы на основе огромного количества существующих медиа. Чем более реалистичными они становятся, тем сложнее отделить копию от подражания. Вот почему, несмотря на всю свою удивительность, Sora 2 находится на перепутье между артистизмом и автоматизмом.
Проблемы со звуком очень заметны
В большинстве роликов Sora 2 по-прежнему не хватает звука. В то время как визуальные эффекты часто бывают потрясающими, аудио, как правило, звучит плохо, плоско, приглушенно или неестественно. Sora 2 пытается генерировать окружающий шум, эффекты и диалог одновременно, но не может разделить их так, как это сделал бы настоящий звуковой дизайнер. В результате получается чрезмерно сжатый, металлический или странно сбалансированный звук, который редко соответствует кинематографическому качеству визуального ряда. Пока что лучший способ заставить видеоролики Sora 2 звучать хорошо - это добавлять звук в процессе пост-продакшена, накладывая реальную атмосферу, эффекты и музыку, чтобы оживить сцену.
Взгляд в будущее, несовершенный рендеринг
После нескольких дней тестирования Sora 2 произвела на меня впечатление, позабавила и немного обеспокоила. Это одновременно и чудо инженерной мысли, и напоминание о том, что человеческие движения, эмоции и повествование остаются уникально сложными.
Сильные стороны: Окружение, освещение, атмосфера, динамичные движения и реализм в коротких сериях.
Слабые стороны: Контакт с людьми, физика оружия, иногда сюрреалистические искажения.
Действительно ли Sora 2 дает результат?
Sora 2 - это довольно приличный шаг на пути к созданию фильмов с помощью ИИ... Только не ждите пока безупречного реализма. К этому следует добавить, что настоящие режиссеры все еще остаются настоящими художниками, которые нам нужны... Поскольку Sora 2 все еще не справляется с естественным перемещением сурьмы человека, а также животных.
Как выразился один из пользователей Redditor:
"Sora 2 - это как смотреть, как будущее учится мечтать".
- r/OpenAI
Это подходящее резюме. Sora 2 не просто моделирует реальность... Она экспериментирует с ней. И для тех из нас, кто наблюдает за происходящим, это одновременно захватывающе и глубоко человечно... Только с крайне плохим качеством звука.





