Додому Nejnovější zprávy a články Sora от OpenAI: Будущее AI-генерируемого видео уже здесь

Sora от OpenAI: Будущее AI-генерируемого видео уже здесь

Sora от OpenAI: Будущее AI-генерируемого видео уже здесь

Новейшая разработка OpenAI, Sora, стремительно меняет то, как создаются и потребляются видеоролики. Этот инструмент позволяет пользователям генерировать короткие видеоклипы из текстовых запросов, изображений или существующих видео, и уже завоевал широкое внимание в сети. В этой статье мы рассмотрим, что такое Sora, как она работает, текущую доступность и споры, связанные с её разработкой и использованием.

Что такое Sora?

Sora — это генеративная видеомодель, которая преобразует текстовые описания в реалистичные видеоматериалы. Например, вводя запрос «пластиковый пакет, парящий на ветру», вы получите соответствующий клип. Этот инструмент основан на более ранних технологиях OpenAI для генерации изображений, таких как DALL-E, но специально разработан для естественного движения и визуальной согласованности. OpenAI впервые представила Sora в начале 2024 года, сделав её доступной подписчикам ChatGPT Plus и Pro в декабре.

Ключевой вывод: Sora представляет собой значительный скачок в создании контента с использованием AI, переходя от статических изображений к динамическому видео.

Как это работает?

Sora работает как диффузионная модель, начиная со случайного шума и постепенно уточняя его до связной сцены, соответствующей входному запросу. Новая версия Sora 2 добавляет синхронизированный диалог и звуковые эффекты, повышая реалистичность. Технология разбивает изображения на небольшие «фрагменты» — аналогично тому, как языковые модели обрабатывают текст, — позволяя AI понимать движение, текстуру и детали в различных форматах.

Пользователи могут загружать текст, изображения или короткие клипы, устанавливая длину видео от 5 до 20 секунд в разрешении до 1080p. В отличие от более старых моделей, Sora теперь точно имитирует взаимодействия в реальном мире, например, след от укуса на видео, где кто-то ест печенье. OpenAI признаёт, что система не идеальна, но она более надёжно следует законам физики, чем предыдущие версии.

Что можно с этим делать?

Последние обновления Sora включают функции раскадровки для профессиональных создателей, позволяющие им планировать сцены перед генерацией видео. Хотя изначально платформа была ограничена короткими, случайными клипами, она развивается в сторону более длительного времени воспроизведения и более высокого разрешения, что делает её подходящей для более отполированной работы. Некоторые художники, такие как Арвида Бистрём, творчески используют сбои Sora, находя красоту в неожиданных искажениях.

Однако большая часть контента, созданного с помощью Sora в настоящее время, представляет собой низкопробный, ориентированный на тренды развлекательный контент, который называют «AI-мусором». Эксперты предупреждают, что такая простота создания может подорвать доверие к визуальным медиа. По словам Натаниэля Фаста из USC Marshall, лучший сценарий заключается в том, что люди просто проигнорируют это, а худший — в широкомасштабной потере веры в то, что реально.

Доступность, доступ и стоимость

OpenAI предлагает две версии Sora: настольный инструмент для профессионального использования и мобильное приложение для обмена видео в социальных сетях. Мобильное приложение доступно в США, Канаде, Японии и Южной Корее с планами на расширение.

Стоимость варьируется в зависимости от уровня подписки:

  • Бесплатные пользователи ChatGPT: Ограниченное количество генераций в день.
  • ChatGPT Plus ($20/месяц): Щедрый ежедневный лимит.
  • ChatGPT Pro ($200/месяц): Превосходные функции, более высокое разрешение, скачивание без водяных знаков.
  • Оплата по мере использования: Дополнительные пакеты из 10 видеогенераций примерно за $4.

Споры и юридические проблемы

Появление Sora нарушило индустрию создания видео, сделав профессиональное качество видео доступным любому, у кого есть текстовый запрос. Это вызывает опасения по поводу дезинформации, выдачи себя за другого человека и нарушения авторских прав. OpenAI реализовала фильтр злоупотреблений подобием, чтобы предотвратить несанкционированное использование изображений реальных людей, но обходные пути существуют.

Cameo, платформа для видео с участием знаменитостей, подала в суд на OpenAI за её функцию «Cameo», утверждая о путанице с брендом и потенциальном введении общественности в заблуждение. OpenAI изначально использовала политику отказа от авторского контента, требуя от правообладателей запросить исключение, но переходит к модели отказа, где создатели должны давать разрешение.

Эксперты предупреждают, что гарантии несовершенны, и прозрачность имеет решающее значение. Уильям Шульц из Merchant and Gould подчеркивает, что ответственное использование является ключевым моментом, особенно поскольку сгенерированный AI контент может не подлежать охране авторских прав без вмешательства человека.

Общая картина

Sora знаменует собой поворотный момент в генеративном AI от изображений к движущимся картинам. Этот переход может изменить экономику производства медиа, распространения и подлинности. Хотя новые инструменты открывают творческий потенциал, они также требуют осторожности. OpenAI должна уделять приоритетное внимание целенаправленному AI, а не инновациям, ориентированным на прибыль, чтобы заслужить доверие и гарантировать, что эти технологии служат прогрессу человечества.

Вывод: Sora от OpenAI — это не просто ещё один AI-инструмент; это предвестник будущего, где создание видео демократизировано, но также потенциально дестабилизировано. Последствия далеко идущие, и индустрии необходимо активно решать этические, юридические и социальные проблемы.

Exit mobile version