

Нов модел за генериране на AI видео, наречен Seedance 2.0, наскоро стана вирусен както в китайски, така и в международни онлайн общности. Според официалната информация Seedance 2.0 е разработен от ByteDance и е в състояние да генерира видеоклипове с кинематографично качество от текстови подкани или изображения.
Моделът използва архитектура на дифузионен трансформатор с двоен клон, което му позволява да генерира видео и аудио едновременно. С подробна подкана или едно качено изображение, Seedance 2.0 може да произведе последователно видео от множество снимки с оригинално аудио за под 60 секунди.
Една от отличителните му характеристики е генерирането на разказ с няколко кадри. От една подкана моделът може автоматично да създава множество взаимосвързани сцени, като същевременно поддържа последователни герои, визуален стил и атмосфера при преходите между сцени, без необходимост от ръчно редактиране. ByteDance описва модела като „идеален за създаване на пълни повествователни поредици от началото до кулминацията, с професионална съгласуваност“.
След пускането му голям брой потребители бързо започнаха да експериментират със Seedance 2.0, произвеждайки визуално удивителни резултати, широко споделяни онлайн.
В същото време видео за преглед от популярния китайски създател на технологии и наука MediaStorm допълнително ускори нарастването на популярността на Seedance 2.0. Оценката подчерта силните страни на модела в мащабното движение, композицията на кадрите и аудио-визуалната синхронизация. По-специално, рецензентът отбеляза способността му да извършва ясни промени в ъгъла на камерата, „постоянно препозиционирайки камерата като истински режисьор“.

Няколко фирми за ценни книжа също се изказаха положително за модела в последните изследователски доклади. Ценните книжа с отворен код описаха Seedance 2.0 като „впечатляващ“, позовавайки се на пробив в самонасочващото се движение на камерата, оркестрация на множество кадри, мултимодално разсъждение с пълен спектър, синхронизирано аудио-видео генериране и разказване на истории в множество сцени. Фирмата отбеляза, че Seedance 2.0 предлага на потребителите „прецизност на управление на ниво режисьор“ и може да представлява потенциален „момент на уникалност“ за филми и видео, генерирани от AI.
Самото генерирано от AI видео не е ново. Само миналия месец AI видеомоделът Kling на Kuaishou придоби значителна популярност в чужбина с функцията си за контрол на движението, която създава изключително споделяно съдържание. Kling за кратко оглави класациите за изтегляне на приложения за графики и дизайн на пазари като Южна Корея и Сингапур, като същевременно стимулира растежа на приходите на пазара в САЩ.
Според ByteDance, Seedance 2.0 генерира 2K видео с приблизително 30% по-бързо от конкуренти като Kling. Докато Sora на OpenAI набляга на физическия реализъм, а Kling се фокусира върху контрола на движението, Seedance 2.0 се отличава, като дава приоритет на кохерентното разказване на много сцени с естествено аудио.
Orient Securities отбеляза, че с пускането на тези най-нови модели техническият таван на китайската страна на предлагането на видеогенерация продължава да се покачва, тласкайки сектора към фаза на конкуренция, сравнима с големите езикови модели около 2025 г. Тъй като базовите възможности се сближават на високо ниво, бъдещата диференциация вероятно ще зависи от конкретни сценарии на приложение и пътища за комерсиализация.
Фирмата също така отбеляза, че генерирането на видео навлиза в ера на прецизна контролируемост в стил табло, където по-ниските технически бариери стимулират разширяването на потребителите както на потребителския, така и на корпоративния пазар.
От инвестиционна гледна точка, анализаторите смятат, че Seedance 2.0 може да види ранно широкомащабно приемане в AI комикси, AI анимация и краткосрочна драма, което значително намалява разходите, подобрява ефективността и отключва предлагането на ново съдържание. Компаниите със силни IP резерви и предимства в трафика на платформата се очаква да се възползват най-много.
В допълнение, инвеститорите се съветват да обърнат голямо внимание на вертикалните мултимодални AI приложения, тъй като текущите технически пробиви и намаляването на разходите ускоряват инерцията на индустрията, стимулират растежа на потребителите, увеличават платеното приемане и ускоряват комерсиализацията. Фирмите със стратегии за експанзия в чужбина за мултимодални AI продукти може да отбележат особено бърз растеж.
Източник: AI Daily
Source link
Like this:
Like Loading…
Нашия източник е Българо-Китайска Търговско-промишлена палaта