Красивият, забавен сюрреализъм на ранните изкуствени интелекти за текст към видео

Сподели

Нова креативна AI система, наречена ModelScope, вече изпомпва кратки видеоклипове в отговор на текстови подкани. Ранните резултати са чудесно странни и напълно запомнящи се – но веднага става ясно колко невероятно мощни ще станат тези инструменти.

Разработен от екип за сътрудничество в Huggingface, Modelscope е „многоетапен модел на разпространение на текст към видео“, който приема подкани на обикновен английски текст, опитва се да разбере какво се надявате да видите, след което генерира и обезшумява кратък видео за вас. Можете да играете с него онлайн чрез много прост интерфейс. Много е рано за подобни неща, което го прави идеалното време да се удивите както на невероятните му възможности, така и на странното му неразбиране на света.

Най-популярната употреба на тази технология в момента изглежда кара знаменитостите да ядат разни неща и е лесно да се разбере защо.

Както винаги, този генериращ AI е обучен върху голям набор от данни за съществуващи видеоклипове, създадени от хора, повдигайки някои интересни правни въпроси, когато става въпрос за IP, собственост на големи притежатели на авторски права.

„Фундаменталният проблем с генеративния AI и дълбоките фалшификати във всички тези нови AI системи е, че данните за обучение, които се използват, не са собственост на дълбоките фалшификати“, казва основателят и главен изпълнителен директор на Hyperreal Ремингтън Скот. „И притежателите на авторски права не получават заплащане. Това е фундаментален проблем, който ще стане наистина голям в IP. Скоро хората ще обучават AI за всички филми на Avatar, след което ще изграждат цели нови истории, използвайки AI. Това няма да пролети . Видяхме колко лош беше Napster за музикалната индустрия; това е Napster 2.0 за цялата IP индустрия.”

„В момента сме в Дивия запад, но гледайте как ще се развие“, продължава той. „Едно студио ще заведе някого в съда и ще каже „отворете данните за обучението, да видим на какво сте го обучили“. И ако те не са използвали материала на това студио, всяко друго студио ще гледа, за да каже „ах, но вие сте използвали моя.“

Очарователни неща. Гледайте колко бързо се развива тази технология, ако генерирането на изображения и текст е някаква индикация, нещата са на път да станат асимптотични.

източник: Прегърнато лице



Публикациите се превеждат автоматично с google translate


Сподели