Meta улеснява артистите и звуковите дизайнери да произвеждат аудио, използвайки само AI. Собственикът на Facebook има освободен комплект AudioCraft с отворен код, който обединява три съществуващи генеративни AI модела за създаване на звуци от текстови описания. AudioGen и MusicGen произвеждат съответно звукови ефекти и музика, докато EnCodec компресира звуци, за да произведе резултати с по-високо качество. Един музикант или звуков дизайнер може да има всичко необходимо, за да композира парчета.

Изданието включва предварително обучени AudioGen модели за тези, които искат да започнат бързо, а майсторите ще имат достъп до целия код на AudioCraft и теглото на модела. Дебютът с отворен код дава шанс на професионалистите и изследователите да обучат моделите, използвайки собствените си данни, казва Мета. Всички предварително обучени модели използват публичен или притежаван от Meta материал, така че няма шанс за спорове за авторски права.

Технологичната фирма характеризира AudioCraft като начин да направи генеративното AI аудио по-просто и по-достъпно. Там, където произведените от AI изображения и текст са били популярни, Мета вярва, че звукът е изостанал „малко“. Съществуващите проекти обикновено са сложни и често затваряни. На теория новият комплект дава възможност на създателите да оформят свои собствени модели и по друг начин да разтягат възможното.

Това не е единственият AI отворен текст към аудио на пазара. Google отвори своя модел MusicLM през май. Системата на Meta също не е предназначена за ежедневни потребители – все пак ще трябва да сте технически склонни, за да използвате правилно AudioCraft. Това е по-скоро за проучване, казват от компанията. Разработчиците също се опитват да подобрят производителността и методите за контрол на тези модели, разширявайки техния потенциал.