Dall-E и Stable Diffusion бяха само началото. Тъй като генеративните AI системи се размножават и компаниите работят, за да диференцират своите предложения от тези на своите конкуренти, чатботовете в интернет придобиват силата да редактират изображения, както и да ги създават, с лидери като Shutterstock и Adobe. Но с тези нови възможности, упълномощени от AI, идват познати клопки, като неоторизирано манипулиране или директна кражба на съществуващи онлайн произведения на изкуството и изображения. Техниките за воден знак могат да помогнат за смекчаване на последния, докато новите “PhotoGuard” техниката, разработена от MIT CSAIL, може да помогне за предотвратяване на първото.
PhotoGuard работи, като променя избрани пиксели в изображение, така че те да нарушат способността на AI да разбере какво представлява изображението. Тези „смущения“, както изследователският екип ги нарича, са невидими за човешкото око, но лесно се четат от машини. Методът за атака на „енкодер“ за въвеждане на тези артефакти е насочен към латентното представяне на целевото изображение на алгоритмичния модел – сложната математика, която описва позицията и цвета на всеки пиксел в изображението – по същество пречи на AI да разбере какво гледа.
По-усъвършенстваният и интензивен в изчислително отношение метод на атака с “дифузия” камуфлира изображението като различно изображение в очите на AI. Той ще дефинира целево изображение и ще оптимизира смущенията в неговото изображение, така че да прилича на целта си. Всички редакции, които AI се опитва да направи върху тези „имунизирани“ изображения, ще бъдат приложени към фалшивите „целеви“ изображения, което води до нереалистично изглеждащо генерирано изображение.
„Атаката на енкодера кара модела да мисли, че входното изображение (което трябва да се редактира) е друго изображение (напр. сиво изображение)“, каза докторантът на MIT и водещ автор на доклада, Хади Салман, пред Engadget. „Докато дифузионната атака принуждава дифузионния модел да прави редакции към някакво целево изображение (което също може да бъде някакво сиво или произволно изображение).“ Техниката не е безупречна, злонамерените участници биха могли да работят за обратно инженерство защитеното изображение потенциално чрез добавяне на цифров шум, изрязване или обръщане на картината.