През 2020 г. общността на Уикипедия беше, когато стана ясно, че американски тийнейджър е написал 27 000 записа на език, който не говори. Епизодът беше напомняне, че онлайн енциклопедията не е идеален източник на информация. Понякога хората ще се опитват да редактират записи в Уикипедия от злонамереност, но често фактическите грешки идват от някой добронамерен човек, който прави грешка.

Това е проблем на Фондация Уикимедия наскоро партнира с компанията майка на Facebook Meta за адрес. Двамата са се прицелили в цитирането. Проблемът с бележките под линия в Wikipedia е, че има твърде много, за да могат редакторите-доброволци на платформата да ги проверят. С нарастването на уебсайта с повече от статии всеки месец, безброй цитати са непълни, липсващи или просто неточни.

Meta разработи AI модел, който може автоматично да сканира цитати в мащаб, за да провери тяхната точност. Може също така да предложи алтернативни цитати, когато открие пасаж с лош източник. Когато човешките редактори на Wikipedia оценяват цитатите, те разчитат на здравия разум и опита. Когато AI върши същата работа, той използва трансформационен модел за разбиране на естествения език (NLU), който се опитва да разбере различните връзки на думи и фрази в изречение. на Мета Сфера база данни, състояща се от повече от 134 милиона уеб страници, действа като индекс на знанията на системата. Докато се занимава със задачата си да проверява цитатите в дадена статия, моделът е проектиран да намира един единствен източник за проверка на всяко твърдение.

За да илюстрира възможностите на AI, Мета сподели пример за непълен цитат, който моделът намери на страницата на Wikipedia за . В раздела „Забележителни чернокраки хора“ статията споменава Джо Хип, първият индианец, който се състезава за световната титла на WBA в тежка категория. Свързаният уебсайт не споменава Hipp или бокс. Търсейки в базата данни на Sphere, моделът намери по-подходящ цитат в статия от 2015 г Great Falls Tribune. Ето пасажа, маркиран от модела:

През 1989 г. в залеза на кариерата си, [Marvin] Camel се би с Joe Hipp от Blackfeet Nation. Хип, който стана първият индианец, който се бори за световната титла в тежка категория, каза, че битката е една от най-странните в кариерата му.

Забележителното в горния пасаж е, че не се споменава изрично бокса. Моделът на Meta намери подходяща референция благодарение на възможностите си за естествен език. Инструментът може един ден да помогне с проблемите на Facebook с дезинформацията. „В по-общ план се надяваме, че нашата работа може да се използва за подпомагане на усилията за проверка на фактите и за повишаване на общата надеждност на информацията онлайн“, създателите на модела . Междувременно Meta се надява да изгради платформа, която редакторите на Wikipedia могат да използват за систематична проверка и коригиране на бележки под линия.