вълна

Изобилие за премахване: 10 години прозрачност на известието на Google DMCA

Сподели

Точно преди десет години Google разшири своя отчет за прозрачност с нов раздел, посветен на заявките за сваляне по DMCA.

За първи път външни лица успяха да видят към какви URL адреси се насочват притежателите на авторски права и в какво количество.

Решението тази информация да се направи публично достояние беше отчасти предизвикано от бързото увеличаване на исканията за премахване. Това оказва влияние върху „свободния поток на информация“, според търсачката.

„Вярваме, че отвореността е от решаващо значение за бъдещето на Интернет. Когато нещо попречи на свободния поток на информация, ние вярваме, че трябва да има прозрачност относно това какво може да бъде този блок.

Според Фред фон Ломан, старши съветник по авторските права на Google по това време, известията за DMCA нарастват до небесата.

„В днешни дни не е необичайно да получаваме повече от 250 000 искания всяка седмица, което е повече от това, което собствениците на авторски права поискаха да премахнем през цялата 2009 г.“, Ван Ломан написа по времето.

От 250 000 до 1 000 000 000 сваляне на година

Погледнато назад, това беше само началото на експлозия за сваляне. Няколко години по-късно Google обработва повече от 20 милиона известия DMCA на седмица, което означава повече от милиард годишно.

Тази крива на растеж в крайна сметка се изравнява и през последните години обемът на свалянето започна да намалява. Това отчасти се дължи на различните алгоритми за борба с пиратството, които избутват пиратското съдържание надолу в резултатите от търсенето.

Чрез понижаване на резултатите от пиратските сайтове, нарушаващото съдържание става по-трудно за намиране в търсачката. В резултат на това Google вече обработва „само“ няколкостотин милиона заявки по DMCA годишно.

След десет години от прозрачност при сваляне, разглеждаме общите суми до момента, които са доста впечатляващи. През последното десетилетие притежателите на права поискаха от Google да премахне 5,75 милиарда URL адреса, за които се твърди, че се свързват със съдържание, нарушаващо авторски права.

Тези заявки за сваляне идват от малко над 300 000 различни притежатели на авторски права. Британската музикална група BPI е най-плодотворният изпращач. С 570 милиона докладвани връзки, това е добро за почти 10% от всички заявки за сваляне.

Разглеждайки целевите домейни, виждаме, че 4shared.com е начело с 68 милиона отчетени URL адреса. Повечето от тях бяха маркирани преди няколко години. През последните години сайтът е маркиран „само“ няколко хиляди пъти седмично, с по-малко от милион съобщени връзки годишно.

Първите пет най-целенасочени имена на домейни се допълват с несъществуващия сайт mp3toys.xyz, хостинг платформи rapidgator.net, chomikuj.pl и uploaded.net, както и деблокиращия прокси портал unblocksites.co.

Не всички докладвани URL адреси са премахнати

Цифрите се отнасят за броя на URL адресите, които са докладвани, но не всички от тях всъщност са премахнати от търсачката. Статистиката също така отчита дублиращи се отчети, фалшиви твърдения и URL адреси, които не са индексирани от Google.

Например, ако погледнем отчетите от „MG Premium” на MindGeek, виждаме, че компанията отчита над 494 милиона URL адреса през годините. Малко повече от половината от тях всъщност бяха премахнати от Google.

mg премия

От останалите URL адреси 128 милиона не бяха в индекса на Google. Те са поставени в списък с превантивни блокове, за да се предотврати появата им в резултатите от търсенето по-късно. Други 70 милиона връзки бяха класифицирани като дублиращи се, докато близо 7 милиона бяха отхвърлени по други причини.

Грешки и злоупотреби

Въпреки че тези числа са интересни сами по себе си, най-големият принос на доклада за прозрачност е възможността външни лица да забелязват неизправни и злоупотребяващи известия. Това е възможно, защото Google споделя всички докладвани връзки с База данни Lumenкойто се управлява от Berkman Klein Center в Харвард.

През годините тази база данни ни позволи да забележим хиляди проблемни сваляне, вариращи от честни грешки, през автоматизирани грешки при сваляне до обикновена злоупотреба.

Има много примери за грешки, които можем да споменем. Microsoft веднъж се насочи към BBC, Wikipedia и правителството на САЩ; Филмовите студия поискаха от Google да премахне собствените им филми; Френска база данни за филми и телевизионни предавания е насочена към Netflix и Rotten Tomatoes и т.н.

С милиарди докладвани URL адреси не е изненада, че тези грешки се случват, но като ги посочат публично, отговорните могат да бъдат държани под отговорност. Това трябва да доведе до по-висок процент на точност на сваляне с течение на времето.

Ще бъде интересно да се види как се развиват тенденциите за сваляне през следващите години. Докато Google продължава своя отчет за прозрачност, ние със сигурност ще го следим.

Публикациите се превеждат автоматично с google translate

Източник: torrentfreak.com


Сподели