Mozilla представи разширение с машинен офлайн превод

Mozilla представи разширение с машинен офлайн превод

Компанията Mozilla представи за Firefox допълнението Firefox Translations 0.4. Досега то се наричаше Bergamot Translate и използва самостоятелна система за машинен превод, работеща на страната на браузъра без да използват каквито и да било външни онлайн услуги. За превода от един език на друг се използва енджина bergamot-translator, върху който се работи в рамките на инициативата Bergamot. Новият проект се развива със силите на разработчиците от Mozilla съвместно с специалистите на университетите от Великобритания, Естония и Чехия с финансовата поддръжка на Европейския съюз. Кодът разпространява под MPL-2.0 лиценза.

Самият енджин е написан на програмния език C++ и се компилира в междинния бинарен код WebAssembly с помощта на компилатора Emscripten. Енджинът е софтуерен слой за фреймуърка за машинен превод Marian, в който се използва невронна мрежа с обратна връзка и езикови модели на базата на трансформъри. За ускоряване на обучението и превода се прилагат възможностите на графичния процесор, ако е наличен. Marian се използва за осигуряване работата на услугата Microsoft Translator и върху него работят предимно програмистите на Microsoft.

Във Firefox Translations е реализирана поддръжката на превод от естонски и испански език към английски и обратното, както и от английски към германски. Производителността на превода е около 500 до 600 думи в минута. Даден е приоритет за превеждане на текста, който се вижда в прозореца на браузъра. В новата версия е предоставена възможност за автоматично зареждане на файловете с необходимите модели за превод при първия опит за осъществяване на превод от един език към друг. Самите файлове с моделите заемат около 15 MB за всеки език. Автоматичното зареждане на съответния модел води до неголямо забавяне преди началото на първия превод, но за сметка на това кардинално е намален размерът на самото допълнение, което сега е с големина 3,6 MB вместо предишните 124 MB.

Също така, в новата версия значително е ускорено зареждането на моделите в паметта – преди за зареждането на съответния модел бяха необходими от 10 до 30 секунди, а сега той се зарежда на практика мигновено. Ако преводът на дадена страница отнема над 3 секунди, в интерфейса на допълнението се показва индикатор на прогреса на изпълнението на операцията. Преводът се осъществява последователно отгоре надолу, започвайки от видимата част на програмния прозорец на уеб браузъра.

По подразбиране е включено изпращането на телеметрия, включваща данни за взаимодействието на потребителя с интерфейса на разширението, информация за производителността и скоростта на извършваните вътрешни операции, както и техническа информация за системата – CPU, GPU и други.

Засега допълнението може да бъде инсталирано само в нощните компилации на Firefox при изключена проверка на разширенията относно техния цифров подпис („xpinstall.signatures.dev-root=true“ и „xpinstall.signatures.required=false“ в about :config).



Източник: www.kaldata.com