ОКРЕМІ АСПЕКТИ ВИКОНАННЯ МАШИННОГО ПЕРЕКЛАДУ НА ОСНОВІ ПРАВИЛ
Анотація
У статті проведено загальний аналіз машинного перекладу на основі правил, виокремлено певні правила, якими керуються дослідники й розробники під час розроблення сучасних систем машинного перекладу. Розглянуто історичний досвід архітектури МП, що включає перше покоління (1960–1980-і роки) й базувалося на прямому перекладі, друге покоління (1980-і роки до теперішнього часу) складається із систем на основі правил, таких як системи передачі й інтерлінгва, а третє покоління (1990-і роки до теперішнього часу) включає системи на основі корпусів, які базуються або на статистичних даних, або на основі прикладів. Обґрунтовано, що машинний переклад на основі правил (Rule-based Machine Translation), також відомий як машинний переклад на основі знань (Knowledgebased Machine Translation), спирається на морфологічні, синтаксичні, семантичні й контекстуальні знання про вихідну та цільову мови відповідно і зв’язки між ними для виконання завдань перекладу. Доведено, що в машинному перекладі на основі правил лінгвіст формалізує лінгвістичні знання в лексиконах і правилах граматики. Ці знання використовуються системою для аналізу речень мовою оригіналу та їх перекладу. Розглянуто окремі системи МП на основі правил, такі як Systran, Lucy LT, Apertium, ParSit, і деякі системи, які концентруються виключно на перекладі окремих діалектів. Аналіз цих систем виявив, що, якщо вихідна мова багата морфологічно, для аналізу вихідного тексту використовуються специфічні мовні морфологічні правила. Потім застосовуються специфічні для мови синтаксичні правила для визначення синтаксичних категорій слів, що містяться в реченні. Зроблено висновок, що машинний переклад на основі правил – це парадигма машинного перекладу, у якій лінгвістичні знання кодуються експертом у формі правил, що перекладаються з вихідної мови цільовою.
Посилання
2. Sreelekha S. Statistical vs rule based machine translation; a case study on Indian language perspective. URL: https://arxiv.org/pdf/1708.04559.
3. Pirinen T.A. Apertium-fin-eng – rule-based shallow machine translation for WMT 2019 shared task. Proceedings of the Fourth Conference on Machine Translation (WMT). Florence, 2019. August 1–2. C. 335–341. URL: https://statmt.org/wmt19/pdf/53/WMT36.pdf.
4. Banitz B. Machine translation: a critical look at the performance of rule-based and statistical machine translation. Cad. Trad., Florianópolis. January, 2020. C. 54–71. URL: https://doi.org/10.5007/2175-7968.2020v40n1p54.
5. Somers H. Machine translation: latest developments. The Oxford handbook of translation studies / Malmkjaer, Kirsten ; Windle, Kevin (Ed). Oxford : Oxford University Press, 2011. C. 427–440. URL: https://personalpages.manchester.ac.uk/staff/harold.somers/Mitkov-book-chapter.pdf.
6. Improving translation quality of rule-based machine translation / Р. Charoenpornsawat et al. COLING-02: Machine Translation in Asia. 2002. URL: https://aclanthology.org/W02-1605.pdf.
7. Sghaiera M.A., Zrigui M. Rule-Based Machine Translation from Tunisian Dialect to Modern Standard Arabic. 24th International Conference on Knowledge-Based and Intelligent Information & Engineering Systems. Mohamed Ali Sghaier et al. Procedia Computer Science, 176 (2020). С. 310–319. URL: https://www.sciencedirect.com/science/article/pii/S1877050920318573.