ОПРЕДЕЛЕНИЕ НАБОРА УСЛОВИЙ ДЛЯ АВТОМАТИЧЕСКОГО ПОИСКА ОПТИМАЛЬНОГО ВАРИАНТА ГИБРИДНОГО МАШИННОГО ПЕРЕВОДА ТЕКСТА НА ГРАФЕМНОМ УРОВНЕ

  • В. С. Корнилов Южный федеральный университет
  • В. М. Глушань Южный федеральный университет
  • А. Ю. Лозовой Южный федеральный университет
Ключевые слова: Гибридный машинный перевод, качество перевода, обратный перевод, редакционные расстояния, графемный уровень, алфавитные языки

Аннотация

Статья посвящена алгоритмическому поиску оптимальных решений при оценке и по-
вышении качества гибридного машинного перевода текста. Объектом исследования явля-
ются тексты на любых алфавитных языках с различной базой (алфавитом), а также их
переводы на другие алфавитные языки. В настоящее время существующие методы и сред-
ства гибридного машинного перевода отличаются большим многообразием алгоритмов
оценки качества, однако, недостатком данных методов является отсутствие четких
критериев, ограничений и схемы оценивания, в итоге результат перевода в большинстве
случаев не соответствует уровню публикации. Целью работы является определение набо-
ра условий для автоматического поиска оптимального варианта гибридного машинного
перевода текста на графемном уровне. Основными решаемыми задачами в ходе исследова-
ния являются поиск качественных и количественных условий, в том числе максимальных,
минимальных и средних значений длин переводов, обратных переводов и редакционных рас-
стояний между парами текстов, имеющими одинаковый смысл. Научная новизна заключа-
ется в использовании графического представления модели алфавитных языков на графем-
ном уровне в виде декартовой системы координат с размерностью, равной единичному
редакционному расстоянию (Левенштейна). При решении использованы следствия теоре-
мы де Гуа, действующие Правила Стандартизации ПР 50.1.027–2014 «Правила оказания
переводческих и особых видов лингвистических услуг», метод деканонизации и модель «ори-
гинальный текст – перевод – обратный перевод». В результате получены действительные
и практически применимые решения для рассматриваемых задач. В связи с этим данная
работа может быть интересна для широкого круга специалистов, занимающихся пробле-
мами машинного перевода и переводоведением.

Литература

1. Kornilov V., Glushan V., Lozovoy A. Numerical Assessment of Machine Translation Quality
by Method of Near Duplicates Analysis, Proceedings of the 11th IEEE International Conference
on Application of Information and Communication Technologies, AICT2017, Moscow,
Russia, Vol. 2, pp. 363-367. DOI: 10.1109/ICAICT.2017.8686861.
2. Levenshteyn V.I. Dvoichnye kody s ispravleniem vypadeniy, vstavok i zameshcheniy simvolov
[Binary Codes with Correction for Deletions and Insertions of the Symbols], Doklady AN
SSSR [Reports of the USSR Academy of Sciences], 1965, Vol. 163, No. 4, pp. 845-848.
3. Bhattacharyya P. Machine Translation, CRC Press Taylor & Francis Group, 2015, pp. 5-6.
ISBN 9781439897188.
4. Pravila Standartizatsii PR 50.1.027–2014, Pravila okazaniya perevodcheskikh i osobykh vidov
lingvisticheskikh uslug [Standardization Rules PR 50.1.027–2014Rules for the Provision of
Translation and special types of Linguistic Services]. Moscow: Izd-vo FGUP
«Standartinform», 2014, 20 p.
5. Glushan' V.M., Kornilov V.S., Lozovoy A.Yu. Eksperimental'noe opredelenie prigodnosti
pristateynykh annotatsiy k russko-angliyskomu gibridnomu mashinnomu perevodu do i posle
avtomaticheskogo predredaktirovaniya [Experimental Definition of Suitability of the Abstracts
of Papers to the Russian-English Hybrid Machine Translation before and after the Automatic
Pre-editing], Vestnik RGRTU [Bulletin of RSTU], 2019, No. 69, pp. 102-109. DOI:
10.21667/1995-4565-2019-69-102-109.
6. Tsvilling M.Ya., Turover G.Ya. O kriteriyakh otsenki perevoda [About the criteria for assessing
the translation], Tetradi perevodchika [Interpreters' notebooks]. Issue 15. Moscow:
Mezhdunar. Otnosheniya, 1973, pp. 5. Available at: https://wt-blog.net/perevodchiku/okriterijah-
ocenki-perevoda-cvilling-turover.html (accessed 06 November 2019).
7. Maslov S.Yu. Obratnyy metod ustanovleniya vyvodimosti dlya logicheskikh ischisleniy.
Logicheskie i logiko-matematicheskie ischisleniya [An Inverse Method of Establishing Deducibility
for Logical Calculi. Logical and Logical-Mathematical Calculus], Tr. MIAN SSSR [Proceedings
of the Steklov Institute of Mathematics], 1968, No. 98, pp. 26-87.
8. Bobber R.J. Underwater Electroacoustic Measurements, Naval Research Laboratory Underwater
Sound Reference Division Orlando. Florida, 1970, pp. 31-33.
9. Zeng J., Lau T., Lin Sh.-B., Yao Yu. Global Convergence of Block Coordinate Descent in Deep
Learning, Proceedings of the 36th International Conference on Machine Learning. Long
Beach, California. PMLR 97, 2019. Available at: https://arxiv.org/pdf/1803.00225.pdf (accessed
06 November 19).
10. Yu. Nesterov, S. Stich Efficiency of Accelerated Coordinate Descent Method on Structured
Optimization Problems, CORE Discussion Paper, 2016, No. 03. DOI: 10.1137/16M1060182.
11. Potemkin S.B. Mashinnyy perevod kak sredstvo standartizatsii terminologii [Terminology
Database and Machine Translation], Vestnik Moskovskogo gosudarstvennogo oblastnogo
universiteta. Seriya: Lingvistika [Bulletin of the Moscow state regional University. Linguistics
Series], 2017, No. 5, pp. 77-84. DOI: 10.18384/2310-712X-2017-5-77-84.
12. Filippovich Yu.N., Sirenko A.V. Programmnyy kompleks issledovaniy psikholingvisticheskoy
modeli verbal'nogo soznaniya na osnove kognitivnogo i assotsiativnogo eksperimentov [Software
to Research Psycholinguistic Model of Verbal Consciousness based on Cognitive and
Associative Experiments], Voprosy psikholingvistiki [Questions of Psycholinguistics], 2011,
No. 13, pp. 126-139. Available at: https://cyberleninka.ru/article/n/programmnyy-kompleksissledovaniy-
psiholingvisticheskoy-modeli-verbalnogo-soznaniya-na-osnove-kognitivnogo-iassotsiativnogo
(accessed 28 November 19).
13. Vakhrameev M.A. Redaktsionnoe rasstoyanie v svobodnykh levoregulyarnykh svyazkakh [Edit
Distance in Free Left Regular Bands], Vestnik Omskogo universiteta [Bulletin of Omsk University],
2018, Vol. 23, No. 3, pp. 15-19. DOI: 10.25513/1812-3996.2018.23(3).15-19.
14. Ponomareva N.S., Rebrova G.N., Kolina E.A. Primenenie rasstoyaniy redaktirovaniya pri
bioinformatsionnom analize genomov dlya zadach otsenki sostoyaniya reproduktivnoy sistemy
[Application of editing distances in bioinformatic analysis of genomes for problems of evaluating
the state of the reproductive system], Fundamental'nye issledovaniya [Fundamental study],
2015, No. 7-4, pp. 774-777. Available at: https://www.fundamental-research.ru/pdf/2015/7-
4/38819.pdf (accessed 24 November 2019).
15. Chernen'kiy V.M., Gapanyuk Yu.E. Metodika identifikatsii passazhira po ustanovochnym
dannym [Method of Passenger Identification according to Installation Data], Inzhenernyy
zhurnal: nauka i innovatsii [Engineering journal: science and innovation], 2012, Issue 3-89,
pp. 30-39. DOI: 10.18698/2308-6033-2012-3-89.
16. Teorema de Gua [de Goui’sTeorem]. Available at: http://poivs.tsput.ru/Downloads/Article/
5988/Teorema de Gua.pdf (accessed 24 November 2019).
17. Amir-Moéz, A.R.; Byerly, R.E. Pythagorean theorem in unitary spaces, Univ. Beograd. Publ.
Elektrotehn. Fak. Ser. Mat., 1996, No. 7, pp. 85-89. Available at: http://pefmath2.etf.rs/files/
116/844.pdf (accessed 24 November 2019).
18. Kheyfits А. The Theorem of Cosines for Pyramids, The College Mathematics Journal, 2004, Vol.
35, No. 5, pp. 385-388. DOI: 10.2307/4146849.
19. Beck A. The 2-Coordinate Descent Method for Solving Double-Sided Simplex Constrained Minimization
Problems, JOptim. Theory Appl., 2014, Vol. 162, pp. 892-919. DOI10.1007/s10957-013-
0491-5.
20. Nikolaev S.V. Algebraicheskie modeli sistem TSOS: vidy podobiya i kriterii blizosti [Algebraic
Models of DSP Systems: Types of Similarity and Proximity Criteria], Izvestiya TRTU
[Izvestiya TSURE], 2002, No. 1 (24), pp. 108-109.
Опубликован
2020-07-20
Выпуск
Раздел
РАЗДЕЛ I. ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ