Статья

Название статьи ОЦЕНКА КАЧЕСТВА МАШИННОГО ПЕРЕВОДА ТЕКСТА С ИСПОЛЬЗОВАНИЕМ МЕТОДА АНАЛИЗА НЕЧЕТКИХ ДУБЛИКАТОВ
Автор В. С. Корнилов, В. М. Глушань, А. Ю. Лозовой
Рубрика РАЗДЕЛ II. ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ И НЕЧЕТКИЕ СИСТЕМЫ
Месяц, год 07, 2017
Индекс УДК 004.912
DOI
Аннотация Статья посвящена разработке способов оценки качества и улучшения результатов машинного перевода. Машинный перевод рассматривается как полностью автоматический перевод текста на основе правил. Существующие методы и средства машинного перевода имеют как преимущества так и недостатки, заключающиеся в потере семантической целостности при переводе одного и того же текста с одного естественного языка на другой естественный язык, в итоге результат перевода в большинстве случаев некорректен. Целью работы является создание системы автоматической корректировки машинного перевода, результатом работы которой будет текст на уровне публикации. Научная новизна заключается в использовании процедуры получения обратного перевода, его сравнения с оригинальным текстом для численной оценки качества машинного перевода, а также поиска несоответствий с применением системы выявления нечетких дубликатов в параллельных корпусах и последующей их корректировки. В настоящее время существует широкий набор методов и приложений для оценки машинного и автоматизированного переводов с использованием обработки параллельных корпусов. Недостатком данных методов является невозможность отследить ошибки в конкретном параллельном корпусе. Существует широкий набор методов для анализа совпадений в неструктурированном тексте, применяемых для поиска плагиата в различных сферах. Классические методы анализа текста подразделяются на синтаксические методы анализа последовательностей, состоящих из символов, слов, словосочетаний или предложений и методы лексического анализа и определения контрольных сумм слов, словосочетаний, предложений и абзацев. Данные методы рассмотрены на предмет возможности их использования в системе автоматической корректировки машинного перевода текстов. Проанализированы перспективы использования данного метода.

Скачать в PDF

Ключевые слова Машинный перевод; качество перевода; обратимость перевода; поиск плагиата; нечеткий дубликат; автоматизированное редактирование перевода.
Библиографический список 1. Корнилов В.С., Глушань В.М. Критерии численной оценки качества машиннопереведен-ного текста // Информационные технологии, системный анализ и управление – ИТСАУ-2016: Сборник трудов ХIV Всероссийской научной конференции молодых ученых, ас-пирантов и студентов, 16-19 ноября 2016 г. Т. 1. – Таганрог: Изд-во ЮФУ, 2016.
– С. 170-175.
2. Яшина Л.И. Качество автоматического перевода текстов // Актуальные проблемы лингвистики – 2015: Материалы Международной научно-практической конференции студентов, аспирантов и молодых ученых, 15 апреля / отв. ред. Х.С. Шагбанова. – Тюмень: ТюмГНГУ, 2015. – 448 с.
3. Гуреева Л.В., Козьмина Н.А. Концепции перевода в контексте современных лингвисти-ческих исследований // Молодой ученый. – 2015. – № 11 (91). – 1148 с.
4. Цвиллинг М.Я., Туровер Г.Я. О критериях оценки перевода // Тетради переводчика.
– 1978. – № 15. – 32 с.
5. Alexandra Antonova, Alexey Misyurev Building a Web-based parallel corpus and filtering out machinetranslated text // Proceedings of the 4th Workshop on Building and Using Comparable Corpora, 49th Annual Meeting of the Association for Computational Linguistics, Portland, Or-egon, 24 June 2011. – P. 136-144.
6. Kishore Papineni, Salim Roukos, Todd Ward, Wei-Jing Zhu BLEU: a Method for Automatic Evaluation of Machine Translation // Proceedings of the 40th Annual Meeting of the Association for Computational Linguistics (ACL), Philadelphia, July 2002. – P. 311-318.
7. Ellen Cushing. Dawn of the Digital Sweatshop. – East Bay Express article, August 01, 2012.
– 12 p.
8. Serge Gladkoff Moses: from out of the box to industry quality level in three months // Language business innovation, TAUS user conference Portland (OR), USA 4-6 October 2010.
– 20 p.
9. Дербенев Н.В., Козлюк Д.А., Никитин В.В., Толчеев В.О. Экспериментальное исследова-ние методов выявления нечетких дубликатов научных публикаций // Машинное обучение и анализ данных. – 2014. – Т. 1, № 7. – 232 с.
10. Галатенко А.В., Галатенко В.В. О расстоянии Хэмминга между почти всеми функциями алгебры логики // Фундаментальная и прикладная математика. – 2009. – T. 15, № 5.
– C. 43-47.
11. Хромов Н.А. К задаче выявления нечетких дубликатов для обнаружения плагиата в на-учных публикациях и отчетных материалах // Конференции на факультете Физико-математических и естественных наук РУДН, Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем 2012. – М.: Изд-во РУДН, 2012. – С. 41-49.
12. Рубцов Д.Н., Барахнин В.Б. Выявление дубликатов в разнородных библиографических источниках // Вестник НГУ. Серия: Информационные технологии. – 2009. – Т. 7, № 3.
– C. 430-438.
13. Зеленков Ю.Г., Сегалович И.В. Сравнительный анализ методов определения нечетких дубликатов для Web-документов // Труды 9-ой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» – RCDL2007. Переславль-Залесский. – 2007. – С. 16-25.
14. Загорулько Ю.А., Саломатина Н.В., Серый А.С., Сидорова Е.А., Шестаков В.К. Выявле-ние нечетких дубликатов при автоматическом формировании тематических коллекций документов на основе Web-публикаций // Вестник Новосибирского государственного университета. Серия: Информационные технологии. – 2013. – Т. 11, Вып. 4. – С. 59-70.
15. Семенова А.В., Курейчик В.М. Обзор и анализ состояния проблемы обработки текстовой информации в системах машинного перевода // Информатика, вычислительная техника и инженерное образование. – 2014. – № 2 (17). – С. 76-93.
16. Pushpak Bhattacharyya Machine Translation. – CRC Press Taylor&Francis Group, 2015.
– 323 p.
17. Глушань В.М., Карелин В.П. Использование математических моделей принятия решений в интеллектуальных САПР // Известия ЮФУ. Технические науки. – 2007. – № 2 (77).
– С. 96-103.
18. Луцив Д.В., Кознов Д.В. Иерархический алгоритм DIFF при работе со сложными доку-ментами // Системное программирование. – 2012. − Т. 7. – С. 105-114.
19. Глушань В.М., Карелин В.П., Кузьменко О.Л. Нечеткие модели и методы многокритери-ального выбора в интеллектуальных системах поддержки принятия решений // Известия ЮФУ. Технические науки. – 2009. – № 4 (93). − С. 51-63.
20. Старостин А.С., Мальковский М.Г. Алгоритм синтаксического анализа, используемый в системе морфосинтаксического анализа«Treeton» // Труды международной конференции «Диалог 2007». – М.: Изд-во МГУ, 2007. – С. 516-524.
21. Комарницкая О.И., Комарницкая И.И. Метод семантического сравнения нечеткой информации при проверке текстов на наличие плагиата // Философские проблемы информационных технологий и киберпространства. Прикладные аспекты информационных технологий. – Пятигорск: Изд-во ПГЛУ, 2015. – № 2 (10). – С. 127-139.

Comments are closed.