Статья

Название статьи О РАСПОЗНАВАНИИ СВЕРХБОЛЬШИХ СЛОВАРЕЙ РУССКИХ СЛОВОФОРМ С ИСПОЛЬЗОВАНИЕМ КВАЗИОСНОВ
Автор В.Ю. Шелепов, А.В. Ниценко
Рубрика РАЗДЕЛ II. СИСТЕМЫ УПРАВЛЕНИЯ, МОДЕЛИРОВАНИЕ И АЛГОРИТМЫ
Месяц, год 04, 2016
Индекс УДК 004.89:004.93
DOI
Аннотация Предлагается метод распознавания слов сверхбольшого словаря русских словоформ, использующий принадлежащий авторам способ автоматической сегментации речевого сигнала. Сам метод применим как для DTW-распознавания, так и для распознавания с помощью скрытых марковских моделей. Однако при описании практического распознавания речевых единиц имеется в виду развиваемый авторами метод дифонного DTW- распознавания. В связи с этим приводится понятие формализованного дифона. Далее определяются понятия квазиосновы и квазифлексии. Предлагается общий алгоритм построения квазиоснов для заданного списка словоформ. Излагается алгоритм распознавания множества русских причастий с использованием квазиоснов. С целью ускорения распознавания большого словаря квазиоснов предлагается алгоритм распознавания начальных звуков слов или достаточно узких классов, которым они принадлежат. Отметим в заключение следующее. Существует объективная проблема надежного распознавания коротких слов. Поэтому квазиосновы хорошо распознаются, когда они достаточно длинные. В общем же случае уязвимым местом при использовании квазиоснов является то, что приходится распознавать укороченные по сравнению с первоначальными словами речевые отрезки (шагом в направлении преодоления этого затруднения служит вышеупомянутая процедура классификации первого звука). Тем не менее, использование квазиоснов представляется разумным при распознавании больших и сверхбольших словарей русских словоформ.

Скачать в PDF

Ключевые слова Cегментация; квазиосонова; словоформы с вхождением; участки первого звука; классы распознавания; переходы в зависимости от промежуточных результатов распознавания.
Библиографический список 1. Бурибаева А.К., Дорохина Г.В., Ниценко А.В., Шелепов В.Ю. Сегментация и дифонное распознавание речевых сигналов // Труды СПИИРАН. – 2013. – Вып. 31. – С. 20-42.
2. Mporas I., Ganchev T. and Fakotakis N. Speech segmentation using regression fusion of boundary predictions // Computer Speech and Language. – 2010. – Vol. 24, No. 2. – P. 273-288.
3. Gуmez J.A., Calvo M. Improvements on Automatic Speech Segmentation at the Phonetic Level // Progress in Pattern Recognition, Image Analysis, Computer Vision, and Applications. – 2011. – Vol. 7042. – P. 557-564.
4. Natarajan V.A., Jothilakshmi S. Segmentation of Continuous Speech into Consonant and Vowel Units using Formant Frequencies // International Journal of Computer Applications. – 2012. – Vol. 56, No. 15. – P. 24-27.
5. Yuan J., Ryant N., Liberman M. [and all]. Automatic phonetic segmentation using boundary models // Proceedings of Interspeech 2013. – 2013. – P. 2306-2310.
6. Patc Z., Mizera P., Pollak P. Phonetic Segmentation Using KALDI and Reduced Pronunciation Detection in Causal Czech Speech // Text, Speech, and Dialogue. – 2015. – Vol. 9302. – Р. 433-441.
7. Zhijian Ou, Xiao Ji. A study of large vocabulary speech recognition decoding using finite-state graphs // Chinese Spoken Language Processing (ISCSLP), 7th International Symposium. – 2010. – P. 123-128.
8. Susman D., Kopru S., Yazici A. Turkish Large Vocabulary Continuous Speech Recognition by using limited audio corpus // Signal Processing and Communications Applications Conference. – 2012. – P. 1-4.
9. Saon G. Jen-Tzung Chien. Large-Vocabulary Continuous Speech Recognition Systems: A Look at Some Recent Advances // Signal Processing Magazine. – 2012. – Vol. 29, No 6. – P. 18-33.
10. Byrne W., Hajič J., Ircing P. [and all]. Morpheme Based Language Models for Speech Recognition of Czech // Text, Speech and Dialogue. – 2002. – Vol. 1902. – P. 211-216.
11. Saraswathi S., Geetha T. Morpheme based language model for Tamil speech recognition system // The International Arab Journal of Information Technology. – 2007. – Vol. 4, No. 3. – P. 214-219.
12. Rotovnik T., Maučec M.S., Kačič Z. Large vocabulary continuous speech recognition of an inflected language using stems and endings // Speech Communication. – 2007. – Vol. 49, No. 6. – P. 437-452.
13. Hong Kai Sze, Tan Tien Ping, Tang Enya Kong, Cheah Yu-N. Linguistic stem concatenation for malay large vocabulary continuous speech recognition // Research and Development (SCOReD), 2010 IEEE Student Conference on. – 2010. – P. 144-148.
14. Karpov, I. Kipytkova, A. Ronzhin. Very large vocabulary ASR for spoken Russian with syntactic and morphemic analysis // Proceedings of INTERSPEECH’ 2011, Florence. – 2011. – P. 3161-3164, pp. 291-296.
15. Stas J., Hladek D., Juhar J., Zlacky D. Analysis of morph-based language modeling and speech recognition in Slovak // Information and communication technologies and services. – Vol. 10, No. 4. – P. 2012, special issue.
16. Шелепов В.Ю., Ниценко А.В. К проблеме распознавания слитной речи // Искусственный интеллект. – 2012. – №. 4. – C. 272-281.
17. Шелепов В.Ю., Ниценко А.В. О некоторых вопросах, связанных с дифонным распознаванием и распознаванием слитной речи // Искусственный интеллект. – 2013. – № 3 – C. 209-216.
18. Nicenko A.V. A «by part» method of Russian word speech recognition // Eurasian Journal of Mathematical and Computer Applications. – 2014. – Vol. 1, Issue 2. – P. 102-109.
19. Зализняк А.А. Грамматический словарь русского языка. – М.: Русский язык, 1977. – 879 c.
20. Дорохина Г.В. Павлюкова А.П. Модуль морфологического анализа слов русского языка // Искусственный интеллект. – 2004. – № 3. – С. 636-642.
21. Патент України № 78806 «Пристрій для збереження і пошуку рядкових величин та спосіб збереження і пошуку рядкових величин» Власник: Інститут проблем штучного інтелекту / Винахідник Дорохіна Г.В. // Промислова власність. – Бюл. № 5. 25.04.2007.
22. Buribayeva A.K., Sharipbay A.A. Kazakh Vowel Recognition at the Beginning of Words // Mediterranean Journal of Social Sciences, MCSER Publishing, Rome-Italy. – 2015. – Vol. 6, No 2, S4. – P. 121-127.

Comments are closed.