УДК 004.93'1, 004.912, 81'32

ПРИМЕНЕНИЕ ЛИНГВИСТИЧЕСКИХ ПРИЗНАКОВ ДЛЯ АВТОМАТИЧЕСКОГО ОПРЕДЕЛЕНИЯ ИНТОНАЦИОННО ВЫДЕЛЕННЫХ СЛОВ В РУССКОЯЗЫЧНОМ ТЕКСТЕ

Д.А. Кочаров, А.П. Меньшикова

Аннотация


В данной статье предлагается метод автоматического предсказания интонационно выделенных слов, то есть наиболее важной информации в высказывании. Метод опирается на использование лексических, грамматических и синтаксических маркеров интонационного выделения, что делает возможным его применение в системах синтеза речи по тексту, где реализация интонационного выделения может повысить естественность звучания синтезированной речи.
В качестве методов классификации независимо друг от друга использовалось несколько различных моделей: наивная байесовская модель, модель максимальной энтропии и условные случайные поля. Сопоставление результатов, полученных в ходе нескольких экспериментов, показало, что использовавшиеся дискриминативные модели демонстрируют сбалансированные и примерно равные значения метрик качества, в то время как генеративная модель потенциально более пригодна для поиска интонационно выделенных слов в речевом сигнале.
Результаты, представленные в статье, сравнимы и в некоторых случаях превосходят аналогичные системы, разработанные для других языков.

Ключевые слова


интонационное выделение, просодия; лексический анализ; синтаксический анализ; байесовский классификатор; метод максимальной энтропии; условные случайные поля; русский язык

Полный текст:

PDF

Литература


  1. Strom V. et al. Modelling Prominence and Emphasis Improves Unit-Selection Synthesis // Proceedings of Interspeech 2008. 2008.
  2. Brenier J., Cer D., Jurafsky D. The detection of emphatic words using acoustic and lexical features // Ninth European Conference on Speech Communication and Technology (ICSLP’2005). 2005.
  3. Nakajima H., Mizuno H., Sakauchi S. Emphasized Accent Phrase Prediction from Text for Advertisement Text-To-Speech Synthesis // 28th Pacific Asia Conference on Language, Information and Computation (PACLIC’2014). 2014. pp. 170–177.
  4. Hovy D. et al. Analysis and Modeling of “Focus” in Context // Proceedings of Interspeech 2013. 2013. pp. 402–406.
  5. Mishra T., Sridhar V.K.R., Conkie A. Word Prominence Detection using Robust yet Simple Prosodic Features // Proceedings of Interspeech 2012. 2012.
  6. Cernak M., Honnet P.E. An empirical model of emphatic word detection // Proceedings of Interspeech 2015. 2015. pp. 573–577.
  7. Tamburini F. Automatic detection of prosodic prominence by means of acoustic analyses // Lingue e linguaggio. 2015. vol. 14. no. 1. pp. 131–148.
  8. Johnson D.O., Kang O. Automatic prominent syllable detection with machine learning classifiers // International Journal of Speech Technology. 2015. vol. 18. no. 4. pp. 583–592.
  9. Suni A., Aalto D., Vainio M. Hierarchical representation of prosody for statistical speech synthesis // Computer Speech and Language Journal. 2017. vol. 45. pp. 123–136.
  10. Heckmann M. Audio-visual word prominence detection from clean and noisy speech // Computer Speech & Language. 2018. vol. 48. pp. 15–30.
  11. Николаева Т.М. Семантика акцентного выделения // М.: Наука. 1982. 106 с.
  12. Кодзасов С.В. Законы фразовой акцентуации // Просодический строй русской речи. М.: Институт русского языка РАН. 1996. С. 181–206.
  13. Ковтунова И.И. Современный русский язык. Порядок слов и актуальное членение предложения // М.: Едиториал УРСС. 2002. 240 с.
  14. Слюсарь Н.А. На стыке теорий. Грамматика и информационная структура в русском и других языках // Либроком. 2009. 416 с.
  15. Luchkina T., Ionin T. The effect of prosody on availability of inverse scope in Russian // Formal Approaches to Slavic Linguistics. 2015. vol. 23. pp. 418-437.
  16. Andor D. et al. Globally normalized transition-based neural networks // Proceedings of the 54th Annual Meeting of the Association for Computational Linguistics. 2016. vol. 1. pp. 2442–2452.
  17. Alberti C. et al. SyntaxNet Models for the CoNLL 2017 Shared Task // arXiv preprint arXiv: 1703.04929. 2017.
  18. Nivre J., Boguslavsky I., Iomdin L. Parsing the SynTagRus Treebank of Russian // Proceedings of the 22nd International Conference on Computational Linguistics (CoLING’2008). 2008. vol. 2. pp. 641–648.
  19. Nivre J.et al. Universal Dependencies v1: A multilingual treebank collection // Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC’2016). 2016.
  20. Korobov M. Morphological Analyzer and Generator for Russian and Ukrainian Languages // International Conference on Analysis of Images, Social Networks and Texts (AIST’2015). 2015. pp. 320–332.
  21. McCallum A., Nigam K. A comparison of event models for Naive Bayes text classification // Proceedings of AAAI/ICML Workshop on Learning for Text Categorization. 1998. pp. 41–48.
  22. Bird S., Klein E., Loper E. Natural Language Processing with Python // O'Reilly Media, Inc. 2009. 504 p.
  23. Berger A., Pietra V., Pietra S. A Maximum Entropy Approach to Natural Language Processing // Computational Linguistics. 1996. vol. 22. no. 1. pp. 39–71.
  24. Collobert R. et al. Natural language processing (almost) from scratch // Journal of Machine Learning Research. 2011. vol. 12. no. Aug. pp. 2493–2537.
  25. Kudo T. CRF++: Yet Another CRF Toolkit. 2013. URL: https://taku910.github.io/crfpp (дата обращения: 15.09.2017).
  26. Skrelin P. et al. CORPRES - Corpus of Russian Professionally Read Speech // 13th International Conference Text, Speech and Dialogue (TSD’2010). 2010. pp. 392–399.


Даниил Александрович Кочаров - к-т филол. наук, доцент кафедры фонетики и методики преподавания иностранных языков, Санкт-Петербургский государственный университет (СПбГУ).
Область научных интересов: автоматическая обработка речи и текста, математическая лингвистика, речевые технологии, фонетика, фонология.
Число научных публикаций: 42.

Адрес (E-mail): kocharov@phonetics.pu.ru
Почтовый адрес: Университетская наб., 11, Санкт-Петербург, 199034
Телефон: +78123289565


Алла Павловна Меньшикова - лаборант-исследователь филологического факультета, Санкт-Петербургский государственный университет (СПбГУ), студент кафедры математической лингвистики, Санкт-Петербургский государственный университет (СПбГУ).
Область научных интересов: математическая лингвистика, речевые технологии.
Число научных публикаций: 1.

Адрес (E-mail): menshikova.alla2016@yandex.ru
Почтовый адрес: Университетская наб., 11, Санкт-Петербург, 199034
Телефон: +79217638387




DOI: http://dx.doi.org/10.15622/sp.55.9