УДК 621.395

КОМПЛЕКСНЫЙ АЛГОРИТМ ОБЪЕКТИВНОЙ ОЦЕНКИ КАЧЕСТВА ДЕКОДИРОВАННОГО РЕЧЕВОГО СИГНАЛА ПРИ ДЕЙСТВИИ АКУСТИЧЕСКИХ ПОМЕХ

С.Н. Кириллов, В.Т. Дмитриев

Аннотация


Рассматриваются алгоритмы объективной оценки качества речи, основанные на измерении динамических и статических характеристик речевых сигналов на выходе кодека источника. Обоснована функциональная схема проведения экспериментальных исследований. Приведены результаты анализа корреляции объективной и субъективной оценки качества речи. Предложены модификации показателя объективной оценки качества на основе корреляции возбуждения спектра MESC и модификации показателя на основе вычисления функции ощущения спектральной динамики MFOSD. Предложен алгоритм формирования кривых регрессии, позволяющий выполнить преобразование объективной оценки к шкале субъективной оценки качества речи.
На основании использования наиболее точных модификаций показателей оценки качества речи для восстановленных речевых сигналов предложен комплексный алгоритм объективной аппаратурной оценки качества речи при воздействии на микрофон широкополосных и низкочастотных стационарных и нестационарных акустических помех. Показано, что применение комплексного алгоритма позволяет получить объективную оценку качества речи согласно ГОСТ Р 50840-95 со средней ошибкой не более 0,35 балла при отношениях сигнал-шум от 30 дБ до -10 дБ.

Ключевые слова


оценка качества речи; низкоскоростное кодирование; канал связи; акустическая помеха

Полный текст:

PDF

Литература


  1. ГОСТ Р 50840-95. Передача речи по трактам связи // М.: Госстандарт России. 1995. 202 с.
  2. ГОСТ Р 51061-97 «Системы низкоскоростной передачи речи по цифровым каналам // М.: Госстандарт России. 1997. 24 с.
  3. Кропотов Ю.А., Ермолаев В.А. Моделирование и методы исследований акустических сигналов, шумов и помех в системах телекоммуникаций: монография // М. Берлин: Директ-Медиа. 2016. 251 с.
  4. Цыбулин М.К., Бочаров М.О. Анализ методов оценки качества передачи речевой информации по каналам связи различной структуры // Электросвязь. 2008. № 11. С. 46–48.
  5. Шелухин О.И., Лукьянцев Н.Ф. Цифровая обработка и передача речи / под ред. О.И. Шелухина // М.: Радио и связь. 2000. 456 с.
  6. Афанасьев А.А., Ильюшин М.В. Использование психоакустической модели слуха при разработке вокодеров с линейным предсказанием // Цифровая обработка сигналов. 2011. № 1. С. 49–52.
  7. Мурадова А. А. Методы оценки качества передачи речевых пакетов при исследовании надежности сети NGN // Молодой ученый. 2013. № 10. С. 162–168.
  8. Павловец А.Н., Петровский А.А. Использование закономерностей психоакустики в процедуре квантования параметров гармонической модели речевого сигнала // Речевые технологии. 2008. № 4. С. 55–60.
  9. Yang W. Enhanced Modified Bark Spectral Distortion (EMBSD): An Objective Speech Quality Measure Based On Audible Distortion And Cognition Model // Temple University. 1999. 164 p.
  10. Ozer H., Avcibas I., Sankur B., Memon N. Steganalysis of audio based on audio quality metrics, in: SPIE Electronic Imaging Conf. on Security and Watermarking of Multimedia Contents // Proceedings of SPIE. 2003. vol. 5020. pp. 55–66.
  11. Liu W.M. et al. Assessment of objective quality measures for speech intelligibility estimation // 2006 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2006). 2006. vol. 1. pp. 699–702.
  12. Соломенник А.И. и др. Оценка качества синтезированной речи: проблемы и решения // Изв. Вузов. Приборостроение. 2013. Т. 56. № 2. С. 38–42.
  13. Столбов М.Б. Алгоритм оценки отношения сигнал/шум речевых сигналов // Научно-технический вестник информационных технологий, механики, оптики. 2012. № 6(82). С. 67–72.
  14. Lee M-K, Kang H-G, Speech quality estimation of voice over internet protocol codec using a packet loss impairment model // J. Acoust. Soc. Am. 2013. vol. 134(5). pp. 438–444.
  15. Beerends J.G. et al. Perceptual objective listening quality assessment (POLQA), the third generation ITU-T standard for end-to-end speech quality measurement part I—Temporal alignment // Journal of the Audio Engineering Society. 2013. vol. 61(6). pp. 366–384.
  16. Hines A. et al. Robustness of speech quality metrics to background noise and network degradations: Comparing ViSQOL, PESQ and POLQA // 2013 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). 2013. pp. 3697–3701.
  17. Möller S, Heusdens R, Objective estimation of speech quality for communication systems // Proc. of the IEEE. 2013. vol. 101(9). pp. 1955–1967.
  18. Терехов А.Н., Рысин Ю.С. Алгоритм определения факторов, влияющих на качество восприятия телефонных услуг связи // Электросвязь. 2016. № 3. С. 65–68.
  19. Počta P., Melvin H., Hines A. An analysis of the impact of playout delay adjustments introduced by voip jitter buffers on listening speech quality // Acta Acustica united with Acustica. 2015. no. 101(3). pp. 616–631.
  20. Пирогов А. А. Вокодерная телефония // М.: Связь.1974. 536 с.
  21. Соболев В.Н. Информационные технологии в синтетической акустике // М.: ИРИАС. 2007. 360 с.
  22. Кириллов С.Н., Ромашкин Ю.Н., Картавенко Я.О., Дмитриев В.Т. Аналитическая оценки качества речи на выходе систем низкоскоростного кодирования при воздействии акустических помех // Речевые технологии. 2012. № 4. С. 16–23.
  23. Кириллов С.Н., Дмитриев В.Т., Картавенко Я.О. Алгоритм объективной оценки качества декодированного речевого сигнала на основе изменения спектральной динамики критических полос спектра // Вестник РГРТУ. 2011. № 3(37). С. 3–7.
  24. Илюшин М.В., Дмитриев В.Т., Басов О.О., Тарусов В.А. Качество передачи речи и его оценка: учебное пособие / под общ. ред. С.Н. Кириллова // Орел: Академия ФСО России. 2015. 104 с.
  25. Цвикер Э., Фельдкеллер Р. Ухо как приемник информации: 2-е изд., перераб. и доп. // М.: Связь. 1971. 255 с.


Сергей Николаевич Кириллов - д-р техн. наук, профессор, заведующий кафедрой радиоуправления и связи факультета радиотехники и телекоммуникаций, ФГБОУ ВО "Рязанский государственный радиотехнический университет" (РГРТУ).
Область научных интересов: теория многокритериального синтеза сложных дискретных сигналов и устройств их обработки при действии мешающих факторов, обработка речевых сигналов.
Число научных публикаций: 650.

Адрес (E-mail): kirillov.rsreu@gmail.com
Почтовый адрес: ул. Гагарина, 59/1, 390005, Рязань
Телефон: +7(4912)46-03-62
Факс: +7(4912)92-22-15


Владимир Тимурович Дмитриев - к-т техн. наук, доцент, доцент кафедры радиоуправления и связи факультета радиотехники и телекоммуникаций, ФГБОУ ВО "Рязанский государственный радиотехнический университет" (РГРТУ).
Область научных интересов: методы и алгоритмы обработки речевых сигналов, адаптивные системы обработки.
Число научных публикаций: 200.

Адрес (E-mail): vol77@rambler.ru
Почтовый адрес: ул. Гагарина, 59/1, 390005, Рязань
Телефон: +7(4912)46-03-62
Факс: +7(4912)92-22-15




DOI: http://dx.doi.org/10.15622/sp.56.2

Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 License.