Модели и методика определения речевой активности пользователя социо-киберфизической системы

Е. Е. Усина; А. Р. Шабанова; И. В. Лебедев

doi:10.21869/2223-1560-2019-23-6-225-240

Модели и методика определения речевой активности пользователя социо-киберфизической системы

Е. Е. Усина, А. Р. Шабанова, И. В. Лебедев

https://doi.org/10.21869/2223-1560-2019-23-6-225-240

Полный текст:

PDF (Rus)

сгенерировать QR код

Аннотация

Цель исследования. Статья посвящена разработке модельно-алгоритмического обеспечения процесса определения речевой активности пользователя социо-киберфизической системы. Предложена топологическая модель распределенной подсистемы аудиозаписи, реализуемой в ограниченных физических пространствах (помещениях), позволяющая оценить качество воспринимаемых аудиосигналов для случая распределения микрофонов в таком помещении. На основе данной модели разработана методика определения речевой активности пользователя социо-киберфизической системы, максимизирующая качество воспринимаемых аудиосигналов при перемещении пользователя в помещении за счет определения координат установки микрофонов.

Методы. Для наиболее полного анализа и формального описания распределенной подсистемы аудиозаписи был использован математический аппарат теории графов и теории множеств. С целью определения координат размещения микрофонов в одном помещении была разработана соответствующая методика, которая предполагает проведение таких операций, как излучение в помещении речевого сигнала с помощью акустического оборудования и замер уровней сигнала в предполагаемых для установки микрофонов местах с использованием шумомера.

Результаты. Были рассчитаны зависимости коэффициента корреляции объединенного сигнала и исходного тестового сигнала от расстояния до источника сигнала для различного количества микрофонов. Полученные зависимости позволяют определить минимально необходимое количество разнесенных микрофонов для обеспечения качественной записи речи пользователя. Результаты апробации разработанной методики речевой активности в конкретном помещении свидетельствуют о возможности и высокой эффективности определения речевой активности пользователя социо-киберфизической системы.

Заключение. Использование предложенной методики определения речевой активности пользователя социокиберфизической системы позволит повысить качество записи аудиосигнала и, как следствие, его последующей обработки с учетом возможного перемещения пользователя.

Ключевые слова

социо-киберфизическая система, речь, микрофоны, распределенная аудиозапись

Об авторах

Е. Е. Усина

Санкт-Петербургский институт информатики и автоматизации Российской академии наук
Россия

Усина Елизавета Евгеньевна, младший научный сотрудник лаборатории технологий больших данных социокиберфизических систем

Санкт-Петербург

А. Р. Шабанова

Санкт-Петербургский институт информатики и автоматизации Российской академии наук,
Россия

Шабанова Александра Романовна, младший научный сотрудник лаборатории технологий больших данных социокиберфизических систем

Санкт-Петербург

И. В. Лебедев

Санкт-Петербургский институт информатики и автоматизации Российской академии наук,
Россия

Лебедев Игорь Владимирович, младший научный сотрудник лаборатории технологий больших данных социокиберфизических систем

Санкт-Петербург

Список литературы

1. Internet of Things, IoT European Research Cluster. [процитировано 6 ноября 2019]. URL: http://www.internet-of-things-research.eu/about_iot.htm

2. Teaching Smart Production: An insight into the Learning Factory for Cyber-Physical Production Systems (LVP) / L. Merkela, J. Atuga, L. Merhara, C. Schultza, S. Braunreuthera, G. Reinharta // Procedia Manufacturing. 2017. №9. P. 269-274. https://doi.org/10.1016/j.promfg.2017.04.034

3. Knowledge-Based Decision Making in a CyberPhysical Production Scenario / J. KlöberKoch, S. Pielmeier, J. Grimm, M. Brandt, M., Schneider G. Reinhart // 7th Conference on Learning Factories. 2017. №7. P. 167-174. https://doi.org/10.1016/ j.promfg.2017.04.014

4. Jiang P., Ding K., Leng J. Towards a cyber-physical-socialconnected and serviceoriented manufacturing paradigm: Social Manufacturing // Manufacturing Letters. 2016. №7. P. 15-21. https://doi.org/10.1016/j.mfglet.2015.12.002

5. Cassandras C.G. Smart Cities as Cyber-Physical Social Systems // Engineering. 2016. №2. P. 156-158. https://doi.org/10.1016/J.ENG.2016.02.012

6. Смирнов А.В., Левашова Т.В. Приобретение знаний в социокиберфизических системах в процессе информационного взаимодействия ресурсов // Информационноуправляющие системы. 2017. №6. P. 113–122.

7. Мазуренко И.Л. Многоканальная система распознавания речи // Сборник трудов VI всероссийской конференции «Нейрокомпьютеры и их применение». М., 2000.

8. Beyond Close-talk – Issues in Distant Speech Acquisition, Conditioning Classification, and Recognition / V. Stanford, C. Rochet, M. Michel, J.N Garofolo / Proc. ICASSP 2004 Meeting Recognition Workshop. 2004. P. 123-127.

9. Pfau T., Ellis D. P. W., Stolcke A. Multispeaker speech activity detection for the ICSI meeting recorder // IEEE Workshop on Automatic Speech Recognition and Understanding. 2001. P. 107-110. https://doi.org/10.1109/ASRU.2001.1034599

10. Центр речевых технологий. 2019 [процитировано 6 ноября 2019]. URL: http://www.speechpro.ru

11. АО «ОКБ «Октава». 2019 [процитировано 6 ноября 2019]. URL: https:// www.окбоктава.рф

12. Акустика / Ш.Я. Вахитов, Ю.А. Ковалгин, А.А. Фадеев, Ю.П. Щевьев. М.: Горячая линия, 2009.

13. Разработка многомодального информационного киоска / А.Л. Ронжин, А.А. Карпов, А.Б., Леонтьева Б.Е. Костюченко // Труды СПИИРАН. 2007. №5(1). C. 227-245.

14. Ронжин А.Л., Карпов А.А., Кагиров И.А. Особенности дистанционной записи и обработки речи в автоматах самообслуживания // Информационно-управляющие системы. 2009. №42(5). C. 32-38.

15. Харкевич А.А. Борьба с помехами. Изд. 4-е. М.: Книжный дом «ЛИБРОКОМ», 2013.

16. Скляр Б. Цифровая связь. Теоретические основы и практическое применение. Изд. 2-е, испр. М.: Издательский дом «Вильямс», 2003.

17. Ogunfunmi T., Togneri R., Narasimha M. Speech and audio processing for coding, enhancement and recognition. New York : Springer, 2015.

18. Марковников Н.М., Кипяткова И.С. Аналитический обзор интегральных систем распознавания речи // Труды СПИИРАН. 2018. №3. C. 77-110. https:// doi.org/10.15622/sp.58.4

Рецензия

Для цитирования:

Усина Е.Е., Шабанова А.Р., Лебедев И.В. Модели и методика определения речевой активности пользователя социо-киберфизической системы. Известия Юго-Западного государственного университета. 2019;23(6):225-240. https://doi.org/10.21869/2223-1560-2019-23-6-225-240

For citation:

Usina E.E., Shabanova A.R., Lebedev I.V. Models and a Tecnique for Determining the Speech Activity of a User of a Socio-Cyberphysical System. Proceedings of the Southwest State University. 2019;23(6):225-240. (In Russ.) https://doi.org/10.21869/2223-1560-2019-23-6-225-240

Контент доступен под лицензией Creative Commons Attribution 4.0 License.

ISSN 2223-1560 (Print)
ISSN 2686-6757 (Online)

Логин
Пароль
	Запомнить меня
Регистрация нового пользователя Забыли Ваш пароль?

Войти

Известия Юго-Западного государственного университета

Модели и методика определения речевой активности пользователя социо-киберфизической системы

Полный текст:

Аннотация

Ключевые слова

Об авторах

Список литературы

Рецензия

Для цитирования:

For citation:

Использование куки-файлов