Перевести страницу на:  
Please select your language to translate the article


You can just close the window to don't translate
Библиотека
ваш профиль

Вернуться к содержанию

Программные системы и вычислительные методы
Правильная ссылка на статью:

К.В. Сидоров, Н.Н. Филатова Автоматическое распознавание эмоций человека на основе реконструкций аттракторов образцов речи

Аннотация: Рассмотрены методы автоматического распознавания образцов речевого сигнала, зарегистрированных в момент проявления дикторами положительной эмоции, от образцов речи этих же испытуемых в нейтральном состоянии. В статье исследуются возможности методов нелинейной динамики для оценки информативных показателей эмоционального состояния человека. Исследования осуществлены на основе анализа реконструкций аттракторов речевого сигнала. Проанализированы различные способы выбора оптимальных значений параметров реконструкции аттрактора (задержки по времени между элементами временного ряда и размерности вложения). Предложены новые количественные признаки для классификации образцов речевого сигнала человека, испытывающего эмоции, основанные на оценках максимальных векторов реконструкции аттрактора по четырем квадрантам. Исследования проведены на фрагментах русскоязычной базы (Тверь). Сформирован модельный корпус эмоциональной речи, состоящий из базы данных двух уровней (фраз и гласных фонем), послуживший основанием для оценки работоспособности разработанного программного модуля автоматического распознавания эмоций человека.


Ключевые слова:

распознавание речи, классификация, эмоциональное состояние, эмоция, речевой сигнал, речь, нелинейная динамика, реконструкция аттрактора, анализ временных рядов.

Abstract: The article describes an algorithm for detection of respiratory noise, based on the idea of growing pyramidal network adapted to operate with fuzzy descriptions of objects in the learning samples set and enriched with the linguistic interpreter for the processing results. The article contains a general functional diagram and detailed description of the individual stages of work. To describe the symptom space and the interpretation of results authors used the theory of fuzzy sets. The functioning of the algorithm is carried out in two modes: training and recognition. Neural classes models, contained in the constructed network, are interpreted in fuzzy statements, which are then used in the learning mode and provide a set of production rules for the algorithm of fuzzy logical inference. The given algorithm has a software realization, the article presents the results of testing its software implementation.


Keywords:

Software, classiÞ cation, recog nition, graphs, fuzzy logic, breath sounds, auscultation, respiratory sounds, model, algorithm


Эта статья может быть бесплатно загружена в формате PDF для чтения. Обращаем ваше внимание на необходимость соблюдения авторских прав, указания библиографической ссылки на статью при цитировании.

Скачать статью

Библиография
1. Давыдов А.Г., Киселев В.В., Кочетков Д.С. Классификация эмоционального состояния диктора по голосу: проблемы и решения // Труды международной конференции «Диалог 2011». – М.: РГТУ, 2011. – С. 178–185.
2. Лукьяница А.А., Шишкин А.Г. Автоматическое определение изменений эмоционального состояния по речевому сигналу // Речевые технологии. – М.: Народное образование, 2009. – №3. – С. 60–76.
3. Голубинский А.Н. Выявление эмоционального состояния человека по речевому сигналу на основе вейвлет-анализа // Вестник Воронежского института МВД России. – 2011. – №3. – С. 144–153.
4. Сидоров К.В., Филатова Н.Н. Анализ признаков эмоционально окрашенной речи // Вестник Тверского государственного технического университета. – Вып. 20. – Тверь, 2012. – С. 26–31.
5. Старченко И.Б., Перервенко Ю.С., Борисова О.С., Момот Т.В. Методы нелинейной динамики для биомедицинских приложений // Известия ЮФУ. Технические науки. Тематический выпуск «Медицинские информационные системы». – Таганрог: ТТИ ЮФУ, 2010. – № 9 (110). – С. 42–51.
6. Makarova V., Petrushin V.A. RUSLANA: a database of russian emotional utterances // ICSLP, 2002. – pp. 2041–2044.
7. http:// www.harpia.ru/rec/.
8. Калюжный М.В. Система реабилитации слабовидящих на основе настраиваемой сегментарной модели синтезируемой речи: автореф. дис. …канд. тех. наук: 05.11.17. – СПб., 2009. – 18 с.
9. Сидоров К.В., Филатова Н.Н. Алгоритм автоматической генерации речевых объектов // Сборник материалов I Международной научн.-практ. конф. «Технические науки-основа современной инновационной системы». – Часть 1. – Йошкар-Ола, 2012. – С. 118–120.
10. Takens F. Detecting strange attractors in turbulence // Dynamical Systems and Turbulence. – Heidelberg: Springer-Verlag, 1981. – pp. 366–381.
11. Горшков В.А., Касаткин С.А. Идентификация временных рядов авиационных событий методами и алгоритмами нелинейной динамики. – М.: Бланк Дизайн, 2008. – 208 с.
12. Малинецкий Г.Г., Потапов А.Б. Современные проблемы нелинейной динамики. – М.: Эдиториал УРСС, 2000. – 336 с.
13. Меклер А.А. Применение аппарата нелинейного анализа динамических систем для обработки сигналов ЭЭГ // Вестник новых медицинских технологий. – 2007. – Т. ХIV, № 1. – С. 73–76.
14. Kennel M.B., Brown R., Abarbanel I. Determining embedding dimension for phase-space reconstruction using a geometrical construction // Phys. Rev. A, 45, 3403, 1992.
15. Hegger R. et al. Practical Implementation of Nonlinear Time Series Methods. In: The TISEAN package, CHAOS 9, 413. – 1999. – http://www.mpipks-dresden.mpg.de/~tisean/
References
1. Geppe, N.A. Bronkhofonografiya v kompleksnoy diagnostike bronkhial'noy astmy u detey / N.A. Geppe, V.S. Malyshev, M.N. Lisitsin i dr. // Pul'monologiya, 2002. № 5, S. 33-39.
2. Kulakov, Yu.V. Vozmozhnosti kombinirovannoy bronkhofonografii v diagnostike pnevmoniy / Yu.V. Kulakov, I.Yu. Malyshenko, V.I. Korenbaum //Pul'monologiya, 2002. № 5, S. 29-32.
3. Pasterkamp, H Nomenclature used by health care professionals to describe breath sounds in asthma./ H Pasterkamp, M Montgomery and W Wiebicke // Chest, 1987;92;346-352
4. Pasterkamp, H Spectral analysis of breath sounds in normal newborn infants / H Pasterkamp, R Fenton, F Leahy, V Chernick // Med Instrument, 1983; 17:355-57
5. Filatova, N.N. Neyrosetevoy algoritm i modeli nechetkoy logiki dlya zadachi klassifikatsii / N.N. Filatova, A.V. Spiridonov //Programmnye produkty i sistemy, № 4, 2008
6. Grossberg, S., Competitive learning: From interactive activation to adaptive resonance // Cognitive Science, 1987, 11, 23-63
7. Gladun, V.P. Partnerstvo s komp'yuterom – Kiev: Port-Royal, 2000. – S.17-44.
8. Pospelov, D.A. Situatsionnoe modelirovanie. Teoriya i praktika – M.: Nauka, 1986. – S.174-182.
9. Kiseleva, N.N. Komp'yuternoe konstruirovanie neorganicheskikh soedineniy, perspektivnykh dlya primeneniya v elektronike, s ispol'zovaniem baz dannykh i metodov iskusstvennogo intellekta // Avtoreferat dissertatsii na soiskanie uchenoy stepeni k.t.n., Moskva, 2004.
10. Al'-Nazhzhar, N. K. Modeli, algoritmy i tekhnicheskie sredstva issledovaniya i avtomaticheskogo analiza dykhatel'nykh shumov // Avtoreferat dissertatsii na soiskanie uchenoy stepeni k.t.n., S.-Peterburg. 2007
11. Ustroystvo registratsii i analiz dykhatel'nykh shumov pat. 66174 Ros. Federatsiya: MPK A61V 5/08/ Filatova N.N., Al'-Nazhzhar N. zayavitel' i patentoobladatel' GOUFPO Tverskoy gos. tekhn. u-nt. №2007113453/22; zayavl. 10.04.2010; opubl. 10.09.2010