Publication of the week: A. Al-Talabani, H. Sellahewa & S.A. Jassim

2015年8月31日

A. Al-Talabani, H. Sellahewa & S.A. Jassim, “Emotion recognition from speech: Tools and challenges”, PROC。 SPIE 9497,移动多媒体/图像处理,安全性和应用程序 2015,94970n,2015年四月DOI:10.1117 / 12.2191623。

从语音人类情感识别在许多应用中,例如,用于其重要性经常研究人机交互。有一个广泛的多样性和有关,一方面与有关地方的情绪有关的信息就在于对对方的语音信号的基本情感或情绪有关的国家非协议。这些多样性动机作者的调查使用PCA方法提取元的功能,或使用非自适应随机投影RP,其显著减少可能含有各种各样的情感有关的信息的大尺寸的语音特征向量。荟萃功能的子集融合,以增加采用基于分数的最不发达国家的分类识别模型的性能。作者证明他们的方案优于国家的最先进的结果时,在非提示数据库或数据库加载测试(即,当受试者作用特定的情绪而说出一个句子)。然而,对不同类型的语音的数据集来实现的准确率之间的巨大差距,引起了人们对情感的方式调节问题的讲话。特别是文章认为,从语音情感识别不应作为分类问题进行处理。它表明在相同的语音部分的不同情绪的频谱存在,特别是在非提示的数据集,这往往比行动的数据集,其中的主题试图抑制所有,但一个情感更“自然”。

文章是通过提供 研究白金汉宫电子档案(熊).

abdulbasit·塔拉巴尼 在应用电脑系的研究生; 博士harin sellahewa 是部门的负责人;和 教授萨巴赫·贾西姆 是数学和计算的教授。