車内状況アウェアネスのための 感情音データベースの設計と評価 神戸大学 滝口 哲也 有木 康雄
対話システム 現状: ユーザの心理状態によらず,一定の応答 将来: 柔軟な応答 感情に注目し,「その場を読むシステム」 目的地を入力して下さい. 将来: 柔軟な応答 (怒っているみたい) どうしましたか? 感情に注目し,「その場を読むシステム」
目的 「状況や雰囲気を察する」 「場を読む」 (車内)状況アウェアネス 入力:ユーザからの音だけを聞く 「気分が良さそうだ」,「疲れているみたい」 「普通だな」, 「怒っているみたい」 発表内容:感情音データ収録内容,予備実験結果
感情データベース 「状況」や「感情」を設定し,即興で発話を行う. 1.好きな音楽が流れて喜んでいる. 2.テレビに流れている情報を見て,喜んでいる. または,ラジオ等を聞いて喜んでいる. 3.外の景色を見て,気分が良い. 4.渋滞等で,いらいらしている. 5.仕事や遊びで疲れている. 6.眠気がしている.
感情データベース(2) 「状況」や「感情」を設定し,即興で発話を行う. 7.道を間違えた. (他人の指示が間違えていた.怒っている.) (他人の指示が間違えていた.怒っている.) 8.道を間違えた.(自分のミスで間違えた.) 9.気分が良い.うれしい.楽しい. 10.疲れている. 11.怒っている. 12.通常な状況. 各自が任意の 状況を設定.
収録データ 状況4(渋滞でいらいらしている) 状況11(怒っている) 状況11(怒っている) 「甲子園での阪神ー巨人戦 観戦の帰り. 「甲子園での阪神ー巨人戦 観戦の帰り. 優勝がかかっているのに誤審により阪神は負けた.」 状況11(怒っている) 「必要以上のクラクションを相手の車に鳴らされた.」
収録背景
感情識別 特徴量 : ピッチ,パワー,MFCC (言語情報) 「怒り」 「通常」
実験結果 「怒り」と「通常」の識別 Recognition rate [%]
まとめ 車内状況アウェアネスのための感情音データ ベースの内容について述べた. 今後: 感情識別・(除去)に適した特徴量 表情データの利用
被験者の年齢層・男女別人数 [人数]
発話時間の分布 90 80 70 60 頻度 50 40 30 20 10 5 15 25 35 45 55 65 時間 [sec]
収録条件 サンプリング周波数 44 kHz 量子化ビット数 マイクロフォン 24 bit Hi-Visionカメラ SONY ECM-66B Victor GR-HD1 (1280×720)
収録データ 状況2(喜んでいる) 状況9(気分が良い.) 「テレビCM: QPパスタソースたらこを見ている.」 「甲子園での阪神ー巨人戦 観戦の帰り. この日,阪神は優勝を決めた.」
状況設定例