2013/09/25(水)感情の分類を考える

趣味で人工知能のために会話文の感情分類がしたいなぁっと思ったので、ちょいと調べていました。そもそも感情は明確に分類できるものなのか怪しいのですが・・・。

ちょろっと自然言語処理関連の論文を調べた限りでは、

  • 「感情表現辞典」という辞典の分類:「喜」「怒」「哀」「怖」「恥」「好」「厭」「昂」「安」「驚」
  • Ekmanの分類:「怒り」「嫌悪」「恐れ」「幸福感」「悲しみ」「驚き」
  • Plutchikの分類:「喜び」「悲しみ」「受容」「嫌悪」「恐れ」「怒り」「驚き」「期待」とこれらの合成 (日本語訳は 山口大学工学部研究報告第53巻第1号pp.85-90 を参考にしました:http://memoirs.lib-e.yamaguchi-u.ac.jp/531/11.pdf

という分類がよく使われているようです。

自分がしたいのは会話文の感情分類。

Ekmanの分類は表情から読み取れる感情とのことなので、除外。残りは Plutchik の分類か「感情表現辞典」の分類。

Plutchik の混合感情の考え方とかはよく出来ていると思うんだけど、自分以外の人に混合感情を意識させて妥当な感情を選ばせるのはあまりに負担がかかり過ぎるように思えます。かといって混合感情を意識させない場合、ドンピシャに純粋感情を過不足なく複数選択させるのが困難。

一人で感情分類作業する場合は、Plutchik の分類でもいいけど、誰かに手伝ってもらう場合はPlutchikの分類はキツい。

というわけで、「感情表現辞典」の10分類をベースにすることにしました。

今日、注文していた「感情表現辞典」が来たのでちょろっと読みました。

この10分類は実際の表現例から「喜」「怒」「苛」「悲」「淋」「鬱」「悄(ショウ:しょんぼりする)」「苦」「安」「悔」「昂」「感動」「好」「嫌」「憎」「驚」「怖」「恥」「惑」の19感情を抽出して境界線の引きにくさを理由に以下のように圧縮したもののようです。

  • 「哀」={「悲」,「淋」}
  • 「厭」={「鬱」,「悄」,「苦」,「悔」,「嫌」,「憎」,「惑」}
  • 「昂」={「苛」,「昂」,「感動」}

これでほぼ自分の直感にも反しないのですが、いくらか拡張しました。

人工知能を考えると、

  • 友達としての好き
  • 恋人としての好き
  • 慕う(目上の人への)の好き
  • 憧れの好き はそれぞれ分けるべきと考えて、

「好」ー>「友情」,「恋愛」,「忠誠(忠義)」,「欲」

に拡張しました。

これで「喜」「怒」「哀」「怖」「恥」「厭」「昂」「安」「驚」「欲」「友情」「恋愛」「忠誠」の13感情。

これらの13種のうちのどれかか、これらのうちの組み合わせで会話文に表れるほとんどの感情は網羅できるかな?

-追記-
研究レベルなら、「An Argument For Basic Emotions」とか読んでおいたほうがいいです。これによると、愛はemotional attitudeで感情(情動)と区別されています。 Plutchikの3次元モデルは「The Nature of Emotions」を読んだけど根拠が不明でした。

2013/04/17(水)TOEIC 800点越えに向けて

3/17の公開テストの結果と4/4のIPテストの結果が出そろいました。

公開テストが L:395, R:370 の765点。

TOEIC 公開テスト

IPテストが L:395, R:345 の740点。

TOEIC IP

結果を分析すると、

  • L:平均的に平均超えしているので、さらに全体的にトレーニングすると400点越えも可能か。
  • R:語彙と文法はOKなので、ちりばめられた情報を関連付けるトレーニングがもっと必要。毎回時間が足りないので、段落ごとの内容を記憶しつつさらに速読する力を鍛える必要あり。多読x多読x多読。

夏休みに勉強して800点越えたい。

次の資格は情報セキュリティスペシャリストですが、まだ累計勉強時間が30分ぐらいなので午前Iの免除がもらえれば良いところでしょう・・・。

(大学1,2年の頃のモチベーションが高かったので、応用情報技術者試験合格による午前I免除は期限切れです。)

プロ野球もアニメも見てないのに全然勉強時間が確保できていません。(涙)

大学院の講義も倍速で進んでいるので、来週には中間テストがあったり。でも、モチベーション高い人が多くて中々良い環境だと思います。

研究は大学では自然言語処理をやっていましたが、確かに言語情報は処理できているけど知能とはほど遠いと感じることが多かったので、大学院ではもっと知能よりの研究室に入りたいと考えています。

2013/03/18(月)TOEIC #178

受けてきました。

問題は2chによるとマイナーのほうでした。

前回は L:425 R:335 T:760点

今回はリスニングがダメダメでリーディングがかなり手応えありという感じ。リスニングはまず下がると思うけど、リーディングは結構上がると思います。

時間配分はPart5は16、7分ぐらいで何とか終わって、最後の塗りつぶしは6,7問ほどに収まりました。

リスニングの感触が悪過ぎて800点はキツいと思うので、大学院の入学式にあるTOEIC IPテストで800点超すぞ!

OK キャンセル 確認 その他