人に寄り添う音声対話システム

Googleの音声検索を使ったことありますか?探したい単語をスマートフォンにしゃべって入力する手段です.「こうらくえん」と喋るだけで「後楽園」と入力できます.これは音声認識という技術です.声を文字に変換します.うるさい場所でもなかなかよく動くので便利です.では,アップル社のSiriを使ったことがありますか?「後楽園について教えて」のように人に話しかけるようにしゃべることができるので,音声検索より賢そうです.しかし,唐突に「ご用件は何ですか?」と聞かれることが多々あり,しばしば閉口します.なんで今聞いてくる?とか,話の流れから用件は決まっているでしょ!とか言いたくなります.これは,音声対話という技術が必要なことを意味しています.人間は声を文字に変換した後に,かなり高度な知識処理をしています.我々はカーナビゲーションを題材としてこの問題に取り組んでいます.
  • 山岡将綺,原直,阿部匡伸,“車載用音声対話システムにおけるユーザ負荷を考慮した対話戦略の検討,” 情報処理学会技術報告, vol. 2014-SLP-101, (vol. 2014-NL-216), no. 7, pp. 1–6, May 2014.
  • Masaki Yamaoka, Sunao Hara, Masanobu Abe, “A Spoken Dialog System with Redundant Response to Prevent User Misunderstanding,” APSIPA Annual Summit and Conference 2015, pp. 223–226, Hong Kong, Dec. 2015.
  • 最終更新: 2019/01/22 17:04