ラグビーウルグアイ代表

<ウェブサイト名>

<現在の時刻>

出典: 標準

検索 English お問合せ工学物理科学コンピュータ科学生命科学臨床・健康社会科学芸術人文科学法学経営・経済心理学教育 Category 工学物理科学コンピュータ科学生命科学臨床・健康社会科学芸術人文科学法学経営・経済心理学教育 Series Magazine Spotlight 復興支援 Other RADIANTとは Tags English Link 立命館大学研究・産官学連携研究者データベース研究シーズ集 X (Twitter) YouTube カテゴリーを選択工学物理科学コンピュータ科学生命科学臨床・健康社会科学芸術人文科学法学経営・経済心理学教育検索 Home 叫び声から危機を検知するロボット聴覚カテゴリーで探すカテゴリーを選択工学物理科学コンピュータ科学生命科学臨床・健康社会科学芸術人文科学法学経営・経済心理学教育キーワードで探す絞り込み検索カテゴリーから探す工学物理科学コンピュータ科学生命科学臨床・健康社会科学芸術人文科学法学経営・経済心理学教育タグから探すジェンダー地域健康マイノリティ歴史コミュニケーション文学生物環境芸術・デザイン全てのタグをみる SDGsから探す Magazineから探す観光/ツーリズム脱炭素再生地域/Regional ゲーム・遊び家・家族音宇宙 QOL サステイナブル全てのMagazineをみる ISSUE 16：音叫び声から危機を検知するロボット聴覚 AIを使って危機を知らせる悲鳴を聞き分けるシステムを開発。福森隆寛情報理工学部講師工学| 音 sdgs09|sdgs11| 音声は、周りの世界を認知したり、コミュニケーションを取る上で極めて重要な手段である。話している言葉を理解する、話し声から性別や年齢、喜怒哀楽などの感情を推定する、あるいは音の大きさや聴こえてきた方向から人の位置や音の発生源を突き止めるなど、音声認識に関わる技術は近年、目覚ましい勢いで進化している。福森隆寛も音声・環境音認識において新領域を開拓しようとしている研究者の一人だ。福森が挑むのは、音声から「危機」を検知すること。危機的状況を示す要素の一つとして「叫び声」に着目し、人の叫び声を認知して危機か否かを自動で検知する「ロボット聴覚」の開発を目指している。最近の研究で、ディープラーニングを用いて平静時の音声と危機を知らせる悲鳴とを聞き分けるシステムの開発に成功した。「一般的な音声認識と異なり、『叫び声』から危機的な状況を判断するのが難しいのは、危機がどこでどのような状況で起こるかわからないからです。雑多な音であふれ返った騒々しい場所や、マイクロフォンから離れた場所で声が発せられることも考慮に入れ、叫び声を高精度に検知する方策を考える必要があります」と福森は明かす。福森によると、従来の音声認識では多くの場合、MFCC（メル周波数ケプストラム係数）から認識に重要な特徴量を導き出す方法が用いられる。人は喉元の声帯を振動させ、音波を喉・口などの声道を通過させることによってさまざまな音声を生成する。MFCCは声道に関する特徴をケプストラム領域で表現するように設計されたもの。人の聴覚特性に合わせ、高周波帯域は粗く、低周波帯域を細かくサンプリングするのが特徴だ。「しかし平静時の音声と叫び声では、声帯と声道の動きが大きく異なることがわかってきました」と福森。それによると、人が叫ぶ時は声帯やその付近の発声器官が強く振動したり、語尾の接続時間が平静発話よりも長くなる傾向がある。そのためMFCCだけでは悲鳴の特徴を十分に捉えることができないのだ。解決策を検討していた福森は、先行研究から悲鳴の高調波成分のエネルギーが平静音声よりも強いことに注目。悲鳴を検知するには、音声のスペクトル（周波数）領域の特徴を捉えることも有効だと気づき、スペクトル領域とケプストラム領域の両方の特徴量を使用することで検知の精度を高めようと考えた。まず男女の平静の音声と危機的状況を想起させる叫び声を収録し、合計で約1,000サンプルを収集。それぞれの音声からスペクトログラムとケプストログラム両方の特徴量を抽出してディープラーニングで学習させ、平静音声と悲鳴を分類するモデルを構築した。「このモデルを用いて評価実験を行った結果、平均でおよそ94.1％、極めて騒々しい環境でも80％もの高い確率で叫び声を検知できることを確かめました」と福森。従来のMFCCを使用する方法よりも高精度に叫び声を判別でき、しかも雑音の多い環境ほどその強みを発揮できることを実証した。平静音声（上図）と叫び声（下図）の分析結果。各図の上段は音の大きさの時間推移を示した波形、中段と下段は悲鳴の聞き分けに利用したスペクトログラムとケプストログラムを表す。いずれの音声も同じ話者が同じ言葉を発しているが、特徴量の表れ方が異なっている。このような両者の違いを大量の音声サンプルを使ってディープラーニングで学習するのがポイントとなる。「AI技術の浸透によって音声認識技術の進化が目覚ましい一方で、危機を検知するロボット聴覚の技術開発はやや遅れを取っていました」と福森。その理由の一つとして、ディープラーニングに必要な音声サンプルを収集する難しさを挙げる。福森の研究が成功した一因には、質の高いサンプルを粘り強く収集したところにもあったのだ。さらに現在、発せられた音声がどの程度「叫び声らしい」のか、叫び声の強度を推計するシステムの開発にも着手している。まず音声サンプルのさらなる充実を図るとともに、「叫び声の強度」の定量化を試みている。叫び声を複数人に聞かせ、どの程度「叫び声らしい」のかを点数で評価してもらい、そのデータをもとにディープラーニングを用いて推定モデルを構築するという。「叫び声の強度に加えて、叫び声が本当に危機的状況を訴えているものか、あるいは歓声や笑い声のようなポジティブな音声なのかを判定するシステムの開発も目指しています」と福森。将来は、スマートフォンに搭載し、日常生活の防犯などに生かせる「危機検知アプリ」の開発につなげたいと展望する。現在犯罪・事故の検知には、動画・画像情報を利用する防犯カメラなどが普及している。その後を追うように、近年はマイクロフォンを使って「音」から異常事態を検知する「音響監視システム」が注目されつつあるという。「ロボット聴覚は、動画・画像情報の弱点を補い、監視や危険察知能力を高める上で非常に有効です」と可能性を語った福森。「危機的状況を検知できる聴力を持ったロボットが凶悪事件や大事故をいち早く察知し、国民を守る。そんな時代の到来に貢献したい」。福森の研究はまだまだ発展していく。 AI（人工知能）福森隆寛FUKUMORI Takahiro 情報理工学部講師研究に関する問い合わせ取材のお申込み研究テーマ発話状態の推定（叫び声検出、音声明瞭度予測、感情認識など）、生活環境音の認識・理解専門分野知覚情報処理更新日：2022年01月24日 Pick Up 叫び声から危機を検知するロボット聴覚福森隆寛情報理工学部講師「現象学」から見通す新しい生き方、新しい世界亀井大輔文学部教授横田祐美子衣笠総合研究機構助教子どもから正確な証言を得るには？変わる「司法面接」の現場仲真紀子総合心理学部教授 ITが人と人のコミュニケーションを活性化する林勇吾総合心理学部准教授テクノロジーが「生きる」意味を変える美馬達哉先端総合学術研究科教授ゲーム作りはプレイヤーの創造性を信じること渡辺修司映像学部教授研究・産官学連携産官学連携や共同研究、気になる研究がございましたら、お気軽にご相談ください。衣笠リサーチオフィス [人文社会科学系分野] TEL：075-465-8224 BKCリサーチオフィス [自然科学系分野] TEL：077-561-2802 OICリサーチオフィス [人文社会科学系分野] TEL：072-665-2570 お問い合わせ Category 工学物理科学コンピュータ科学生命科学臨床・健康社会科学芸術人文科学法学経営・経済心理学教育 Series Magazine Spotlight 復興支援 Other RADIANTとは Tags English Link 立命館大学研究・産官学連携研究者データベース研究シーズ集 © Ritsumeikan Univ. All rights reserved. サイトポリシープライバシーポリシー

ホットニュース

ある日 3日一週間