聞き手の非言語的反応と協調的アノテーションに基づくミーティングキャプチャシステム

Slides:

Advertisements

Similar presentations

地図の重ね合わせに伴う位相関係の矛盾訂正手法萬上裕 † 阿部光敏＊高倉弘喜 † 上林彌彦 ‡ 京都大学工学研究科 † 京都大学工学部＊京都大学情報学研究科 ‡

Advertisements

VQSコラボBusiness VQSコラボLearning ご提案資料 2014/4. Windows版 iPad版 iPhone版交流タイプ 2 ◆シンプル設計でどの端末からも議長or講師＋５映像付発言参加者最大：30接続（内25視聴者）（＊）Android版は開発中ですシンプル設計のインターフェイスはWindowsパソコン、iPad、iPhoneと.

高度情報演習 1A “ テーマＣ ” 実践画像処理プログラミング〜画像認識とＣＧによる画像生成〜芝浦工業大学工学部情報工学科青木義満 2006/04/10.

自動映像生成のためのパーティクルフィルタによるボールの追跡 2007 年 3 月 21 日神戸大学大学院自然科学研究科矢野一樹.

大規模コーパスから獲得した名詞の出現パターンを用いた事態名詞の項構造解析

顔表情クラスタリングによる映像コンテンツへのタギング

コンピュータビジョン特論ＯｐｅｎＣＶについて

画像処理学習用RTコンポーネントライブラリ田窪朋仁，大原賢一，吉岡健伸（大阪大学）

3次元nクイーン問題の解に関する研究論理工学研究室伊藤精一

HOG特徴に基づく単眼画像からの人体3次元姿勢推定

高度情報演習1A　“テーマＣ” 実践画像処理プログラミング〜画像認識とＣＧによる画像生成〜第四回　演習課題画像中からの物体抽出処理（背景情報を手がかりとして）芝浦工業大学工学部　情報工学科青木　義満 2006/05/15.

パノラマ動画像モデルによる仮想空間表現システムの研究

Intelligent Computing Systems Laboratory

画像処理論.

画素密度検出エージェントを用いた文字列の検出と文字切り出し

Aided Eyes: Eye Activity Sensing for Daily Life

ライフログデータとしての笑顔の蓄積システムの提案

3-Q-28 話者交替を考慮したシステムへの問い合わせと雑談の判別

雑音重み推定と音声ＧＭＭを用いた雑音除去

異種センサを用いた人の行動検知研究概要研究の独自性 isi担当高汐グループ成果スライド到着待ち yasu担当.

状況の制約を用いることにより認識誤りを改善同時に野球実況中継の構造化

OpenCV を使った画像処理コンポーネントの作成例田窪朋仁（大阪大学）

CV輪講姿勢変化に対応したSoft Decision Featureと Online Real Boostingによる人物追跡

協調機械システム論 (04.11, 04，本郷）協調機械システム論東京大学　人工物工学研究センター淺間　一.

有人撮影講義ビデオの閲覧・編集支援のための画像・音声切り出し手法の検討

ストリーム処理エンジンを用いた顔映像に対する補助情報提供システム

Webを使ったナレッジマネジメントとビジネス展開*

固定カメラ映像からの音声情報を用いた映像コンテンツ生成

高度情報演習1A　“テーマＣ” 実践画像処理プログラミング〜画像認識とＣＧによる画像生成〜第三回　演習課題画像中からの物体抽出処理（色情報を手がかりとして）芝浦工業大学工学部　情報工学科青木　義満 2006/05/08.

聞き手の非言語的反応と協調的アノテーションに基づくミーティングキャプチャシステム

Java ソフトウェア部品検索システム SPARS-J のためのリポジトリ自動更新機能の実現

高度情報演習1C 実践画像処理プログラミング

長岡技科大オープンハウス岐阜高専４年電子制御工学科森　永二郎.

内視鏡画像からの奥行き情報提示による視覚支援システムの開発

１．特徴自動キャリブレーションあらゆるカメラ向きに対応様々な軸テーブルに対応軸テーブルと直接接続して制御する

Bottom-UpとTop-Down アプローチの統合による単眼画像からの人体3次元姿勢推定

Leap Motionを用いた実世界指向アプリランチャの設計と開発

ビデオデータベース.

ステレオカメラを用いた人の行動解析.

5. 音声からの特徴抽出 5.1 特徴抽出の手順 5.2 音声信号のディジタル化 5.3 人の聴覚をまねて－スペクトル分析 5.4 もうひと工夫－ケプストラム分析 5.5 雑音の除去.

マルチメディア・コンテンツの組織化機構ー映像メディアに対する知的構造化ー有木康雄龍谷大学理工学部電子情報学科

高度情報演習1C 実践画像処理プログラミング第二回演習課題

只見町インターネット・エコミュージアムの「キーワード」検索の改善

学生の相互評価を用いたモデリング支援システムの開発

雑音環境下における非負値行列因子分解を用いた声質変換

音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定

構造情報に基づく特徴量を用いたグラフマッチングによる物体識別情報工学科藤吉研究室　EP02086　永橋知行.

議事録作成支援Ｗｅｂアプリケーションの開発リアルタイム通信を用いた合意形成を目指して

12. 意味・意図の解析 12.1 意味表現とは 12.2 規則による意味解析処理 12.3 統計的な意味解析処理 12.4 スマートフォンでの音声サービスニューラルネットワークによる意味解析.

物履歴に基づいたユーザプロファイリング機構の構築

GPSを使わないBebop Droneの自動飛行

ロボットの協調動作の研究：マップ作成とマップ情報を利用した行動計画

Data Clustering: A Review

OpenCV について OpenCV とは OpenCV の Python プログラム例配列画像の B, G, R の 3成分

一方向画像からの３Dモデル生成電気電子工学科　白井研究室 T215049　田原　大輝.

工学部電気電子工学科白井研究室 T 山田翔也

Number of random matrices

各会話シーン毎に、発話（音源）方向を推定

Bottom-UpとTop-Down アプローチの組み合わせによる単眼画像からの人体3次元姿勢推定

資料2-2 平成26年度第2回技術委員会資料次年度検討テーマ案

AdaBoostを用いたシステムへの問い合わせと雑談の判別

ブースティングとキーワードフィルタリングによるシステム要求検出

プロジェクト演習III,V ＜インタラクティブ・ゲーム制作＞プログラミングコース

１ーQー１８音声特徴量抽出のための音素部分空間統合法の検討

ロボットから人に話しかける判断モデルの構築

２０１８年度ビジョン研究室ゼミナール・卒研紹介指導教員：張善俊６月20日（水） 6－209.

CSP係数の識別に基づく話者の頭部方向の推定

ＡＡＭと回帰分析による視線、顔方向同時推定

人物再識別システムの試作と評価飯塚　敦志.

P2Pによる協調学習システム唐澤　信介　　北海道工業大学　電気工学専攻.

Presentation transcript:

聞き手の非言語的反応と協調的アノテーションに基づくミーティングキャプチャシステム京都大学大学院情報学研究科勝木弘，角康之，西田豊明

はじめにミーティング参加者の非言語インタラクションと、メモや書き込みといった聞き手の行う協調的アノテーションをもとに、知識交流や新たな知を創造する重要な場記録・構造化による知的活動支援参加者への負担、制限が厳しい話し手の発話内容や振る舞いに注目グループ内の知識交流や、議論によって新たな知を創造する場としてミーティングは有用記録・構造化を行うことで知的活動支援を行なおうという試み AMI,VASE, 参加者の非言語インタラクションと、メモや書き込みといった聞き手の行う協調的アノテーションをもとに、ミーティングの知識コンテンツ化をおこなう

システムの流れ実世界会話場 DB 支援システムミーティング会話記録提示・支援知識コンテンツ化・会話シーン認識・インデクス付与対象とするミーティング：5,6人程度の参加者がテーブルに座り、スライド、ビデオ、配布資料などを参照しながら議論を行う対面議論型ミーティングまず実世界会話場で行われている会話をカメラやセンサを用いて記録します。センサを用いて、視線やうなずきなどと言った記録された会話を重要シーンの獲得やシーンの関連付けによって知識コンテンツ化します。それを実世界に提示することによって新たな会話の促進や知識の共有の支援を行います。さらに新たに行われた会話を記録していくことで，知識の流通サイクルを実現します。ミーティング DB 支援システム知識コンテンツ化・会話シーン認識・インデクス付与

獲得する非言語行動視線検出、顔認識音声検出－環境マイクうなずき検出－加速度センサを利用本棚，ホワイトボードの利用全方位カメラorカメラ　＋顔認識ソフトウェアOKAO VISION 音声検出－環境マイクうなずき検出－加速度センサを利用本棚，ホワイトボードの利用協調的アノテーション Photochatで行われる写真撮影や書き込み

Photochat による協調的アノテーション写真撮影・手書きメモ機能リアルタイム共有写真上での仮想的な会話 ⇒参加者の興味や感心を反映 [角 et al. 08]

◯◯◯について・xxxxxxx ・vvvvvvv ・tttttttttt AAAABBBBCCC Aaa bbb ccc ・・・・・・スクリーン俯瞰映像用参加者撮影用本棚監視用ホワイトボードホワイトボード監視用・・・・・・加速度センサ PhotoChat 全方位カメラ・マイク本棚ネットワークカメラミーティング収録環境について説明します対面議論型ミーティング参加者：各々のパソコン、Photochat テーブルネットワークカメラ

システム構成図 Photochat カメラアレイ全方位カメラ加速度センサマイクフレーム補完マスク処理正規化顔認識首振り検出発話区間検出同期処理顔認識首振り検出映像圧縮動作検出顔追跡ノイズ除去操作抽出文字認識 3次元ベクトル化パターン分類キーワード抽出視線　　　うなずき　　発話　　複数ネットワークカメラ欠損したフレームの補完協調的アノテーション非言語インタラクションパターン検出会話シーン認識知識コンテンツ化

非言語行動の検出－視線－全方位カメラLadybug2 OKAO Visionによる顔認識・視線方向認識顔追跡とエラー訂正処理 2次元情報→3次元上の顔の位置と視線方向　1024 (ピクセル) 　2048 (ピクセル) 全方位カメラあ「CAMshift」は「Continually Adaptive Meanshit」（連続適応的meanshift）の略で、重心以外に重量とモーメントが計算されます。重量とモーメントの値によって検索範囲の形が調整されます。。「meanshift」アルゴリズムでは、roiの様に検索範囲がしてされます。その範囲内の重心が計算され、範囲の中心がその重心と重なるように移動されます。範囲が動かないまでそれを繰り返します。まず， meanShift() を用いて物体の中心を求め，物体サイズに合わせて窓サイズを調整して，さらに最適な方向を検出します．この関数は，物体の位置，サイズ，姿勢を含む，回転した矩形を表現する構造体を返します．探索窓の次の位置は， RotatedRect::boundingRect() から得ることができます物体の中心，サイズ，姿勢を求めます． Ladybug2

非言語行動の検出－うなずき－頭部につけた加速度センサからうなずき動作を検出する加速度センサの傾きを補正鉛直方向の動きを窓幅600ミリ秒で分散をとり，抽出する首振り動作以外の動きを除去する－顔方向を変える動作顔方向を変える動作首振り動作区間加速度の二乗和傾きの変化量の大きいところ分散垂直方向の動作区間 [斎賀 et al. 10]

非言語行動の検出－その他－発話協調的アノテーション本棚、ホワイトボードの利用テーブル中心に設置した環境マイクの音声から発話区間検出撮影、書き込み、閲覧といった操作操作パターンなどによる仮想会話の分類本棚、ホワイトボードの利用カメラ映像の差分による行動検出

知識コンテンツ化：会話シーン認識再利用性の高い重要シーンの獲得特徴的な会話シーンの獲得再利用性の高いシーンを得るには参加者の意図に沿うことが重要非言語情報から会話の状況や参加者の意図を掴む意味情報までは踏み込まない（キーワード単語の利用程度）・参加者間の非言語インタラクション発話交替、視線集中，うなずきの同期，… ・参加者のつける意味的アノテーションメモ・写真情報＋それを書き込む（撮る）という行為久保田や長尾らによって会話から再利用性の高い知識を獲得するには参加者の意図が重要という知見が得られていますまた，非言語情報は会話の状況や参加者の意図を掴む手がかりになると言われており，我々のグループでもいくつかの会話について，非言語情報による会話分析を行ってきました．本研究では，顔認識，視線検出などによって参加者の非言語情報を取得し，またホワイトボードに書き込みされた，などの会話場の情報とあわせて，「いつ，どこで，だれが，何をしている」といった状況インデキシングを行いますこれに参加者によるメモなどの意味的アノテーションを付加させて，重要シーンを獲得します 30 特徴的な会話シーンの獲得

知識コンテンツ化：インデクス付与会話シーンのもつ情報インデクスこれらのインデクスを利用してミーティングの構造化や、　会話シーンのもつ情報インデクススライドやメモから得たシーンに出てきたキーワード会話状況話題転換や盛り上がり、注目が集まっているなどの特徴的な会話状況非言語インタラクション協調的アノテーションミーティング・参加者情報これらのインデクスを利用してミーティングの構造化や、現在の状況と照らし合わせた提示を行う

まとめと今後参加者の非言語インタラクションと、メモや書き込みといった協調的アノテーションをもとに、知識コンテンツ化をおこなうミーティングキャプチャシステムの提案記録したミーティングを分析して会話シーン認識のモデルを構築し知識コンテンツ化を行う日常的に運用し、有用性を確認する

まとめグループ内の知識流通サイクルを実現するミーティング，立ち話，本棚周辺における会話の獲得非言語情報を用いた重要シーン切り出し会話シーンの関連付けによるメタ構造の導入有益な会話の促進や知識共有のための提示システム研究室内において日常的に運用することで，グループ内における知識流通が促進される　ことを確認する今後の取り組みに関してですが，まず知識流通サイクルを実現する環境の構築を行います．また，研究室内において日常的に運用することで，グループ内などにおける知識流通が促進されることを確認します．