継続的物流ABC/ABMのための 音声認識記録システムについて

Slides:



Advertisements
Similar presentations
1 金属加工会社における 生産工程管理システムの開発 電子情報システム工学専攻 S0713 清水 邦宏.
Advertisements

データベースの基礎知識 ACEESS の基本操作. データベースの基礎知識 データベース  特定のテーマや目的に毎のデータの集合体 データベースソフトウェア  データベースを作成、管理するソフトウェアの総 称 Oracle(Oracle) IBM(DB2) Microsoft(SQL Server)
メール暗号化:秘密鍵・公開鍵の作成  作業手順 Windows メール(Vista).
第4章 ABC/ABMと原価情報 原価計算・原価低減の新技法 1.ABCとは何か 2.ABCの有効性 3.ABMとは何か 4.ABMの有効性.
相互作用図 FM11010 田中健太.
情報処理入門A・B 第7回 ワープロソフト入門(2)
Deep learningによる 読唇システム
~ 企業内の情報共有のために~ 暗黙知を→形式知へ キッズウェイナレッジのご提案 2003年7月 24日 - 第1版 -
らくらく学校連絡網 スライドショーで見る操作ガイド -7- 出欠確認付きメール escで中断、リターンキーで進みます
らくらく学校連絡網 スライドショーで見る操作ガイド -3- 登録 抜粋-管理者作業 escで中断、リターンキーで進みます
Imagio カンタン文書登録V2 画面シミュレーション.
パイプラインパフォーマンス管理 SAP Best Practices.
ABCの概要とその有用性 加登豊(神戸大学大学院経営学研究科教授) 清水信匡(桃山学院大学経営学部教授)
USB2.0対応PICマイコンによる データ取得システムの開発
JavaによるCAI学習ソフトウェアの開発
「絵葉書を通じてのハルビンの 街の印象調査」システムUIの iPadアプリ化 谷研究室  飯 祐貴.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
F5 を押すか、または [スライド ショー] > [最初から] をクリックして、コースを開始してください。
クロストーク成分の相互相関に 着目した音場再生システム
デジタル信号処理①
水曜パソコン講座 「Windows Security Essentials プログラムを実行する手順」          を解説します.
らくらく学校連絡網 スライドショーで見る操作ガイド -8- グループの新規登録、修正できる項目 escで中断、リターンキーで進みます
徳島大学工学部知能情報工学科 A1 グループ 学部4年 森陽司
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
PSOLA法を用いた極低ビットレート音声符号化に関する検討
WebCluster スライドショーで見る操作ガイド
第7章 データベース管理システム 7.1 データベース管理システムの概要 7.2 データベースの格納方式 7.3 問合せ処理.
平成22年度に実施を予定するインターネットを 用いた研修システムによる研修 ライブ配信受講手順書
Webを使ったナレッジマネジメントとビジネス展開*
音声処理ソフトPraatの使い方.
 データベースによる並列処理 情報論理工学研究室  三宅健太.
LabVIEWによる 地上気象観測データ 収集システムの開発
物流への興味向上のためのVRを用いた近未来流通センターの構築
技術参照モデルとシステム要件定義 に関する学習システム
【プログラミング応用】 必修2単位 通年 30週 授業形態:演習.
長岡技科大オープンハウス 岐阜高専4年電子制御工学科 森 永二郎.
アウトバウンド業務 ガイダンス Ver.7 アウトバウンド業務について、作業フローを具体的な事例別にご説明します。
Leap Motionを用いた実世界指向 アプリランチャの設計と開発
資料1-6 平成26年度 第1回技術委員会資料 支援ツール群整備方針
広瀬啓吉 研究室 4.音声認識における適応手法の開発 1.劣条件下での複数音源分離 5.音声認識のための韻律的特徴の利用
技術参照モデルとシステム要件定義 に関する学習システム
雑音環境下における 非負値行列因子分解を用いた声質変換
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
MSET使用方法  一時中断したい場合には、マウスの右クリックをしてください(小ウインドウが開き一時停止します)。続行する場合には、開いた小ウインドウ以外の適当な場所を右クリックしてください。
【e-Rad】担当者用 平成24年度公募(三次) 新規公募(三次)設定 操作説明 (3月29日修正版)
TIME SIGNAL: 集合知を利用した赤信号点灯時間の取得手法
議事録作成支援 Webアプリケーションの開発 リアルタイム通信を用いた合意形成を目指して
オープンソース開発支援のための ソースコード及びメールの履歴対応表示システム
5母音の認識率(wの本数5) フレーム幅5、シフト幅2 全音素の認識率(wの本数5) フレーム幅5、シフト幅3
ルーブリック・チャート(評価) の活用と課題
AIを用いたドローンの 新たな姿勢制御方法に関する研究
2. 音声とは 2.1 音声の科学 2.2 どうやって声を作るか ー調音音声学 2.3 声の正体とは ー音響音声学 2.4 どうやって声を聴き取るか ー聴覚音声学.
音声認識・翻訳 Android アプリケーション制作
一方向画像からの 3Dモデル生成 電気電子工学科 白井研究室 T215049 田原 大輝.
プログラミングⅠ 平成30年10月15日 森田 彦.
ビジネス プロジェクトの計画 発表者名 | 会社名.
Firebaseを用いた 位置情報共有システム
音声情報とベイジアンネットを 用いた感性情報処理システム
Number of random matrices
コードクローン分類の詳細化に基づく 集約パターンの提案と評価
高度プログラミング演習 (01).
ブースティングとキーワードフィルタリング によるシステム要求検出
セマンテックWebを利用した加工工程決定支援システム
開発作業の形式化に基づく プロセス評価 松下誠 大阪大学.
クラスタリングを用いた ベイズ学習モデルを動的に更新する ソフトウェア障害検知手法
ロボットから人に話しかける 判断モデルの構築
1-Q-12 Buried Markov Modelを用いた構音障害者の音声認識の検討
メール作成・送受信の 介助者無人化への取り組み 〔 実際の症例を交えて 〕
1-P-2 フィッシャー重みマップに基づく不特定話者音素認識の検討
P2Pによる協調学習システム 唐澤 信介   北海道工業大学 電気工学専攻.
Presentation transcript:

継続的物流ABC/ABMのための 音声認識記録システムについて 2000728 田中 裕一 流通施設計画研究室所属の田中裕一です。 本日はどうぞ宜しくお願い致します。 ではこれより私の卒業研究「継続的物流ABC/ABMのための音声認識記録システムについて」の発表を始めさせて頂きます。 指導教官 鶴田三郎 教授        黒川久幸 助教授

目次 はじめに 音声認識記録システムの開発 評価 まとめ

物流改善のための物流ABC/ABM Activity:活動(局所的な仕事の単位) コストはいくらかかっているのか? ABC:活動基準原価計算 (Activity-Based Costing ) プロセスに 無駄はないか? 物流の現場ではコスト増やミスが発生してもその原因が分からないということがしばしば起きており、物流改善の着手が難しいものとなっています。こうした問題に対するアプローチとして物流ABC/ABMの手法があり、物流業務を活動(アクティビティ)単位で捉えた分析を行います。 ABCとはActivity-Based Costingの略であり、活動基準原価計算と訳されます。アクティビティごとに原価を計算することによってコスト発生のメカニズムをつかむことができます。 一方、ABMとはActivity-Based Managementの略であり、活動基準管理と訳されます。これは活動を左右する要因である原価作用因(動作や作業時間)を設定し、この実績値を分析することにより業務改善へとつなげます。尚、ABMではABCで得られた原価情報を使用します。 中小企業庁では中小物流企業における物流改善を目的として「物流ABC準拠による物流コスト算定・効率化マニュアル」を公開しており、この図の通りアクティビティ項目を用意しています。荷物の扱いがケース単位なのかピース単位なのかによって業務内容が異なることから別々のアクティビティとして捉えられています。 ABM:活動基準管理 (Activity-Based Management ) (出所:中小企業庁「物流ABC準拠による物流コスト算定・効率化マニュアル」より作成)

作業時間データの収集 投入要素 人件費 土地・建物 人 フォークリフト格納 台車格納 資材 消耗品 機械設備 ケース目視検品 バラピッキング ABCでは各アクティビティに投入要素を割り振ります。人に関しては人件費を割り振るわけですが、割り振りにあたっては作業時間を基準とするため、作業時間のデータを収集する必要があります。 ケース機械検品 待機 袋詰め

作業日報作成の手間 頻繁に記録する場合は手間が大きい 開始と終了を 結んだ線を引く 従来、作業時間はこのような作業日報を用いて記録します。 作業記録は作業後記憶に頼って記録するよりも、リアルタイムに記録することでより正確なデータが取れます。 しかし、作業中に記録するのであれば、業務の作業を中断させることなく行われなくてはなりません。 特に記録対象が数十点(数十回)に及ぶ場合は作業の妨げとなり、記録にかかる負担が大きくなります。 このことから、継続して物流ABC/ABMを用いた分析を行うためには業務作業の妨げにならず短時間で記録を行えるツールが必要であるといえます。

研究の目的 物流ABC/ABM導入を推進 作業記録の入力にかかる負担を軽減するツールとして 音声認識を活用した記録システムを構築する 構築したシステムの有効性を明らかにする 一方、音声認識と呼ばれる音声を文字に変換する技術があり、カーナビゲーションへの入力や電子カルテの作成などに応用されています。 本研究ではこの音声認識を活用した物流ABC/ABMのための記録システムを構築すると共にその有効性を明らかにすることを目的とします。 物流ABC/ABM導入を推進

目次 はじめに 音声認識記録システムの開発 評価 まとめ

システムの設計要件 話者の特徴に合わせられる 誰にとっても使い易い 語彙の登録を柔軟に行える 物流現場の騒音に耐えうる 音声によってシステム を操作できる 自由に動き回れる システムの設計要件について説明します。 今回はこの部分に関して構築を行いました。 制御用単語として設定したキーワードを発声するまでは作業記録データベースへの書き込みはなされないようになっています。 作業者はこの制御用単語によってシステムを操作します。 また、物流では様々な専門用語が用いられており、現場独自の呼び方・略し方があるため、単語辞書データベースをテキストファイルから読み込む方式とし、容易に変更できる設計としました。 例)無線接続

システムの構成 端末 単語辞書 音声認識OCX データベース ドキュメントトーカ マイクロフォン 音声認識 プログラミング開発 処理部 ソフトウェア  Visual Basic6.0 スピーカ 命令処理部 今回のシステム開発には、汎用の音声認識ソフトであるドキュメントトーカに付属する音声認識OCXを、プログラミング開発ソフトであるVisual Basic6.0に組み込んで使用しました。 作業記録データベースが先述の作業日報に該当します。 開始と終了の間隔で実働時間を、また終了と開始の間隔でロス時間等をつかめます。 作業記録 データベース Wire Or Wireless データベースソフトウェア  Microsoft Access

単語辞書データベースの設定 ユーザの指定 記録フォームへ 単語辞書となるテキストを指定 認識レベルの指定 認識時間の指定 制御用単語の指定 システムの起動においては、まずユーザを指定します。 これによって単語辞書となるテキストファイルのフルパスを指定し、システムの単語辞書データベースに読み込ませます。 認識レベルの指定 認識時間の指定 制御用単語の指定

記録フォームの画面 入力形式の選択 音声認識の 開始 音声ファイル の参照 音声認識の 停止 音声ファイル 再生 音量メータ フォームの 終了 ユーザを指定すると記録フォームの画面が表示されます。 認識開始ボタンをクリックすることで音声認識が開始されます。 認識結果

書き込みが可能になったことを告げる応答音を確認 記録の手順 書き込み制御用単語を発声する 書き込みが可能になったことを告げる応答音を確認 記録項目を発声する 記録の手順について説明します。 作業者は制御用単語を発声することによってシステムを書き込み可能状態にし、続いて記録項目を発声して記録を行います。 記録が完了した場合は応答音が返され、システムは再び書き込み停止状態になります。 記録が完了したことを告げる応答音を確認

入力の一例① はじめ りゅうつう けーすにうけ 開始 顧客:流通情報工学課程 アクティビティ: ケース荷受け・検品 これより、入力の一例を示します。 グループ単位で記録することも検討したが、グループ内の作業者のアクティビティ開始(終了)のタイミングが一致しない場合やグループ内の作業者が他のアクティビティを行う場合などは記録するタイミングの捉え方が難しいものとなるため、作業者ごとに記録する設計としました。 顧客名が流通情報工学課程であり、この顧客に対するケース荷受け・検品作業開始を記録するとします。 単語辞書にはそれぞれ「りゅうつう」、「けーすにうけ」、「はじめ」と発音を定義してあります。 りゅうつう アクティビティ: ケース荷受け・検品 けーすにうけ

入力の一例② Pi ! 作業者 記録フォーム画面 マイク 制御用単語として設定してある「マイク」を発声することで、ビープ音が一度鳴ります。 これでシステムへの記録が可能になりました。

入力の一例③ PiPi ! りゅうつう けーすにうけ はじめ 作業者 記録フォーム画面 作業の記録 ID 日時 時刻 顧客 アクティビティ 開始/終了 次の記録までの時間 1 2004/01/20 2:03 流通情報工学課程 ケース荷受け・検品 開始 りゅうつう けーすにうけ はじめ PiPi ! 作業の記録 続いて記録項目を発声します。 入力が完了するとビープ音が二度鳴ります。

目次 はじめに 音声認識記録システムの開発 評価 まとめ 作業日報作成の記録方法としては用紙記入への筆記記入、ハンディ端末へのボタン入力が考えられます。この二つに音声認識記録システムによる音声入力を加えた3つの入力方法で実際に記録を行い、評価を行います。

測定の方法(用紙記入、端末入力) ①PTS(Predetermined time standard)法の基本動作を参考にして入力作業を基本動作(手をのばす、つかむ等)に分割。 ②分割した基本動作に順序を定めて、その通りに入力作業を行う。 記録用紙への筆記記入 用紙を掴む~記入する ~用紙を置く PTS法とは、人間の作業をそれを構成する基本動作に分割し、その基本動作の性質と条件に応じてあらかじめ定めておいた時間値をあてはめることによって標準時間を設定する方法です。 このPTS法を参考にして入力動作を分解しました。 そして、分解した動作に順序を定め、その入力にかかる時間を測定しました。 尚、実際の入力においては生じると思われる探索時間や思考時間は含めていません。 入力は20回行い、その平均を以って所要時間としました。 ハンディ端末へのボタン入力 端末をポケットから取り出す~ボタン入力 ~端末をポケットに仕舞う

用紙記入の想定 用紙記入についての想定を説明します。 作業員はこのような記録用紙を携帯しており、記録のタイミングごとに用紙へ点を記入します。

平均8.5秒 用紙記入の基本動作と順序 ①手が自然に下がっている状態から記録用紙及び筆記具まで手をのばす (記録用紙及び筆記具は正面の腰の高さ位置に置かれている) ②記録用紙及び筆記具をつかむ ③記入用紙を胸の位置まで運ぶ ④正面にある掛け時計(アナログ)で時刻を確認する ⑤記入欄を確認する ⑥筆記具を記入位置まで運ぶ ⑦記入する(点付け) ⑧記入用紙及び筆記具を置く ⑨手を自然な状態に下げる 赤:手の使用 青:眼の使用 入力動作はこの順序で行いました。 手をのばす、つかむといった基本動作についてPTS法を参考にしています。 今回の測定において所要時間は8.5秒でした。 平均8.5秒

端末入力の想定 続いて端末入力の想定について説明します。 作業者は記録のタイミングごとにハンディ端末へボタン入力を行います。 今回は携帯電話を端末に見立てて行いました。

平均9.9秒 端末入力の基本動作と順序 ①手が自然に下がっている状態からズボンの前ポケットまで手をのばす ②端末をつかむ ③端末をポケットから取り出す ④端末を胸の位置まで運ぶ ⑤端末のボタンを押す(まず親指がホームポジションの位置に置かれている。ここから画面を確認し、テンキーの1を親指で押した後にホームポジションに戻す。これを3度行い、最後に親指で確定ボタンを押す) ⑥端末をポケットに運ぶ ⑦端末をポケットにしまう ⑧手を自然な状態に下げる 平均9.9秒 入力動作はこの順序で行いました。 今回の測定において所要時間は9.9秒でした。 赤:手の使用 青:眼の使用

平均5.3秒 音声入力の想定・動作順序 ①書き込み制御単語を発声する ②応答音から書き込みがONになったことを確認する ③作業記録を発声する  「りゅうつう、けーすにうけ、おわり」 ④応答音から記録が完了したことを確認する 平均5.3秒 最後に音声入力の想定について説明します。 作業者は音声認識記録システムを用いて入力を行います。 測定対象は「マイク」と発声してから記録完了の応答時間を確認するまでとしました。 入力動作はこの順序で行いました。 今回の測定において所要時間は5.3秒でした。 緑:音声の使用 橙:耳の使用 環境条件  CPU CLOCK:2.66GHz  騒音40dB程度の室内

入力方法と所要時間 5.3秒 8.5秒 9.9秒 音声認識記録システム による音声入力 記録用紙への筆記記入 ハンディ端末へのボタン入力 続いて今回の測定における考察を行います。 音声入力では用紙及び端末を用いた場合と比較して約3秒程度短い時間で入力を行えました。 これは入力の前動作、後動作が少なかったためと思われます。 記録用紙への筆記記入 ハンディ端末へのボタン入力

検出成功率 5.3秒 17/20回 4.4秒 17/20回 20/20回 3.3秒 入力の所要時間 検出成功率 単語数 3 りゅうつう、 けーすにうけ、 おわり 5.3秒 85% 17/20回 単語数 2 けーすにうけ、 おわり 85% 4.4秒 17/20回 単語数 1 また、検出成功率については、今回の測定において発声したにも関わらず応答なしが単語数2と3の場合において二十回のうち3回あり、認識精度の向上が今後の課題であると言えます。 100% おわり 3.3秒 20/20回 入力の所要時間

目次 はじめに 音声認識記録システムの開発 評価 まとめ

ツールの必要性から音声認識記録システムを構築 眼や手を用いることなく記録を行えるため、 まとめ① 業務の妨げにならず記録を行える ツールの必要性から音声認識記録システムを構築 音声認識記録システムによる音声入力は 記録用紙及びハンディ端末を用いるよりも 短時間での入力が可能 眼や手を用いることなく記録を行えるため、 これらの部位を他の作業へ使用可能 業務の妨げにならずに記録を行えるツールが必要なことから、音声認識記録システムを構築しました。 用紙や端末を用いるよりも入力時間が短く済むこと、眼や手が自由になるという点において音声認識記録システムが有効であることを確認できました。

継続した物流ABC/ABMに役立つと考えられる 誤って認識されることが現在の技術では存在するため、 単語辞書を必要となる単語のみに絞ることで まとめ② 業務作業の記録が容易になり、 継続した物流ABC/ABMに役立つと考えられる 似た音を持つ意図しない単語が 誤って認識されることが現在の技術では存在するため、 単語辞書を必要となる単語のみに絞ることで 認識精度の向上につながるものと思われる その結果として物流ABC/ABMを用いた業務分析を継続して行うことに役立つと考えられます。 また実用化には認識精度の向上が課題でありますが、単語辞書を絞ることで認識精度の向上につながるものと推測されます。

今後の課題 話者の特徴に合わせられる 誰にとっても使い易い 語彙の登録を柔軟に行える 物流現場の騒音に耐えうる 特定話者に対応した音響モデルを用い、 音素レベルでの認識精度を向上させること 誤認識の修正や発声の癖を学習する 適応化技術を取り入れること 発話内容の推測を行い、 認識を助ける工夫を取り入れること 音声によってシステム を操作できる 自由に動き回れる 今後の課題としては、自由に動きまわれるよう無線での接続、 及び物流現場の騒音に耐えられる仕様にするといったシステムの高度化を図ることが挙げられます。 また、音声は個人差が大きく、内容の理解が重要なポイントであるため、発話内容の推測も必要であると思われます。 例)無線接続

ご清聴頂きありがとうございました

音声波から特徴ベクトル(短時間スペクトル)時系列を抽出する方法 振幅 音声波 時間 時間窓 フレーム周期 フレーム 特徴ベクトル

波形のパワースペクトル(母音/a/) F1 F2 F3 対数パワー F4 [dB] 周波数 〔kHz〕 0 -10 スペクトル包絡 -20 -30 -40 [dB] -50 -60 0 1 2 3 4 5 周波数 〔kHz〕

母音に対する音響モデルの例 音響モデル 入力された音が「あ」 である確率 入力された音 0.4 「あ」のモデル × 平均 × 「い」のモデル 1.0 0.0 × × × ×

語彙登録のためのテキストファイル作成 発音 表記 けーす=ケース ぴーす|ばら=ピース ばーす=バース テキストファイル K E : S U 発音   表記 けーす=ケース ぴーす|ばら=ピース ばーす=バース テキストファイル K E : S U 音響モデルで作られた音声データ

スペクトル距離計算 認識上限 スコア点数 0 500 1000 1500 正解 入力パターンに対する標準パターンの第一候補 入力パターンに対する標準パターンの第二候補

記録フォーム(単語数2) 認識結果 各項目に分割

単語音声認識の仕組み 入力音声 信号 音響特徴量 抽出 スペクトル 距離計算 単語照合 認識結果 (単語) 音響モデル 発音辞書

音声ファイルからの時刻取得 音声 003_11_05.wav 11時05分に録音したことを表している