継続的物流ＡＢＣ／ＡＢＭのための音声認識記録システムについて

Slides:

Advertisements

Similar presentations

1 金属加工会社における生産工程管理システムの開発電子情報システム工学専攻 S0713 清水邦宏.

Advertisements

データベースの基礎知識 ACEESS の基本操作. データベースの基礎知識データベース  特定のテーマや目的に毎のデータの集合体データベースソフトウェア  データベースを作成、管理するソフトウェアの総称 Oracle(Oracle) IBM(DB2) Microsoft(SQL Server)

メール暗号化：秘密鍵・公開鍵の作成　作業手順 Windows メール（Vista）.

第４章　ABC/ABMと原価情報原価計算・原価低減の新技法１．ABCとは何か２．ABCの有効性３．ABMとは何か４．ABMの有効性.

相互作用図ＦＭ１１０１０田中健太.

情報処理入門A・B 第7回ワープロソフト入門（２）

Deep learningによる読唇システム

～企業内の情報共有のために～暗黙知を→形式知へキッズウェイナレッジのご提案 200３年7月 24日 - 第１版 -

らくらく学校連絡網スライドショーで見る操作ガイド -7- 出欠確認付きメール escで中断、リターンキーで進みます

らくらく学校連絡網スライドショーで見る操作ガイド -3- 登録抜粋－管理者作業 escで中断、リターンキーで進みます

Imagio カンタン文書登録V2 画面シミュレーション.

パイプラインパフォーマンス管理 SAP Best Practices.

ABCの概要とその有用性加登豊（神戸大学大学院経営学研究科教授）清水信匡（桃山学院大学経営学部教授）

USB2.0対応PICマイコンによるデータ取得システムの開発

JavaによるCAI学習ソフトウェアの開発

「絵葉書を通じてのハルビンの街の印象調査」システムUIの iPadアプリ化谷研究室　　飯　祐貴.

「データ学習アルゴリズム」第３章複雑な学習モデル 3.1 関数近似モデル ….. … ３層パーセプトロン

F5 を押すか、または [スライドショー] > [最初から] をクリックして、コースを開始してください。

クロストーク成分の相互相関に着目した音場再生システム

デジタル信号処理①

水曜パソコン講座「Windows Security Essentials プログラムを実行する手順」　　　　　　　　を解説します.

らくらく学校連絡網スライドショーで見る操作ガイド -8- グループの新規登録、修正できる項目 escで中断、リターンキーで進みます

徳島大学工学部知能情報工学科 A1 グループ学部４年森陽司

状況の制約を用いることにより認識誤りを改善同時に野球実況中継の構造化

PSOLA法を用いた極低ビットレート音声符号化に関する検討

WebCluster スライドショーで見る操作ガイド

第７章　データベース管理システム７．１データベース管理システムの概要７．２データベースの格納方式７．３問合せ処理.

平成22年度に実施を予定するインターネットを用いた研修システムによる研修ライブ配信受講手順書

Webを使ったナレッジマネジメントとビジネス展開*

音声処理ソフトPraatの使い方.

　データベースによる並列処理情報論理工学研究室　三宅健太.

LabVIEWによる地上気象観測データ収集システムの開発

物流への興味向上のためのＶＲを用いた近未来流通センターの構築

技術参照モデルとシステム要件定義に関する学習システム

【プログラミング応用】必修２単位　通年　30週授業形態：演習.

長岡技科大オープンハウス岐阜高専４年電子制御工学科森　永二郎.

アウトバウンド業務ガイダンス Ver.7 アウトバウンド業務について、作業フローを具体的な事例別にご説明します。

Leap Motionを用いた実世界指向アプリランチャの設計と開発

資料1-6 平成26年度第1回技術委員会資料支援ツール群整備方針

広瀬啓吉研究室４．音声認識における適応手法の開発１．劣条件下での複数音源分離５．音声認識のための韻律的特徴の利用

技術参照モデルとシステム要件定義に関する学習システム

雑音環境下における非負値行列因子分解を用いた声質変換

深層学習を用いた音声認識システム工学部　電気電子工学科　白井研究室 T213069　林健吉.

MSET使用方法　一時中断したい場合には、マウスの右クリックをしてください（小ウインドウが開き一時停止します）。続行する場合には、開いた小ウインドウ以外の適当な場所を右クリックしてください。

【e-Rad】担当者用平成２４年度公募（三次）新規公募（三次）設定操作説明（3月2９日修正版）

TIME SIGNAL: 集合知を利用した赤信号点灯時間の取得手法

議事録作成支援Ｗｅｂアプリケーションの開発リアルタイム通信を用いた合意形成を目指して

オープンソース開発支援のためのソースコード及びメールの履歴対応表示システム

5母音の認識率(wの本数5) フレーム幅5、シフト幅2 全音素の認識率(wの本数5) フレーム幅5、シフト幅3

ルーブリック・チャート（評価）の活用と課題

AIを用いたドローンの新たな姿勢制御方法に関する研究

2. 音声とは 2.1 音声の科学 2.2 どうやって声を作るかー調音音声学 2.3 声の正体とはー音響音声学 2.4 どうやって声を聴き取るかー聴覚音声学.

音声認識・翻訳 Android アプリケーション制作

一方向画像からの３Dモデル生成電気電子工学科　白井研究室 T215049　田原　大輝.

プログラミングⅠ 平成30年10月15日森田　彦.

ビジネスプロジェクトの計画発表者名 | 会社名.

Firebaseを用いた位置情報共有システム

音声情報とベイジアンネットを用いた感性情報処理システム

Number of random matrices

コードクローン分類の詳細化に基づく集約パターンの提案と評価

高度プログラミング演習（０１）.

ブースティングとキーワードフィルタリングによるシステム要求検出

セマンテックWebを利用した加工工程決定支援システム

開発作業の形式化に基づくプロセス評価松下誠大阪大学.

クラスタリングを用いたベイズ学習モデルを動的に更新するソフトウェア障害検知手法

ロボットから人に話しかける判断モデルの構築

1-Q-12 Buried Markov Modelを用いた構音障害者の音声認識の検討

メール作成・送受信の介助者無人化への取り組み〔実際の症例を交えて〕

1-P-2 フィッシャー重みマップに基づく不特定話者音素認識の検討

P2Pによる協調学習システム唐澤　信介　　北海道工業大学　電気工学専攻.

Presentation transcript:

継続的物流ＡＢＣ／ＡＢＭのための音声認識記録システムについて２０００７２８　田中　裕一流通施設計画研究室所属の田中裕一です。本日はどうぞ宜しくお願い致します。ではこれより私の卒業研究「継続的物流ＡＢＣ／ＡＢＭのための音声認識記録システムについて」の発表を始めさせて頂きます。指導教官　鶴田三郎　教授　　　　　　　黒川久幸　助教授

目次はじめに音声認識記録システムの開発評価まとめ

物流改善のための物流ＡＢＣ／ＡＢＭ Activity：活動（局所的な仕事の単位）コストはいくらかかっているのか？ＡＢＣ：活動基準原価計算（Activity-Based Costing ）プロセスに無駄はないか？物流の現場ではコスト増やミスが発生してもその原因が分からないということがしばしば起きており、物流改善の着手が難しいものとなっています。こうした問題に対するアプローチとして物流ＡＢＣ／ＡＢＭの手法があり、物流業務を活動（アクティビティ）単位で捉えた分析を行います。ＡＢＣとはActivity-Based Costingの略であり、活動基準原価計算と訳されます。アクティビティごとに原価を計算することによってコスト発生のメカニズムをつかむことができます。一方、ＡＢＭとはActivity-Based Managementの略であり、活動基準管理と訳されます。これは活動を左右する要因である原価作用因（動作や作業時間）を設定し、この実績値を分析することにより業務改善へとつなげます。尚、ABMではABCで得られた原価情報を使用します。中小企業庁では中小物流企業における物流改善を目的として「物流ABC準拠による物流コスト算定・効率化マニュアル」を公開しており、この図の通りアクティビティ項目を用意しています。荷物の扱いがケース単位なのかピース単位なのかによって業務内容が異なることから別々のアクティビティとして捉えられています。ＡＢＭ：活動基準管理（Activity-Based Management ）（出所：中小企業庁「物流ABC準拠による物流コスト算定・効率化マニュアル」より作成）

作業時間データの収集投入要素人件費土地・建物人フォークリフト格納台車格納資材消耗品機械設備ケース目視検品バラピッキング ABCでは各アクティビティに投入要素を割り振ります。人に関しては人件費を割り振るわけですが、割り振りにあたっては作業時間を基準とするため、作業時間のデータを収集する必要があります。ケース機械検品待機袋詰め

作業日報作成の手間頻繁に記録する場合は手間が大きい開始と終了を結んだ線を引く従来、作業時間はこのような作業日報を用いて記録します。作業記録は作業後記憶に頼って記録するよりも、リアルタイムに記録することでより正確なデータが取れます。しかし、作業中に記録するのであれば、業務の作業を中断させることなく行われなくてはなりません。特に記録対象が数十点(数十回)に及ぶ場合は作業の妨げとなり、記録にかかる負担が大きくなります。このことから、継続して物流ABC/ABMを用いた分析を行うためには業務作業の妨げにならず短時間で記録を行えるツールが必要であるといえます。

研究の目的物流ＡＢＣ／ＡＢＭ導入を推進作業記録の入力にかかる負担を軽減するツールとして音声認識を活用した記録システムを構築する構築したシステムの有効性を明らかにする一方、音声認識と呼ばれる音声を文字に変換する技術があり、カーナビゲーションへの入力や電子カルテの作成などに応用されています。本研究ではこの音声認識を活用した物流ABC/ABMのための記録システムを構築すると共にその有効性を明らかにすることを目的とします。物流ＡＢＣ／ＡＢＭ導入を推進

目次はじめに音声認識記録システムの開発評価まとめ

システムの設計要件話者の特徴に合わせられる誰にとっても使い易い語彙の登録を柔軟に行える物流現場の騒音に耐えうる音声によってシステムを操作できる自由に動き回れるシステムの設計要件について説明します。今回はこの部分に関して構築を行いました。制御用単語として設定したキーワードを発声するまでは作業記録データベースへの書き込みはなされないようになっています。作業者はこの制御用単語によってシステムを操作します。また、物流では様々な専門用語が用いられており、現場独自の呼び方・略し方があるため、単語辞書データベースをテキストファイルから読み込む方式とし、容易に変更できる設計としました。例）無線接続

システムの構成端末単語辞書音声認識ＯＣＸデータベースドキュメントトーカマイクロフォン音声認識プログラミング開発処理部ソフトウェア　Visual Basic6.0 スピーカ命令処理部今回のシステム開発には、汎用の音声認識ソフトであるドキュメントトーカに付属する音声認識OCXを、プログラミング開発ソフトであるVisual Basic6.0に組み込んで使用しました。作業記録データベースが先述の作業日報に該当します。開始と終了の間隔で実働時間を、また終了と開始の間隔でロス時間等をつかめます。作業記録データベースＷｉｒｅＯｒＷｉｒｅｌｅｓｓデータベースソフトウェア　Microsoft Access

単語辞書データベースの設定ユーザの指定記録フォームへ単語辞書となるテキストを指定認識レベルの指定認識時間の指定制御用単語の指定システムの起動においては、まずユーザを指定します。これによって単語辞書となるテキストファイルのフルパスを指定し、システムの単語辞書データベースに読み込ませます。認識レベルの指定認識時間の指定制御用単語の指定

記録フォームの画面入力形式の選択音声認識の開始音声ファイルの参照音声認識の停止音声ファイル再生音量メータフォームの終了ユーザを指定すると記録フォームの画面が表示されます。認識開始ボタンをクリックすることで音声認識が開始されます。認識結果

書き込みが可能になったことを告げる応答音を確認記録の手順書き込み制御用単語を発声する書き込みが可能になったことを告げる応答音を確認記録項目を発声する記録の手順について説明します。作業者は制御用単語を発声することによってシステムを書き込み可能状態にし、続いて記録項目を発声して記録を行います。記録が完了した場合は応答音が返され、システムは再び書き込み停止状態になります。記録が完了したことを告げる応答音を確認

入力の一例① はじめりゅうつうけーすにうけ開始顧客：流通情報工学課程アクティビティ：ケース荷受け・検品これより、入力の一例を示します。グループ単位で記録することも検討したが、グループ内の作業者のアクティビティ開始（終了）のタイミングが一致しない場合やグループ内の作業者が他のアクティビティを行う場合などは記録するタイミングの捉え方が難しいものとなるため、作業者ごとに記録する設計としました。顧客名が流通情報工学課程であり、この顧客に対するケース荷受け・検品作業開始を記録するとします。単語辞書にはそれぞれ「りゅうつう」、「けーすにうけ」、「はじめ」と発音を定義してあります。りゅうつうアクティビティ：ケース荷受け・検品けーすにうけ

入力の一例② Pi ! 作業者記録フォーム画面マイク制御用単語として設定してある「マイク」を発声することで、ビープ音が一度鳴ります。これでシステムへの記録が可能になりました。

入力の一例③ PiPi ! りゅうつうけーすにうけはじめ作業者記録フォーム画面作業の記録 ID 日時時刻顧客アクティビティ開始／終了次の記録までの時間 1 2004/01/20 2:03 流通情報工学課程ケース荷受け・検品開始りゅうつうけーすにうけはじめ PiPi ! 作業の記録続いて記録項目を発声します。入力が完了するとビープ音が二度鳴ります。

目次はじめに音声認識記録システムの開発評価まとめ作業日報作成の記録方法としては用紙記入への筆記記入、ハンディ端末へのボタン入力が考えられます。この二つに音声認識記録システムによる音声入力を加えた３つの入力方法で実際に記録を行い、評価を行います。

測定の方法（用紙記入、端末入力） ①ＰＴＳ（Ｐｒｅｄｅｔｅｒｍｉｎｅｄ　ｔｉｍｅ　ｓｔａｎｄａｒｄ）法の基本動作を参考にして入力作業を基本動作（手をのばす、つかむ等）に分割。 ②分割した基本動作に順序を定めて、その通りに入力作業を行う。記録用紙への筆記記入用紙を掴む～記入する～用紙を置く PTS法とは、人間の作業をそれを構成する基本動作に分割し、その基本動作の性質と条件に応じてあらかじめ定めておいた時間値をあてはめることによって標準時間を設定する方法です。このPTS法を参考にして入力動作を分解しました。そして、分解した動作に順序を定め、その入力にかかる時間を測定しました。尚、実際の入力においては生じると思われる探索時間や思考時間は含めていません。入力は２０回行い、その平均を以って所要時間としました。ハンディ端末へのボタン入力端末をポケットから取り出す～ボタン入力～端末をポケットに仕舞う

用紙記入の想定用紙記入についての想定を説明します。作業員はこのような記録用紙を携帯しており、記録のタイミングごとに用紙へ点を記入します。

平均8.5秒用紙記入の基本動作と順序 ①手が自然に下がっている状態から記録用紙及び筆記具まで手をのばす（記録用紙及び筆記具は正面の腰の高さ位置に置かれている） ②記録用紙及び筆記具をつかむ ③記入用紙を胸の位置まで運ぶ ④正面にある掛け時計（アナログ）で時刻を確認する ⑤記入欄を確認する ⑥筆記具を記入位置まで運ぶ ⑦記入する（点付け） ⑧記入用紙及び筆記具を置く ⑨手を自然な状態に下げる赤：手の使用青：眼の使用入力動作はこの順序で行いました。手をのばす、つかむといった基本動作についてPTS法を参考にしています。今回の測定において所要時間は８．５秒でした。平均8.5秒

端末入力の想定続いて端末入力の想定について説明します。作業者は記録のタイミングごとにハンディ端末へボタン入力を行います。今回は携帯電話を端末に見立てて行いました。

平均9.9秒端末入力の基本動作と順序 ①手が自然に下がっている状態からズボンの前ポケットまで手をのばす ②端末をつかむ ③端末をポケットから取り出す ④端末を胸の位置まで運ぶ ⑤端末のボタンを押す（まず親指がホームポジションの位置に置かれている。ここから画面を確認し、テンキーの１を親指で押した後にホームポジションに戻す。これを３度行い、最後に親指で確定ボタンを押す） ⑥端末をポケットに運ぶ ⑦端末をポケットにしまう ⑧手を自然な状態に下げる平均9.9秒入力動作はこの順序で行いました。今回の測定において所要時間は９．９秒でした。赤：手の使用青：眼の使用

平均5.3秒音声入力の想定・動作順序 ①書き込み制御単語を発声する ②応答音から書き込みがＯＮになったことを確認する ③作業記録を発声する　「りゅうつう、けーすにうけ、おわり」 ④応答音から記録が完了したことを確認する平均5.3秒最後に音声入力の想定について説明します。作業者は音声認識記録システムを用いて入力を行います。測定対象は「マイク」と発声してから記録完了の応答時間を確認するまでとしました。入力動作はこの順序で行いました。今回の測定において所要時間は５．３秒でした。緑：音声の使用橙：耳の使用環境条件　CPU　CLOCK：２．６６GHz 　騒音４０dＢ程度の室内

入力方法と所要時間５．３秒８．５秒９．９秒音声認識記録システムによる音声入力記録用紙への筆記記入ハンディ端末へのボタン入力続いて今回の測定における考察を行います。音声入力では用紙及び端末を用いた場合と比較して約3秒程度短い時間で入力を行えました。これは入力の前動作、後動作が少なかったためと思われます。記録用紙への筆記記入ハンディ端末へのボタン入力

検出成功率５．３秒１７／２０回４．４秒１７／２０回２０／２０回３．３秒入力の所要時間検出成功率単語数３りゅうつう、けーすにうけ、おわり５．３秒８５％１７／２０回単語数２けーすにうけ、おわり８５％４．４秒１７／２０回単語数１また、検出成功率については、今回の測定において発声したにも関わらず応答なしが単語数２と３の場合において二十回のうち３回あり、認識精度の向上が今後の課題であると言えます。１００％おわり３．３秒２０／２０回入力の所要時間

目次はじめに音声認識記録システムの開発評価まとめ

ツールの必要性から音声認識記録システムを構築眼や手を用いることなく記録を行えるため、まとめ① 業務の妨げにならず記録を行えるツールの必要性から音声認識記録システムを構築音声認識記録システムによる音声入力は記録用紙及びハンディ端末を用いるよりも短時間での入力が可能眼や手を用いることなく記録を行えるため、これらの部位を他の作業へ使用可能業務の妨げにならずに記録を行えるツールが必要なことから、音声認識記録システムを構築しました。用紙や端末を用いるよりも入力時間が短く済むこと、眼や手が自由になるという点において音声認識記録システムが有効であることを確認できました。

継続した物流ＡＢＣ／ＡＢＭに役立つと考えられる誤って認識されることが現在の技術では存在するため、単語辞書を必要となる単語のみに絞ることでまとめ② 業務作業の記録が容易になり、継続した物流ＡＢＣ／ＡＢＭに役立つと考えられる似た音を持つ意図しない単語が誤って認識されることが現在の技術では存在するため、単語辞書を必要となる単語のみに絞ることで認識精度の向上につながるものと思われるその結果として物流ＡＢＣ／ＡＢＭを用いた業務分析を継続して行うことに役立つと考えられます。また実用化には認識精度の向上が課題でありますが、単語辞書を絞ることで認識精度の向上につながるものと推測されます。

今後の課題話者の特徴に合わせられる誰にとっても使い易い語彙の登録を柔軟に行える物流現場の騒音に耐えうる特定話者に対応した音響モデルを用い、音素レベルでの認識精度を向上させること誤認識の修正や発声の癖を学習する適応化技術を取り入れること発話内容の推測を行い、認識を助ける工夫を取り入れること音声によってシステムを操作できる自由に動き回れる今後の課題としては、自由に動きまわれるよう無線での接続、及び物流現場の騒音に耐えられる仕様にするといったシステムの高度化を図ることが挙げられます。また、音声は個人差が大きく、内容の理解が重要なポイントであるため、発話内容の推測も必要であると思われます。例）無線接続

ご清聴頂きありがとうございました

音声波から特徴ベクトル（短時間スペクトル）時系列を抽出する方法振幅音声波時間時間窓フレーム周期フレーム特徴ベクトル

波形のパワースペクトル（母音/ａ/）Ｆ１Ｆ２Ｆ３対数パワーＦ４［ｄＢ］周波数〔ｋＨｚ〕０－１０スペクトル包絡－２０－３０－４０［ｄＢ］－５０－６００１２３４５周波数〔ｋＨｚ〕

母音に対する音響モデルの例音響モデル入力された音が「あ」である確率入力された音０．４「あ」のモデル × 平均 × 「い」のモデル１．００．０ × × × ×

語彙登録のためのテキストファイル作成発音表記けーす＝ケースぴーす｜ばら＝ピースばーす＝バーステキストファイル K E : S U 発音　　　表記けーす＝ケースぴーす｜ばら＝ピースばーす＝バーステキストファイル K E : S U 音響モデルで作られた音声データ

スペクトル距離計算認識上限スコア点数０５００１０００１５００正解入力パターンに対する標準パターンの第一候補入力パターンに対する標準パターンの第二候補

記録フォーム（単語数２）認識結果各項目に分割

単語音声認識の仕組み入力音声信号音響特徴量抽出スペクトル距離計算単語照合認識結果（単語）音響モデル発音辞書

音声ファイルからの時刻取得音声 003_11_05.wav １１時０５分に録音したことを表している