「ザバンイー」データエントリーシステム ■日本語データ・エントリー業務の既存問題を解消する

Slides:



Advertisements
Similar presentations
1業務の実施方針等に関する事項 【 1.1 調査内容の妥当性、独創性】  事業の基本方針、目的及び調査内容 記述内容 ・仕様書を踏まえて、本事業の基本方針、目的について具体的に記述する。 ・仕様書を踏まえて、本事業の内容について具体的に記述する。 ・当局が提示した内容以外に、当該事業を効果的・効率的に実施するための新たな提案がある場合、その内容を具体的に記述する。
Advertisements

データベースの基礎知識 ACEESS の基本操作. データベースの基礎知識 データベース  特定のテーマや目的に毎のデータの集合体 データベースソフトウェア  データベースを作成、管理するソフトウェアの総 称 Oracle(Oracle) IBM(DB2) Microsoft(SQL Server)
【1 事業の内容及び実施方法】 1.1. 事業内容(実施方法を含む) 「逆止弁」の要求仕様
本日のスケジュール 14:45~15:30 テキストの講義 15:30~16:15 設計レビュー 16:15~16:30 休憩
HG/PscanServシリーズ Acrobatとなにが違うのか?
MS-Word ⇒ XML 2001/10 マウスをクリックしてください。(カーソルはどこにあっても結構です。)次ページが表示されます。
【1 事業の内容及び実施方法】 1.1. 事業内容(実施方法を含む) ペデスタル外調査装置の装置改善仕様及び改善効果の整理
情報処理基礎 2006年 6月 1日.
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)

ビジネスパターンに基づく クラウドシステムのサービスレベル設計
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
文献管理ソフトRefWorksの利用.
リサイクルショップ向け 委託販売管理システム
共同ローカリゼーション フレームワーク 井上 謙次.
PSOLA法を用いた極低ビットレート音声符号化に関する検討
13回目 複合情報検索 13-1 課題の概要 13-2 EBSCOhost の使用方法 13-3 ProQuestの使用方法
空間メタデータ整備 における課題 園山 実 三菱総合研究所.
Excelでできる 「基板工程管理システム」のご紹介
Webを利用した授業支援システムの開発 北海道工業大学 電気電子工学科 H 渋谷 俊彦.
【1 事業の内容及び実施方法】 1.1. 事業内容(実施方法を含む) 「熱流動解析および水素濃度解析」の要求仕様
セマンティクスを利用した 図書検索システム

生産本部 生産革新部 改善テーマ活動計画書 須藤 正美 X-Session2次問い合わせ対応率向上 活動ステップ
情報コミュニケーション入門b 第4回 ワープロソフト入門(2)
政府情報システムのコスト削減の 取組状況について
2016年度秋期 成果発表会 2016年11月25日 大阪開発センター 技術一部 畑中 龍樹.
平成30年度 那覇空港における二次交通としての路線バス等の利用促進に関する調査・検討業務
【1.1 事業(調査)目的】 1 8.1 (別紙1) 提案書雛型 本事業(調査)の目的について 記述内容
2004年度 サマースクール in 稚内 JavaによるWebアプリケーション入門
k 個のミスマッチを許した点集合マッチング・アルゴリズム
「沖縄におけるスポーツサイエンスの拠点化に向けた
○ ○ ○ こんな場合にお勧め 機能概要 SAP ERP伝票/マスタ入力をExcelを使って簡単に実現 Excel入力テンプレート
プロセス.
事務所における情報化の問題点 データが所内で共有されていない、各課ごとに個別に利用されている
アップデート 株式会社アプライド・マーケティング 大越 章司
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
第7回 授業計画の修正 中間テストの解説・復習 前回の補足(クロックアルゴリズム・PFF) 仮想記憶方式のまとめ 特別課題について
加工工程決定支援システム 電子情報通信学会 2010年総合大会 2010年3月18日 松江工業高等専門学校  情報工学科 越田 高志.
【1 事業の内容及び実施方法】 1.1. 事業内容(実施方法を含む) 水素発生量評価試験
【1 調査の目的、内容及び実施方法】 1.1 調査目的
長期滞在型テレワークの誘致及び導入検討調査
オープンソース開発支援のための ソースコード及びメールの履歴対応表示システム
IoT活用による糖尿病重症化予防法の開発を目指した研究
「沖縄におけるスポーツサイエンスの拠点化に向けた
レビューとは (プロジェクト管理の観点から)
中国の日系企業に最適のシステム 御社の業務に最適な3つの理由 初期投資なしで すぐに始められる ITに詳しい 担当者不要 何度でも 変更可能.
【1 調査の目的、内容及び実施方法】 1.1 調査目的
事務所における情報管理の問題点 情報管理の現状 “欲しいデータが探せない” 情報管理の現状 “媒体ごとの個別管理”
「地域経済産業活性化対策調査(沖縄市が整備するアリーナ施設を核としたまちづくり等に関する基礎調査)」
【1.1 事業(調査)目的】 1 8.1 (別紙1) 提案書雛型 本事業(調査)の目的について 記述内容
コードクローン分類の詳細化に基づく 集約パターンの提案と評価
コーディングパターンの あいまい検索の提案と実装
本日のスケジュール 14:45~15:30 講義 15:30~16:15 企画書レビューシート記入 16:15~16:30 休憩
第16章 動的計画法 アルゴリズムイントロダクション.
構造的類似性を持つ半構造化文書における頻度分析
セマンティックWebの 生産管理システムへの適用
【1 事業の内容及び実施方法】 1.1. 事業内容(実施方法を含む) 実機大収納缶の健全性確認試験の計画
平成30年度 交通結節点創出等による利用促進方策 及び最適な公共交通料金の検討に関する調査業務 提 案 書
データ中心システム設計方法論“DATARUN” 
【1 事業の内容及び実施方法】 1.1. 事業内容(実施方法を含む) 瓦礫類・伐採木管理票の分類・情報整理の検討
プログラミング基礎a 第3回 C言語によるプログラミング入門 データ入力
(別紙1) 提案書雛型 令和元年度 沖縄型テレワーク実装推進調査 ー提案書ー                        (日付)                        (企業名)                        (連絡先等)
セマンティックWebの 生産管理システムへの適用
【1 事業の内容及び実施方法】 1.1. 事業内容(実施方法を含む) 装置据付作業
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
事業内容(実施方法を含む) 記述内容 6.1(別紙1) 提案書雛形 【雛形頁番号1】
(別紙1) 提案書雛型 那覇空港におけるレンタカー貸渡の 満足度向上のための実証事業 提 案 書                        (日付)                        (企業名)                        (連絡先等)
沖縄における希少作物の産地化及び観光資源化
Presentation transcript:

「ザバンイー」データエントリーシステム ■日本語データ・エントリー業務の既存問題を解消する ■最新技術の活用により生産性を求めて品質確保上のコストダウンが実現する ■システム開発会社が総合管理することで高品質業務を提供する                        大連ビジネスサポートセンター                       大連市沙河口区如意街24号C座2104室                          TEL:0411-3964-7600 FAX:0411-3964-7680                                  E-mail: info@dalian-bs.com

大連データエントリー分野の特徴 ピーク性 スケジュール管理 ピーク性   ― ピーク性が高いためピーク時に対応する要員を常時確保しておくことは不可能。ピーク時の   仕事量に応じて一挙に人集めを行わざるを得ない。中国では日本のデータエントリーに対応するため   日本語の分かる人員を一挙に集める必要があるが実際には不可能である。   従って日本側でピーク時にはあまり人員の選択は出来ない。  ― 以上の状況において例え人集めが出来たとしても品質確保は不可能に近い。  ― しかもデータエントリーでは、一般に納期は短期間であるため以上の問題点は更に加速される。 スケジュール管理  ― コスト安を狙って大規模なデータ入力業務を中国に出そうと考えるとスケジュール管理上多くの   問題が起こる。中国のデータエントリー会社は専門会社が多いためシステム開発の経験を持っている   会社は少ない。このような会社ではシステム開発のようなきちんとしたスケジュール管理は出来ない。   システム開発でさえスケジュール管理の問題が指摘されている中国では、データエントリー   分野だけに特化している専門会社ではスケジュール管理を前提にしたような大規模データエントリー   業務は受けられない。  ― 中国では、とにかく契約を取ってしまえば何とかなる、問題が起こってから解決すれば良いという考え方の   会社がシステム開発の会社でさえ多い。増してデータエントリーの分野では最初からスケジュール管理上   の問題点を理解さえしていないような会社が多い。これらを日本の会社側が商談だけで判別するのは   不可能に近い。

大連のデータエントリー会社の特徴 データエントリーの会社 要員  ― 一般に中国のデータエントリーは専門会社が実施しておりシステム開発の経験は無い。    従ってデータエントリー分野へのシステム利用とかセキュリティソフトの開発などは出来ない。    また継続的生産性向上などの方策は不可能。  ―  プロジェクト管理などの経験はなくスケジュール管理などはしたことが無い会社がほとんど。    従って大規模なデータエントリーの実行は難しい。  ―  大連においては、システム開発のように高賃金での採用と違いデータエントリー単独では日本語が分かって    スキルも高いというような要員の確保は不可能。  ―  ハード、ソフトなどという議論は出来ない。 要員  ―  日本語のデータ入力なので当然日本語の分かる要員が大量に必要になるが、コスト安での確保は    不可能に近い。日本語トレーニングが必要になるが、コストを考えると長期間の教育は不可能。    データエントリーだけでの日本語の分かる要員の確保では高いレベルの人員は集められない。  ―  このような環境では短期間に要求されるような量に対応できない。

最先端技術の活用により分業化して生産性を徹底的に向上させる 「ザバンイー」システムについて 最先端技術の活用により分業化して生産性を徹底的に向上させる ― 原稿レイアウトの自動解析機能  自社有力画像解析プログラムの活用で文章の画像を自動解析し、文字領域を抽出する。  この手法により業務フローとエントリー作業を分離させ、生産性を求める。  漢字や仮名と分類し、さらに同じ文字をソートして、作業の分業化により生産性を徹底的に高める。 ― 完璧なセキュリティ策  文章の内容により単語まで画像を自動分割し入力項目を決定する。  単独の入力画像断片をデータベースに登録して入力作業で参照する。  さらに入力の内容(漢字、かな、英数字など)を分類して、作業効率を求める。  入力項目と入力項目間のリンク関係は暗号化して別に保管する。 ― 入力作業の進行  入力作業はWEBサイトで行い、スケジュールなどの作業マネジメントはすべてシステムで行う。  日中間は同じ漢字文化圏の良さを生かして、日本の漢字は中国人としてピンインで入力可能にする。  日本語の分からない普通の人でもいつでも作業ができるようになる。 ― 品質管理  オペレータにより2回入力された文字列はすべてサーバ側のデータベースで管理し、入力された内容は  Levenshtein Distanceアルゴリズムを活用して評価し、さらに再入力の管理により正確度を徹底的に求める。  テストケースでは99.98%の品質を達成しておる。 ― 成果物の出力機能  システムで入力された断片的な文字を回収してサーバ側で最終文章に復元する。  お客さんのニーズに合わせ、様々な納品データのフォーマットは自由に設定可能にする。

注2:品質管理に編集距離 (Levenshtein Distance) アルゴリズム採用 「ザバンイー」システムについて 註1:ザバンイーの漢字入力法 オペレータのエントリー作業はJAPANESE-CHINESE言語の概念を基にピンインで入力する。  JAPANESE-CHINESE言語というのは 漢字は日本語の漢字をそのまま表記し、中国語のピンインで入力する。 漢字以外の文字はそのままにしてローマ字で入力する。 注2:品質管理に編集距離 (Levenshtein Distance) アルゴリズム採用 最長共通部分列問題 (LCS)について編集距離のアルゴリズムがあります。 編集距離 (レーベンシュタイン距離, Levenshtein Distance) は二つの文字列の類似度 (異なり具合) を定量化する ための数値です。 編集距離はスペルミスを修正するプログラムや、近似文字列照合 (検索対象の文書から入力文字にある程度近い部分 文字列を探し出す全文検索) などで利用されます。 LCS長は"最長"共通部分系列の計算、編集距離は"最小"の手順回数の計算です。 いずれも最大もしくは最小つまり最適解を求める問題で、ある問題がその部分問題の最適解によって 計算できるという点で共通しています。 このような特性を部分問題最適性と言います。部分問題最適性を持つ問題はその部分問題の重複度合いが高い、 つまり何度も同じ部分問題の最適化を参照するような場合に DP が有効です。

「ザバンイー」システムについて 注3:セキュリティのプロセス(紙シュレッダー手法よりセキュリティの確保) 入力枠の切り出しは細かいほどデータの安全性が高いので、文字列の単語単位まで抽出することにする。 NO1 NO2 NO3 NO5 NO6 NO4 NO1 NO2 NO3 NO5 NO NO4 XXX 発注側複数の原票画像からPGで入力する枠を抽出し、切り出します。 抽出した各枠にファイル名をつけて整理する。この時に各項目の順番があります。 入力枠のファイル名に暗号をかける。暗号化済みの画像のみを受注側へ転送。この場合に各項目の順番はなくなります。

「ザバンイー」システム入力画面(漢字)

「ザバンイー」システム入力画面(かな)

「ザバンイー」システム処理のプロセス コンピュータに任せられることは すべてコンピュータに任せよ! ①画像分析システム ②LANシステム ③入力データのポスト処理システム ①画像分析システム 自動認識の結果を、元画像と ともにDBに吸い上げ DB中の校正済みの データのポスト処理 (データ復元処理) 納品 校正結果評価 納品用分類 元画像の受領 (イメージデータ) 画像解析技術による元画像の分類整理 バッチ処理 入力項目の抽出 データベース サーバ ②LANシステム Client 入力作業 修正作業 Client側 VPNのLANシステム コンピュータに任せられることは    すべてコンピュータに任せよ!

作業対象&基本参考単価 作業対象 作業規模 基本参考単価(品質99.98%の場合) 各種データエントリーの原稿(一般文章、名刺、各種帳票) 各種の文字種類(手書き、活字、英数字、漢字、仮名) 作業規模 長春の計算機学校と提携して入力基地を設け300人の作業員を確保。 一日は最大400万文字の入力は対応可能。 基本参考単価(品質99.98%の場合) 英数字(半角)の場合は0.1円/文字、 漢字(仮名も含む全角)の場合は0.2円/文字。 その他の特殊処理については実際の仕様を検討してから、見積りを提出します。