アンケート調査へのOMR活用 岡山商科大学経営学部 田中 潔
この報告の背景 いくつか スキャナをOMRとして利用することは聞いていた。認識ソフトを使う機会がなかった 学内出席採点開発の機会に恵まれた この報告の背景 いくつか スキャナをOMRとして利用することは聞いていた。認識ソフトを使う機会がなかった 学内出席採点開発の機会に恵まれた 認識ソフトを導入してみた ついでに社会調査に応用する機会 結果: 調査や出席採点には使える感触
アンケート調査のデータエントリー 表計算入力型…エクセルが代表、入力大変 機械エントリー型 今やOMR 光学式マークリーダー OCR 光学式文字リーダー さらにスマホやタッチペンによる漢字認識も アンケートへのOCR、OMR利用 1990年代割と盛んに
今なぜOMRなのか? OMRの長所 OMRの制約 このため、原理の追求は行われたが、残念ながら普及するには至らなかった 認識性が単純であり、ラフ OMRの制約 精度向上には、専用用紙、インクを推奨 定型的フォーマットに向く 印刷会社に限定がある(例:小林記録紙) このため、原理の追求は行われたが、残念ながら普及するには至らなかった
その後、認識装置 格段の進歩 特に、Desk Top OMR推進の原動力 1.安価、高速になったスキャナ 2.マーク識別ソフトの生き残り その後、認識装置 格段の進歩 特に、Desk Top OMR推進の原動力 1.安価、高速になったスキャナ 特に自動給紙タイプのハンディ型 電子書籍普及戸ともに、画像読み取りとして「自炊」デバイスとして重宝 2.マーク識別ソフトの生き残り 大手メーカーは参入しないものの、それなりの小さな市場を形成してきた
普通紙マークシートソフト 正一郎 IAC社 13万円 Remark office OMR ハンモック社 16万円 いずれも、 正一郎 IAC社 13万円 Remark office OMR ハンモック社 16万円 いずれも、 OMR・バーコード認識 エクセル風表計算 定型的な単純集計・統計機能 外部データへの変換
OMR読み取りまでの手順概要 1.Wordなどで回答用紙を作成する 2.読み取る項目を認識ソフトで指定する 3.回答用紙をスキャナで読み取り 画像ファイル化する 4.認識ソフトで認識する マーク→数値 5.エクセル風画面から数値データとして保存 各種ファイル化が可能 またはコピペで移動させる
認識ソフトの出会い、なれそめ 2010・2011 学内出席システムの整備 主システムはWeb上で稼動学生証バーコード→ハンディスキャナ認識 2010・2011 学内出席システムの整備 主システムはWeb上で稼動学生証バーコード→ハンディスキャナ認識 毎回小テストをとりたい要望 解決1 学籍番号バーコードシールを配布 解決2 別のおまけシステムの導入 このとき認識ソフトRemark Officeを購入できた。この有効利用
学識番号認識の例
こうして、出席システムへの適用は可能になった 学内幾つかの科目で利用される キャリアセンターなどの意見採集に応用 そこで、アンケート調査の回答に適用できないか?との模索開始
アンケート調査の回答用紙に応用 記入例(一部)
回答用紙の認識項目の割当 (テンプレート作成)
画像ファイルからの認識
認識された素データ
認識できるマークパターン Remark Officeの場合 Multiple 単一回答または複数回答 Grid 複数行(列)を一つの文字列 ○●○ ○○● “12” Binary 0/1の文字列 ○●●○ “0110” その他、List、Add、Booleanなどもある バーコードCODE39,Codebarも認識
若干の注意点 ○●○●○○ 1と3にマークあり 認識させると“1,3”という文字列を返す ちょうどエクセルの複数回答として認識 ○●○●○○ 1と3にマークあり 認識させると“1,3”という文字列を返す ちょうどエクセルの複数回答として認識 “010100”はbinaryで可能 0,1,0,1,0,0の数値としては返してくれない しかし、SPSSやExcelファイルなど多岐にわたるファイルに変換が可能
使用するマークのフォント 認識できるフォント 推奨: Arialの大文字O(オー)10-12ポイント 日本語○●①②・・・も問題なし サイトから専用フォント①やAの○囲いなどが供給される 検索エンジン「OMRフォント」で検索 Windowsマークシートフォントは大きくしてもうまく行かなかった。今後の研究課題
岡山地域の印刷動向調査 2011への適用 目的: 岡山県下の企業を対象に、社内での印刷や外注状況を知る 目的: 岡山県下の企業を対象に、社内での印刷や外注状況を知る 方法: 所定のアンケート用紙による郵送留置き方法 回収: 郵送により返送(約1週間) 対象: 岡山企業年報2011の企業4,026社のうち無作為に抽出した600社
認識とは別に、事前に会社IDの設定により、フェース部分の印刷
実施結果の評価・まとめ 回収した約200票は20分程度で読み取り出来た 誤認識回収の訂正を含めても1時間以内で素データが完成した A41ページの回答票に20問程度の回答が可能だった 回答項目が増えても複数ページに分ければ読み取りは可能 複数回答の設計に工夫が必要