LZ符号化 森田 岳史.

Slides:



Advertisements
Similar presentations
果物識別 補足資料 1. やりたい事  入力された画像内に映っている果物が何かを自動判 別するプログラムを組むこと 識別器 りんご です.
Advertisements

コンピュータ演習Ⅰ 8月9日 ( 火 ) 2 限目 成績データ処理. 2時限目のテーマ サンプルシートに組み込まれた数式を 理解する。 模擬試験の成績データ処理のテーブルか ら 検索処理、論理処理、帳票作成処理など を 学ぶ。
日本語 WWW 情報を用いた COCET3300 英単語学習支援に関する研究 情報・知能工学専攻 博士前期課程2年 渡邉 雄大 指導教員 河合 和久.
データの圧縮.
到着時刻と燃料消費量を同時に最適化する船速・航路計画
3次元nクイーン問題の 解に関する研究 論理工学研究室 伊藤精一
プログラムのパタン演習 解説.
卒研のようなもの 圧縮ちーむ 2008.6.24 鴫原、山本、齋藤.
WagbyR6.5 Update 14 PPT版 更新情報
富山大学 公開講座 2008 「QRコードを作ろう!」 ~ QRコードを作ろう! ~.
2017/3/2 情報処理 第8回.
文字列検出ツール "istrings" の使い方
ハルビン絵葉書コレクションシステムの再構築と機能追加 -サーバ側:PHPとMySQLを用いて
15.1 文字列処理の基本 15.2 文字列処理用ライブラリ関数
LZ圧縮回路の設計とハード・ソフト 最適分割の検討 電子情報デザイン学科 高性能計算研究室 4回生 中山 和也 2009/2/27.
Data Clustering: A Review
データ構造とアルゴリズム論 第5章 整列(ソート)のアルゴリズム
2017/3/7 情報処理 第8回.
第11回 整列 ~ バケットソート,基数ソート,ヒープソート~
文字書式設定(1) 方法1: ①文字書式を設定したい文字列を選択する。 ②「書式」メニュー → 「フォント」とクリックする。
有効数字 有効数字の利用を考える.
分子生物情報学 動的計画法に基づく配列比較法 (ペアワイズアライメント法)
実験 関数・記号付き文型パターンを用いた機械翻訳の試作と評価 石上真理子 水田理夫 徳久雅人 村上仁一 池原悟 (鳥取大) ◎評価方法1
ソシオン理論における 三者関係のシミュレーション
エッジの検出 画像中に表示された物理の輪郭(エッジ(edge))や線では、一般的に濃淡が急激に変化しており、これらは画像中のなんらかの構造を反映していることが多い このようなエッジや線の検出処理は、画像理解や認識のための前処理として重要である   差分型によるエッジ検出   零交差法によるエッジ検出.
Webサイト運営 09fi118 橋倉伶奈 09fi131 本間昂 09fi137 三上早紀.
     年  月  日 名前 太郎 1 班.
疑似頻出アイテム集合の 多項式遅延列挙アルゴリズム
システム開発実験No.7        解 説       “論理式の簡略化方法”.
補数 n:桁数、b:基数 bの補数 bn-x 253(10進数)の10の補数は、 =747
第20章 Flyweight ~同じものを共有して無駄をなくす~
データ構造とプログラミング技法 (第10回) ー文字列照合(KMP法、BM法)ー.
市町村等から電話照会等を行う場合の対応について
Office IME 2010 を使う.
エッジの検出 画像中に表示された物理の輪郭(エッジ(edge))や線では、一般的に濃淡が急激に変化しており、これらは画像中のなんらかの構造を反映していることが多い このようなエッジや線の検出処理は、画像理解や認識のための前処理として重要である   差分型によるエッジ検出   零交差法によるエッジ検出.
識別子の命名支援を目的とした動詞-目的語関係の辞書構築
定兼邦彦 今井浩 東京大学理学系研究科 情報科学専攻
環境リスクマネジメントに関する 検索システム
リファクタリング支援のための コードクローンに含まれる識別子の対応関係分析
     年  月  日 名前 太郎 1 班.
     年  月  日 名前 太郎 x 班.
知識情報演習Ⅲ(後半第3回) 辻 慶太
レジスタの割付け 中田育男著 コンパイラの構成と最適化 朝倉書店, 1999年 第12章5節.
1.Webサイトの情報を活用しよう プレゼンテーション資料
知識情報演習Ⅲ(後半第2回) 辻 慶太
アルゴリズムとプログラミング (Algorithms and Programming)
変換されても変換されない頑固ベクトル どうしたら頑固になれるか 頑固なベクトルは何に使える?
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
情報スキル活用 第4週 基礎技術-4 : その1(タグのまとめ).
様々な情報源(4章).
9.通信路符号化手法1 (誤り検出と誤り訂正の原理)
知識情報演習Ⅲ(後半第3回) 辻 慶太
データ構造とアルゴリズム論 第5章 整列(ソート)のアルゴリズム
計算機プログラミングI 第5回 配列 文字列(Stringクラス) mainの引数 配列の利用例
Hoffman符号 2011/05/23.
コーディングパターンの あいまい検索の提案と実装
15.1 文字列処理の基本 15.2 文字列処理用ライブラリ関数
オブジェクト指向 プログラミング 第六回 知能情報学部 新田直也.
ハフマン符号長の効率的な求め方.
人工知能特論II 第8回 二宮 崇.
文字書式設定(1) 方法1: ①文字書式を設定したい文字列を選択する。 ②「ホーム」 → 「フォント」部の右下の矢印とクリックする。
4.プッシュダウンオートマトンと 文脈自由文法の等価性
情報処理Ⅱ 第7回 2004年11月16日(火).
ソフトウェア理解支援を目的とした 辞書の作成法
Webページタイプによるクラスタ リングを用いた検索支援システム
オブジェクト指向 プログラミング 第四回 知能情報学部 新田直也.
線形符号(10章).
15.1 文字列処理の基本 15.2 文字列処理用ライブラリ関数
無向グラフが与えられたとき、最大位数の完全部分グラフを求める問題
雑音環境下における Sparse Coding声質変換 3-P-49d
Presentation transcript:

LZ符号化 森田 岳史

文書データなど局所的に、法則性が 存在する。(データパターン) データパターンを符号化。 データパターンを登録するために 辞書を用いる。 元データに含まれる記号の出現率な どの事前情報を必要としない。 元データの種類にかかわらず、デー タ長が長くなればなるほど、より高 い圧縮効果が期待できる。

イメージ They will come soon 辞書 辞書とは英単語と対応する コードが記録されたデータ come 210 600 ・ come 210 ・ 600 1300 210 500 soon 500 ・ they 600 ・ 辞書に記録されたデータパターンに 従ってデータ値をコード化する will 1300 ・

LZ77符号化 (スライド辞書法)

コード化 スライド辞書による (A)辞書データ (B)符号化する データパターン 0 1 2 3 4 5 6 7 8 A B C D E F 0 1 2 3 4 5 6 7 8 A B C D E F G H I (A)辞書データ (B)符号化する データパターン コード値 B B C D E 1,4 1番目から4つが一致する

スライド辞書へのデータ追加 元の辞書データ 追加後の 辞書データ 先頭のデータを消去して 追加分を末尾に加える 0 1 2 3 4 A B 0 1 2 3 4 A B C D E 追加 F G 元の辞書データ 0 1 2 3 4 追加後の 辞書データ C D E F G 先頭のデータを消去して 追加分を末尾に加える

が複数ある場合 一致するデータパターン 辞書データ 符号化する データパターン “0,2”と”2,4”の2つのコード 0 1 2 3 4 5 6 7 8 A B A B C D E F G 辞書データ “0,2”と”2,4”の2つのコード が考えられるが、”2,4”の方 が一致長が長いため、こちら を用いる。 符号化する データパターン A B C D

4,4'X' LZ77符号化での出力方法 辞書データ 符号化する データパターン 一致するデータパターン 0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 7 8 A B C D E F G H I 辞書データ 符号化する データパターン E F G H X コード値 “4,4” 次に続く1データは そのまま出力 出力 4,4'X'

LZ77符号化の流れ 1、空のスライド辞書を用意する 2、処理したいデータ列のデータパターンと一致するデータパターンを辞書中から検索する。 一致するデータパターンが複数ある場合は、それらを全て求める。 3、検索の結果、一致長が最も長いデータパターンにおける辞書中の位置と長さを求め、その 値を出力する。一致するパターンまったくない場合はポイント情報を”0,0”として出力する。 4、次に続くデータ1つ、そのまま出力する。 5、辞書データの更新。 6、処理したいデータ列がなくなるまで2〜5を繰り返す。

0 1 2 3 4 5 6 7 8 A B A A A B A B C 処理したいデータ 辞書 処理するデータパターン 出力値 0 1 2 3 A 0,0 'A' 0 1 2 3 0,0 'B' A B 0 1 2 3 A B A A 2,1 'A' A B 0 1 2 3 0,2 'A' 0 1 2 3 最大一致長が 2なのでここまで A A B A B C 2,1 'C'