情報知識ネットワーク 有村・喜田研究室 ex. 7678, 7679

Slides:



Advertisements
Similar presentations
産学戦略的研究フォーラム Strategic Software Research (SSR) 運営委員長 米澤 明 憲.
Advertisements

インドネシアの高等教育における 日本語教育の現状と問題 Wawan Danasasmita インドネシア教育大学( UPI )
日本学生ユーザスタディ互助会 (仮名) 企画書
Collage System 圧縮テキストパターン照合のための統一的枠組み
圧縮テキストに対する文字列照合問題 竹田研究室 博士課程二年 喜田 拓也.
文法変換に基づく圧縮 九州大学附属図書館 研究開発室 喜田拓也.
研究内容の紹介 電磁場の計算機シミュレーション 卒業研究 研究室の紹介
工学部 知能情報工学科 准教授 高 尚策 (コウ ショウサク)
LZ圧縮回路の設計とハード・ソフト 最適分割の検討 電子情報デザイン学科 高性能計算研究室 4回生 中山 和也 2009/2/27.
情報学類 吉田光男 アドバイザー教官: 山本幹雄 先生
第1回 ガイダンス 工学部担当 教員 吉岡 理文 ・ 岩村 雅一
WWW全文検索エンジン Vernoにおける 要素構造データベースの設計と実装
 鎌田ゼミへの道案内 ~鎌田ゼミ流総政ライフ~.
アルゴリズムとデータ構造 2012年7月19日
天野先生ってどんな人? 天野ゼミってどんな勉強するの? 勉強の方針は? 天野ゼミの楽しさって? 課題・説明会について 天野ゼミ生一同.
米山研究室紹介 -システム制御工学研究室-
アルゴリズムとデータ構造 第9回演習解答.
経済情報処理ガイダンス 神奈川大学 経済学部.
学校の コンピュータ 発表者 Miho Harusawa.
情報科学1(G1) 2016年度.
京都大学大学院 情報学研究科 社会情報学専攻 (財)科学技術振興事業団 (株) NTT コミュニケーション科学基礎研究所
経済情報処理ガイダンス 神奈川大学 経済学部.
2010年度 コンピュータリテラシー クラス:  B1 講義日: 前学期 月曜日7時限.
図書館と 情報スキルアップ教育 ―情報検索講習会報告と今後の展望―.
逆求人 2015/12/19 気の向くままに 楽しいことを探して 関西学院大学 理工学部 石川 智己.
Ibaraki Univ. Dept of Electrical & Electronic Eng.
課題4:無線ネットワーク 大学院技術英語 湯 素華 授業:6/12~6/26の3回、西9-115
専門演習Ⅰ 国際経済学部 国際産業情報学科 2年 石川 愛
基礎情報科学のトピックス (平成15年度版) 喜田拓也 (
経済情報処理ガイダンス 神奈川大学 経済学部.
2010/04/8 情報システム学科 情報システム演習1 担当:小宮山智志
コンピュータ リテラシー 担当教官  河中.
理論試験速報 理論問題部会長 鈴木 亨 先生 (筑波大学附属高等学校) にインタビュー.
アルゴリズムとデータ構造 2013年7月18日
データ構造とプログラミング技法 (第10回) ー文字列照合(KMP法、BM法)ー.
たまさきゼミナール 基礎から学ぶ年末調整 はじめての方でも年末調整実務が分かる! このまま へ
ネット時代の情報センス 基礎情報科学のトピックス.
情報検索技術のトピックス (平成16年度版) 喜田拓也 (
相川研究室 ~信号処理は世界を変える~.
九州大学大学院システム情報科学研究科 情報理学専攻 竹田研究室 博士課程3年 喜田 拓也
Pattern Matching on Compressed Texts
喜田 拓也,竹田 正幸,篠原 歩 九州大学大学院システム情報科学府 情報理学専攻
コンピュータを知る 1E16M009-1 梅津たくみ 1E16M017-8 小沢あきら 1E16M035-0 柴田かいと
Fast Pattern Matching Algorithms in Compressed Texts
文字列照合を用いた XMLデータアクセス機構の提案
Proceedings of the Third South American Workshop on String Processing.
ソフトウェア情報学総論 基盤ソフトウェア学講座
HPC基盤における大量データ転送のためのデータ転送ツールの評価
只見町 インターネット・エコミュージアムの「キーワード」検索の改善
コンピュータの仕組み 1E16M048 圓谷 英一 1E16M050 徳弘 徹也 1E16M051 戸張 将義 1E16M052 飛田 優輝
情報システムの基礎概念 (1) 情報システムとは
1.情報機器について知ろう(p.8-9) 第1章 第1節
半構造化テキストに対する 文字列照合アルゴリズム
統計解析 第1回 条件付き独立性と確率的グラフィカルモデル 本講義の全体像
データ圧縮技術による文字列照合処理の高速化に関する研究
Presented by なんでも作るつたい(隊)
アルゴリズム論 (第12回) 佐々木研(情報システム構築学講座) 講師 山田敬三
倉本研究室 宇宙理学専攻 修士1年 岡澤直也.
長さの制限付きギャップと 文字クラスを含むパタンに対する 照合アルゴリズムの改善
Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化
学部新入生オリエンテーション 大阪大学における初年次共通教育 「学び方を学ぶ」    ための 1年ないし1年半 全学教育推進機構長 下田 正.
大庭・森戸研究室 ~ Ohba & Morito Lab ~ B4 Kodai Ishikura.
構造的類似性を持つ半構造化文書における頻度分析
ユビキタスコンピューティング環境 を構築するための 小型無線ネットワークコンピュータの開発
LZW 圧縮テキストに対する 高速文字列照合アルゴリズム 喜田 拓也 竹田 正幸 篠原 歩 九州大学大学院システム情報科学研究科
自然言語処理2015 Natural Language Processing 2015
経済学科の紹介 他大学との違いはなにか? 2019/5/26.
平成30年度 ゼミ分け説明会 応用数学科 2018年2月13日(火) 於:理大ホール.
2018年度ビジョン研究室 ゼミナール・卒研紹介 指導教員:張善俊 6月20日(水) 6-209.
Presentation transcript:

情報知識ネットワーク 有村・喜田研究室 {arim,kida}@ist.hokudai.ac.jp ex. 7678, 7679 2005/10/06 情報知識ネットーワーク 研究室紹介(有村・喜田研) 北海道大学工学部 情報エレクトロニクス学科 コンピュータサイエンス・コース 3年ゼミナール紹介 情報知識ネットワーク 有村・喜田研究室 {arim,kida}@ist.hokudai.ac.jp ex. 7678, 7679 研究室ホームページ http://www-ikn.ist.hokudai.ac.jp/

紹介: 情報知識ネットワーク研究室 (有村・喜田 研) 情報知識ネットーワーク 研究室紹介(有村・喜田研) 2005/10/06 紹介: 情報知識ネットワーク研究室 (有村・喜田 研) 研究テーマ: 情報検索とデータマイニング 教官: 有村博紀 教授,喜田拓也 助教授 研究協力者: 宇野毅明,佐藤健(国立情報学研究所), 湊 真一,トーマス・ツォイグマン(北大大学院情報科学研究科) 坂本比呂志,下薗真一(九工大), 北大情報科学CS専攻知識ソフトウェア科学講座メンバーとも研究交流

有村博紀 専門: 興味があること 最近面白かったこと データマイニング 情報検索(とくに全文テキスト索引) 計算学習理論(機械学習) 情報知識ネットーワーク 研究室紹介(有村・喜田研) 2005/10/06 有村博紀 専門: データマイニング 情報検索(とくに全文テキスト索引) 計算学習理論(機械学習) 興味があること 膨大なデータから,人間に役立つ情報と知識を とりだすこと 高速なアルゴリズム(プログラム)を設計すること 最近面白かったこと 企業の人たちと一緒に,ソフトウェア開発をしたこと.

データマイニング・エンジンの開発 ウェブやHTML,テキストデータなどのグラフデータから 特徴的なパターンを高速に取り出す. 情報知識ネットーワーク 研究室紹介(有村・喜田研) 2005/10/06 データマイニング・エンジンの開発 ウェブやHTML,テキストデータなどのグラフデータから 特徴的なパターンを高速に取り出す. 情報検索や日本語テキスト処理,画像データ処理に役立つ. AWAP: Fast Text Mining Engine (1997-2002) FREQT: Fast XML and Tree-like Data Miner (SDM'02) OPTT: Optimized Pattern Disocvery (PKDD'02) StreamT: Online XML Stream Miner (IEEE ICDM'02) UnoT: Unordered Tree Miner (Discovery Science'03) A collection of trees Frequent Patterns with s = 50 % Mining (with 浅井達哉君@現・富士通研,安部賢治君@現・シャープ,宇野毅明先生@NII,中野眞一先生@群馬大,)

AWAP: Fast Text Mining Engine (1997-2002) 情報知識ネットーワーク 研究室紹介(有村・喜田研) 2005/10/06 AWAP: Fast Text Mining Engine (1997-2002) HONDA vs. SOFTBANK HONDA vs. TOYOTA ホンダ って どんな会社だろう? ソフトバンク じゃなくて, ホンダ に出ているもの はなにかな? トヨタ じゃなくて, ホンダ に出ているもの はなにかな?

喜田拓也 専門: 興味があること 最近面白かったこと 情報検索(特に文字列照合) テキスト・アルゴリズム データ圧縮 情報知識ネットーワーク 研究室紹介(有村・喜田研) 2005/10/06 喜田拓也 専門: 情報検索(特に文字列照合) テキスト・アルゴリズム データ圧縮 興味があること 巧妙なアルゴリズムを知るor設計すること 効率よく情報を検索するためにコンピュータが できること 最近面白かったこと 国際会議でイタリアへ行ったこと.

圧縮データに対する文字列照合 復号 文字列照合 アルゴリズム 転送 文字列照合 アルゴリズム 転送 転送 圧縮文字列照合 アルゴリズム 情報知識ネットーワーク 研究室紹介(有村・喜田研) 2005/10/06 圧縮データに対する文字列照合 二次記憶装置上 テキスト データ 主記憶装置上 文字列照合 アルゴリズム 転送 主記憶装置上 二次記憶装置上 圧縮テキスト 文字列照合 アルゴリズム 復号 転送 主記憶装置上 二次記憶装置上 圧縮テキスト 転送 主記憶装置上 圧縮文字列照合 アルゴリズム

実験結果(非圧縮テキスト上のアルゴリズムとの対比) 情報知識ネットーワーク 研究室紹介(有村・喜田研) 2005/10/06 実験結果(非圧縮テキスト上のアルゴリズムとの対比) パタンの長さ 0.0 0.3 0.4 0.5 0.8 0.1 0.2 0.6 0.7 CPU時間(秒) AlphaStation XP1000 (Alpha21264: 667MHz) Tru64 UNIX V4.0F Medline(英文テキスト) 60.3Mbyte 非圧縮テキストをKMPで照合 BPE圧縮テキストに対する Boyer-Moore型のアルゴリズム を用いた照合(Shibataら[2000]) BPE圧縮テキストに対する照合 非圧縮テキストをAgrepで照合 5 10 15 20 25 30 * BPEはByte Pair Encoding圧縮法 * KMPはKnuth-Morris-Pratt法 * AgrepはWu&Manberが開発した検索ツール (with 柴田裕介君@現・NTTコムウェア, 松本徹也君@現・NTTドコモ, 竹田正幸先生@九大,篠原歩先生@九大)

3年生ゼミナール ゼミナール 大学の残りの2年間でしてほしいこと* 英語または日本語の資料を読む わかったことを他のひとに説明する 情報知識ネットーワーク 研究室紹介(有村・喜田研) 2005/10/06 3年生ゼミナール ゼミナール 英語または日本語の資料を読む わかったことを他のひとに説明する 新しい考え/方法を作る プログラムを作る/実験する 日本語または英語で書く 大学の残りの2年間でしてほしいこと* 興味があること/やりたいことをみつける 何でもいいから,集中して基礎的な勉強をしてみる (20代前半に)   これは今回は見送り *)大学院の2年間で身につけてほしいことでもあります.

"Managing Gigabytes" (ギガバイトを征服!) 情報知識ネットーワーク 研究室紹介(有村・喜田研) 2005/10/06 H16年の例 3年生ゼミナール: テキスト 英語の教科書 "Managing Gigabytes" (ギガバイトを征服!) 著者: Ian H. Witten, Alistair Moffat, Timothy C. Bell, Morgan Kaufmann Publishers, 1999. ウェブサーチ・エンジンを作るための 現在唯一の教科書 テキストと画像の圧縮 テキスト索引の実装 問合せの実現 写真略 Ian Witten先生 ワイカト大学, NZ 写真略 Alistair Moffat先生 メルボルン大学, AU ManagingGygabyte site: http://www.cs.mu.oz.au/mg/

3年生ゼミナール: ゼミで直接まなぶこと 情報工学として 情報検索の基礎技術 データ圧縮の技術 ウェブ検索エンジンのしくみ 情報知識ネットーワーク 研究室紹介(有村・喜田研) 2005/10/06 3年生ゼミナール: ゼミで直接まなぶこと 情報検索の基礎技術 データ圧縮の技術 ウェブ検索エンジンのしくみ 情報工学として アルゴリズムとデータ構造の 議論に慣れる 情報理論と統計の実際をしる 工学(engineering)の感覚 読む・話す・聞く・作る

3年生ゼミナール オプション(希望者があれば) プログラム作成 コンテスト??? 複数パターン照合機械 (情報検索) 情報知識ネットーワーク 研究室紹介(有村・喜田研) 2005/10/06 3年生ゼミナール オプション(希望者があれば) プログラム作成 複数パターン照合機械 (情報検索) ハフマンor LZ圧縮プログラム (テキスト圧縮) アイテム集合発見プログラム (データマイニング) コンテスト???

2005/10/06 情報知識ネットーワーク 研究室紹介(有村・喜田研) おまちしています 情報知識ネットワーク 有村・喜田研究室 {arim,kida}@ist.hokudai.ac.jp ex. 7678, 7679 研究室ホームページ http://www-ikn.ist.hokudai.ac.jp/