SlothLib.Web.

Slides:



Advertisements
Similar presentations
© 2007 Autodesk1 ProjectPoint API 概要 AEC ソリューション CPM オートデスク株式会社.
Advertisements

1 情報処理基礎 2006 年 7 月 6 日. 2 本日の学習項目 HTML 文書の基礎知識を習得する。 ホームページ・ビルダーの基本的な使 い方を習得する。 ホームページの作成 自己紹介のためのホームページを作成する。
情報処理 A 第 5 回かな? ワードの使い方. 拡張子  ファイルの名前は, “ ファイル名. 拡張子 ” で付け る.  拡張子は,そのファイルを読み込むソフトに影 響される –txt テキストファイル –doc ワードのファイル –xls エクセルのファイル –pdf Acrobat Reader.
PowerPoint スライドの HTML 化支援ツール dcppt version 1 Yasuhiro Morikawa Copyright © 2005 GFD Dennou Club. All rights reserved. GFD Dennou Club.
Web アプリをユーザー毎に カスタマイズ可能にする AOP フレームワーク
専門ゼミⅠ 南ゼミ 特別授業 2002年5月24日 金曜日 4限目 今泉 裕隆.
応用コース:ワープロを活用する WORD2000 1回目 基礎コースの復習(第1章と付録) 2回目 文字の入力(第2章と第4章)
JPAを利用した RESTful Webサービスの開発
2006年11月15日 植田龍男 Webサービス II (第8回) 年11月15日 植田龍男.
Visual Studio 2005による XML Web サービス入門
第2章 ネットサービスとその仕組み(前編) [近代科学社刊]
Androidアプリを公開する方法.
TMenu メニューバーを用いた操作のための コンポーネント.
REST型Webサービスによる 楽曲検索システムの開発
Servlet J2EE I 第8回 /
ホームページの作り方.
情報爆発A01支援班 マイサーチエンジン開発環境支援グループ 中村聡史, 大島裕明, 田中克己, 喜連川優
コンピュータ演習Ⅰ 8月7日(日) 1限目 ファイルの種類.
第13回 プログラミングⅡ 第13回
JavaServlet&JSP入門 01K0018 中村太一.
第1回 JavaScriptゼミ ・ scriptエレメント ・ 記述における諸注意 ・ 古いブラウザへの対応方法
PowerPoint スライドの HTML化支援ツール epppt version 3
チュートリアル EBSCOhost での記事の閲覧 support.ebsco.com.
平成19年5月19日 第3版 東京大学理学部生物化学図書室 前田 朗
プログラムNo.:論文タイトル 氏名1(所属1),氏名2(所属2),…
HTTPプロトコルとJSP (1) データベース論 第3回.
JavaBeans とJSP データベース論 第5回.
JSFによるWebアプリケーション開発 第6回
HTTPプロトコル J2EE I 第7回 /
エンタープライズアプリケーション II 第7回 / 2006年7月9日
WSDL と JAX-RPC 年10月20日 Webサービス II (第4回) WSDL と JAX-RPC 年10月20日.
ServletによるWebアプリ作成 入門
データ構造と アルゴリズム 第四回 知能情報学部 新田直也.
QuestionnairToolの開発 中村太一.
第8章 Web技術とセキュリティ   岡本 好未.
SVGを用いた地震データ検索・3D表示アプリケーションの開発
HTTPとHTML 技術領域専攻 3回 中川 晃.
11.6 ランダムアクセスファイル 11.7 StreamTokenizerクラス
独習JAVA 6.8 コンストラクタの修飾子 6.9 メソッドの修飾子 6.10 ObjectクラスとClassクラス 11月28日(金)
第3回 2007年4月27日 応用Java (Java/XML).
Javaによる Webアプリケーション入門 第6回
変数のデータフローを考慮した API利用コード例の検索 井上研究室 竹之内 啓太.
Javaによる Webアプリケーション入門 第7回
第7回JavaScriptゼミ セクション4-5 発表者 直江 宗紀.
Javaによる Webアプリケーション入門 第2回
情報スキル活用 第2週 基礎技術ー2 : Webページの基本形.
卒業論文に向けて(2) 学部4年生 島本 大輔 2004年10月29日.
Javaによる Webアプリケーション入門 第11回
コンピュータ プレゼンテーション.
ウェッブページ書法の復習 ネットワーク論以前のお話.
Servlet ソフトウェア特論 第7回.
コンピュータと情報 第4回 ワードの使い方.
Servlet J2EE I (データベース論) 第12回 /
Servlet データベース論 第6回.
JDBC ソフトウェア特論 第3回.
オブジェクト指向言語論 第六回 知能情報学部 新田直也.
プログラミング言語論 第六回 理工学部 情報システム工学科 新田直也.
Webアプリケーションと JSPの基本 ソフトウェア特論 第4回.
Javaによる Webアプリケーション入門 第4回
サブゼミ第7回 実装編① オブジェクト型とキャスト.
WebアプリケーションとTomcat ― これまでの復習とこれからの予習 ―
JSPの基本 データベース論 第2回.
Action Method の実装 J2EE II 第9回 2004年12月2日.
Jakarta Struts (1) ソフトウェア特論 第10回.
第14回放送授業.
TableAdapterとSQLDependency 便利さを使い倒そう。 by えムナウ
JSPの基本 J2EE I (データベース論) 第8回 /
JSFによるWebアプリケーション開発 第7回
計算機プログラミングI 第2回 2002年10月17日(木) 履習登録 複習 ライブラリの利用 (2.6-7) 式・値・代入 (2.6-8)
HTTPプロトコルの詳細 M1 峯 肇史.
Presentation transcript:

SlothLib.Web

2つのライブラリ SlothLib.Web.Search SlothLib.Web.WebLoader Yahoo!・Google・LiveSearch・YouTube・Flickr SlothLib.Web.WebLoader HTTPによるページを取得するためのライブラリ マルチスレッドでの取得も提供

SlothLib.Web.Searchにできること 各種検索エンジンから検索結果を取得する Yahoo! ・LiveSearch・FlickrなどのAPIを用いる タイトル、スニペッド、URL ブログ検索であれば、記入日時を取得できる ビデオ検索であれば、ビデオの長さを取得できる それぞれの検索エンジンの検索結果固有の情報も取得 できる YahooWebSearchであれば、ページのMIMEタイプなど

SlothLib.Webの構造 IBlogSearch GooBlogSearch FlickrSearch IImageSearch ISearch IWebSearch IVideoSearch IImageSearch IBlogSearch LiveWebSearch YahooJpWebSearch GoogleSOAPSearchAPI FlickrSearch YahooJpImageSearch YahooJpVideoSearch YouTubeSearch GooBlogSearch OshieteGoo CachedSearch インターフェース

YahooWeb検索 YahooJpWebSearch YahooJpWebResult YahooJpWebElement 検索を行うためのクラス YahooJpWebResult YahooWeb検索が返す検索結果全体 YahooJpWebElement YahooWeb検索結果のそれぞれの要素(ページ)

YahooJpWebSearch 検索を行うためのクラス コンストラクタ メソッド YahooJpWebSearch (string applicationID) アプリケーションIDを指定:”slothlib” メソッド DoSearch(string query, int maxNumber) 検索を行うためのメソッド 返り値: YahooJpWebSearchResult query: 検索クエリ maxNumber: 返却結果の数

YahooJpWebResult YahooWeb検索が返す検索結果全体 プロパティ YahooJpWebElement[] ResultElements {get} 検索結果要素の配列 string Query {get} 検索に使われたクエリ long TotalNumber 検索総件数

YahooJpWebElement YahooWeb検索結果のそれぞれの要素 プロパティ string Title : ページのタイトル string Summary: ページの要約 string Url :  ページのURL ClickUrl, MimeType …

SlothLib.Web.WebLoader HTTPを利用してウェブページをダウンロードできる 保存先(デフォルト) Tempフォルダ、ファイル名はハッシュコード シングルスレッドとマルチスレッドの二種類 シングルスレッド WebGetクラス URLの内容を取得するクラス WebGetResultクラス 取得したWebページの結果を保存するクラス マルチスレッド MultiWebGetクラス, MultiWebGetResultsクラス

MultiWebGetクラス メソッド マルチスレッドを用いて複数URLの内容を取得するクラス DoFetch・・・実行する 引数 返り値 urlList:string[]型      データを取得するURLのリスト allowContentTypes:string[]型   取得するURLのCotentTypeのリスト excludeContentTypes:string[]型 取得しないURLのCotentTypeのリスト 返り値 MultiWebGetResults

MultiWebGetResultsクラス 複数URLの取得結果を格納するクラス プロパティ WebGetResult[] ResultElements URLの内容取得結果の配列 int Count 取得したURLの個数

WebGetResultクラス 取得したWebページの結果を保存するクラス プロパティ string URL string LocalFilePath 保存したファイルの場所 HttpHeader Header ファイルのヘッダー string Response レスポンス

SlothLib.IO

2つのライブラリ SlothLib.IO SlothLib.Text 保存したファイルを呼び出すためのライブラリ xdoc2txtを利用することによりファイルを読み込む *html, *.rtf, *.doc, *.xls, *.ppt, *.jtd/jtt, *.pdf, *.txt … SlothLib.Text 日本語文字コード判別

SlothLib.IOでできること 様々な形式の文書の内容を読み込む xdoc2txtを内部で利用 MultiReaderクラス Textファイル用:TextReaderクラス HTML用:Xdoc2txtHtmlReaderクラス その他:Xdoc2txtReaderクラス 読み込むことのできる形式(Xdoc2txt :対応ファイル) テキスト・HTML・・・*.txt, *.htm, *.html, *.mht Office・・・*.doc, *.xls, *.ppt (ver5.0~ 2000) 一太郎・・・*.jaw/jtw, *.jbw/juw, ・・・(ver5~ver12) PDF・・・ *.pdf OASYS, 新松, Lotus123, Windows3.1 Write

MultiReaderクラス 様々な形式の文書の内容のみを読み込む コンストラクタ メソッド MultiReader(string xdoc2txtExePath) xdoc2txtExePath: xdoc2txtの実行ファイルのパス メソッド string Read(string filePath) filePath: 取得したいファイルのパス 返り値: ファイルの内容 様々なファイルを読み込むことができる。 拡張子で判断する

TextReaderクラス テキストファイルの内容を取得する 拡張子が何でも読もうとする SlothLib.Textのクラスを用いて文字コードを自動判断 SlothLib.Text.TxtEncConverter オープンソースのTxtEncを利用する文字コード判別用クラス メソッド string Read(string filePath) filePath: 取得したいファイルのパス 返り値: ファイルの内容