ライトウエイト・メタデータの応用事例とその可能性

Slides:

Advertisements

Similar presentations

All Rights Reserved, Copyright © 2001 GeoBasic® ＆ IIMS® Networking GIS データ共有型 GIS ２００１年２月ジーイーネット株式会社.

Advertisements

IBMユーザ研究会九州研T3 3．Web2.0を実際に使ってみた. Web2.0を実際に使ってみました研究会をプロジェクトに見立てて “ Google SpreadSheet ” で会議を開く “ SNS ” でコミュニケーションを補助する “ Wiki ” で成果物を共有する.

Community Web プラットフォーム大向一輝（国立情報学研究所）松尾豊（産業技術総合研究所）松村真宏（大阪大学）武田英明（国立情報学研究所） JSAI2005 近未来チャレンジ.

Integrated Personal Page C05823 森本万里子 C05829 西山礼恵 C05899 高木華子.

Copyright © Kazuhito HAMANO 2007 all Rights Reserved. 1 情報基礎（ Week4 ） ≪ WWW で展開される新しい技術≫ 非常勤講師濱野和人 2007/5/8 火曜 1,2,3 限

RSS & Atom API 理工学部情報学科 3 年片山友輝. 発表内容・ RSS とは？・ Atom とは？・ RSS 対応ツール・ RSS の研究室での利用価値・今後の課題・参考文献・資料.

カーリルを利用した書籍活用 / 蔵書管理システム研究者： J0639 山中勇太指導教員：越田高志.

テクノロジードリブンな Web サイト構築とそのパブリシティ向上のポイント Tatsuhiko Miyagawa Livedoor, Co.,Ltd. / Shibuya Perl Mongers

データベースと情報検索情報検索（３）ウェブアプリケーションを使ってみる教員岩村雅一. 日程（情報検索：担当岩村）  12/9 検索エンジンを使ってみる  12/16 メディア検索を使ってみる  12/25 ウェブアプリケーションを使ってみる  1/9 検索エンジンを用いた演習.

ブログ blog ・ブログとは何か？・ブログとは何か？・ブログの始め方・ブログの使い方 Copyright Ⓒ 2005 Chiaki Emi All right reserved Ver １．０.

位置情報履歴を利用したサービス提供機構の構築慶応大学環境情報学部 4 年徳田研究室土田泰徳

情報倫理とメディアリテラシー第 1 章ネットワーク社会と情報化社会. ネットワーク社会携帯電話コンピュータテレビ家電カーナビなどネットワーク新たなコミュニケーションの場.

日本の動画共有サイトの拡大と問題 MG9356　小沢直宏（nao）.

メタデータのビジネスモデル展望　橋本大也.

ＣＧＭ　集合知メディアコミュニケーション論Ⅲ 第９回.

W e b 2.0 メディアコミュニケーション論Ⅲ 第４回.

検索エンジン最適化.

初めてのパソコン目次へパソコンでできること

JPAを利用した RESTful Webサービスの開発

[グループ名]向けウェブナー [所属機関名] [日付] [発表者の氏名] [発表者の敬称／肩書]

第２章ネットサービスとその仕組み（前編）［近代科学社刊］

情報処理基礎 2006年 6月 1日.

コミュニティ・ツールを支える技術と標準化動向・課題

WordPressの基礎.

ネットショップデザイン入門Ⅰ・Ⅱ　 WEB広告による収益.

クチコミPress 掲載ガイド：2009年1月-3月ご提案書.

Web2.0とは？テクノロジー、コミュニティ、ビジネス

テレビ２．０　未来予想図橋本大也＠メタキャスト.

媒体概要 iPhoneやiPad関連で国内最大級の出版社“マイナビ”運営の専門情報サイト

LCGTの文書管理のための新しいシステム

Linked e-Stat インディゴ株式会社 STAT DASH グランプリ 2016 行政サービス開拓部門 2016/3/5

インターネットを利用して安全で楽しい山登りをしよう！２０１３年１２月１４日永井敬三

NIIメタデータデータベースの構想国立情報学研究所　開発・事業部コンテンツ課　米澤誠

リサーチ＆プランニング第4回情報処理の自動化、エージェント化

『もんたメソッド実用化』－PowerPointで「もんた」－ umakoya.com 株式会社法研.

Mobage（モバゲー）とは何か？～ゲームサイト？orSNS？～

セマンティックWebの現在 ISWC2005参加報告

書誌情報を提供するサービスへ「だれでも」書誌情報をダウンロードして再活用できる

標準空間情報の整備及び異種データベース間のデータ交換手法に関する研究開発

BML (Broadcast Markup Language)

WebGIS自動生成システムの現状と今後の可能性

サーバ構成と運用ここから私林がサーバ構成と運用について話します.

ま　と　めメディアコミュニケーション論Ⅲ 第１５回.

Net de sample 茉莉花茶.

１DS04169K 太田睦美１DS04185K 高田将平１DS04206E 森根光春

“W e b 2.0”，次どこへ？　－バズワードメディアコミュニケーション論Ⅲ 第３回.

Googleツールを用いた新しいWebシステムの開発

「串刺し」研究アプローチの例 e-learning e-space 動画配信システム SOI Smart Web ストリーミング技術

東京大学空間情報科学研究センターを中心とした空間情報データベースの整備

空間情報サーバ（株）パスコ.

2004年度サマースクール in 稚内 JavaによるWebアプリケーション入門

Webデザイン入門　 WEB広告による収益.

JST／中国総合研究センターの活動紹介～日中の科学技術分野における相互理解促進のための基盤～

１１．Webサイトとデータベース， Webサイト＋ブログシステムの開設手順例

近畿大学工学部情報学科情報システムコース切戸健勝

只見町インターネット・エコミュージアムの「キーワード」検索の改善

すぐできるBOOK －基本設定編－.

パスファインダーの作成 ※ をダウンロードして読んで下さい。

オープンソース開発支援のためのソースコード及びメールの履歴対応表示システム

パスファインダーの作成 ※ sakura. ne. jp/CJE121023

個人情報の流出の危険性とその対策について

早稲田大学大学院基幹理工学研究科情報理工学専攻後藤研究室修士１年魏元

情報共有による Z39.50データベース選択支援環境

資料2-2 平成26年度第2回技術委員会資料次年度検討テーマ案

エコマップ班総合政策学部2年飯塚直 2005年2月8日厳網林研究会

修士研究計画 CGM作成・共有支援基盤（仮）の構築

情報検索（４）検索エンジンを用いた演習教員岩村雅一

情報処理Ⅱ ２００７年１２月３日（月）その１.

地理情報コンテンツ・データベースコンテンツ新規作成

Presentation transcript:

ライトウエイト・メタデータの応用事例とその可能性データセクション（株）橋本大也 2005/7/19＠人工知能学会　セマンティックウェブとオントロジー研究会

内容ライトウエイト・メタデータの応用例として、いくつかのWebサイトおよびサービスを取り上げ現状のWeb技術について概説する。また，これらの展望や可能性について議論する。　

Ⅰ メタデータ応用事例以下の定番を除外していますブログ検索ブログリーダー一般的なソーシャルネットワーク、ブックマーク Ⅰ　メタデータ応用事例以下の定番を除外していますブログ検索テクノラティ、未来検索Livedoor、はてななど一般的なブログ検索ブログリーダー Bloglines、Glucose など一般的なRSSリーダー一般的なソーシャルネットワーク、ブックマーク今日の参加者にとってCurrentでEmergingだと思われる事例を10件

事例１アグリゲーター Moreover.com http://www.moreover.com １万件のRSS情報を集約１２５カ国、２６言語１５分間隔で更新、３８０のカテゴリに分類人間の目で選んだRSS １日14万件の最新ニュース (1)Current Awareness、(2)Weblogs、(3)Broadcastの３分類カスタマイズビジネス展開顧客にマイクロソフト他参考：検索のテクノラティ http://technorati.com/

事例２プロクシーサーバ RSSCache.com RSSのURLからキャッシュ機能のURLを生成する（例） http://my.rsscache.com/www.cacert.org/rss.php 登録RSSのアクセス統計データを表示できる RSSの人気ランキング情報やRSS広告の提供

事例３ RSS+P2P Videora Videora P2Pファイル共有のBittorrent上のファイル情報をRSSとして取得 http://www.videora.com/ P2Pファイル共有のBittorrent上のファイル情報をRSSとして取得キーワードにマッチするビデオファイルを自動ダウンロードする RSS＋Share

事例４雑誌の記事をRSS配信 FindArticles.com http://www.findarticles.com/ 数千の雑誌記事の記事情報（本文含む）を１９８４年まで遡ってデータベース化収録数１０００万記事以上 RSSとして最新情報と検索結果を提供検索結果から有料記事を購読することができる・参考：米国雑誌の３分の１がRSS公開 http://publications.mediapost.com/index.cfm?fuseaction=Articles.san&s=31662&Nid=14155&p=276816

事例５画像のメタデータ Flickr!と派生サービス Welcome to Flickr! http://www.flickr.com/ 写真にキーワード（タグ）をつけてアップロードし、ユーザ間で共有するサービス API応用 Mappr http://mappr.com/ Flickr Related Tag Browser http://www.airtightinteractive.com/projects/related_tag_browser/ flickr graph - marcos weskamp http://www.marumushi.com/apps/flickrgraph/ Flickr/TiVo http://home.comcast.net/~major_clanger/TiVo/

事例６メタデータ自動生成ニュース Topix.net http://www.topix.net/ ニュースサイトのメタデータを自動分類、重要度判断しトピック別の新聞を自動作成１万のソースサイト、３０万のトピック（３万の都市、5500の企業、4.8万人の著名人、１５００のスポーツを含む）参考：GoogleNews http://news.google.co.jp/nwshp?hl=ja&ned=jp

事例７リアルで書籍メタデータ BookCrossing http://www.bookcrossing.com/ Webでプレートを印刷書籍にプレートを貼り付けIDを書いて街に“放流”する本を拾った人はWebで感想を書いて再放流街が図書館となり書籍の歴代保有者が感想データを蓄積、ユーザ同士で交流世界で37万人、220万冊が無料で流通している実績参考　PlateMatch http://www.platematch.com/

事例８テレビのメタデータテレビブログ、TV-Anytime http://www.tvblog.jp テレビ番組情報に対してトラックバックを受け付けるブログASPサービスブログのコメントRSS 動画メタデータも視野に開発 TV-Anytime http://www.tv-anytime.org/ テレビ番組情報の国際標準規格。英国BBCなどが採用している。 http://backstage.bbc.co.uk/feeds/tvradio/

事例９目標と達成のオントロジー 43Things http://www.43things.com/ 達成したい目標（本を書く、10キロ痩せる、etc)を登録する同じ目標を持つユーザのブログを一覧、検索できるソーシャルブックマーク、共有キーワード、ランキング表示機能などを提供する

事例10 ソーシャルネットワーク検索 StumbleUpon http://www.stumbleupon.com/ ツールバーで表示中のWebをユーザ評価する専用ブログと連動 25万ユーザ 200万サイトに対して1億超の評価情報５００のトピックで分類登録サイトの検索や人気ランキング参考：Eurekster http://eurekster.com/

事例11 音楽情報の自動分類 Moodlogic.com,MusicBrainz! http://www.moodlogic.com/ 楽曲についての感性データを手作業で作成しデータベース化。ＭＰ３再生管理アプリケーションを配布。サーバからメタデータを配信。ユーザＰＣのＭＰ３ファイルを感性データで検索することを可能にする。ロマンチックな８０年代の曲、ハッピー、アグレッシブ、アップビートなど感性語、ブルースやカントリー、クラシックロックなどジャンル語、演奏テンポなどで検索することが可能。 MusicBrainz! http://musicbrainz.org/ 参考：MusicID、CDDB http://www.cddb.com/

事例12 地域情報とSNS、Blog InsiderPages,GeoURL、はてなマップ http://www.insiderpages.com/ The Yellow Pages written by friendsがコンセプト。ソーシャルネットワーク上で自分の良く知っている店舗などの地域情報を登録する。友人関係上で信頼できる地域情報のみを交換する仕組み。 GeoURL (2.0) http://geourl.org/ RSSに緯度経度を記述することで地図上にマップはてなマップ http://map.hatena.ne.jp/ 地図へトラックバック

Ⅱ 事例の概説個別に便利だが、セマンティックWeb的でないサービスが多い草の根インデクサーとして機能している Ⅱ　事例の概説個別に便利だが、セマンティックWeb的でないサービスが多い草の根インデクサーとして機能している “マッピング”が有意味に行われていない Webの情報全体を統合、高次化するような方向性が見えてこない今日のテーマは「ライトウェイト」？そもそも…

なぜ今、メタデータが必要なのか？インターネット上のファイルの量が爆発的に増大して必要な情報を見つけることが難しくなった。字面だけでなく意味で整理することで信頼（Trust)できる情報を探し出せるようにしよう（次世代のWeb、セマンティックWeb）。情報のエントロピー（乱雑度）を下げる技術群が必要だ（実現ピラミッド）。メタデータがその基盤になる

メタデータで整理するとは何億枚の文書が乱雑に置かれている状況 → どこに何があるのか分からないメタデータというカードを作成する →　どこに何があるのか分からないメタデータというカードを作成する →著者、見出し、要約、作成日、棚番号などをカード化カードで索引が整理され文書が一覧、検索可能になった状況 →すぐに欲しい情報が見つかる

整理されるとどうなる？情報流通の効率化メタデータ（カード）なら流通できる情報の発信者と読み手が出会うモノの売り手と買い手が出会う情報流通全体の見通しがよくなるコミュニティの活性化マーケティングの最適化情報技術の高次化メタデータ・インパクト

流行したが効率化と高次化が進まないメタデータ RSSがメタデータとしてではなく、配信メディアとして流行した結果、データ化して使われていることが原因（例：RSS広告）　“ベタ”データ問題メタデータのメタ性を再考する必要ありオントロジーマッピングによる高次化に必要なTrustが不足しているためセマンティックWebとして高次化できない現状（例：ブログのカテゴリ、スパム）生成方法として大きく２種類のメタデータが流通している

Ⅲ　展望と可能性

集計系と編集系のメタデータ集計系編集系機械が自動的に付与計算可能なデータ人間が手作業で付与計算不可能なデータ新着更新情報人気ランキング検索結果経済指標などの数値公的大本営発表計算可能なデータ編集系人間が手作業で付与重要度、緊急度などニュースバリュー高度なカテゴリ分類論評、意見、批評計算不可能なデータ技術でできる範囲が拡大しているセマンティックWeb、人工知能、言語処理

メタデータは”ネタ”データへ骨格となるストリクトなメタデータに、コミュニティがラフなデータを付加してリッチにするモデル（Community　Generated Metadata） Ex. Wikipedia,ODP StrictSemantics⇔RoughSemantics（大向） RoughSemanticsの集まるネタノードとしてのStrictSemanticsが求められている Trustに対してStrictな集計系、Roughな編集系

電車男というRoughメタデータ「電車男」、「今週妻が浮気します」…ネタが尽きないCGMのトレンドネタデータ＝コミュニケーション揮発性の高いメタデータネタデータをベースにコメントやトラックバックで情報（アノテーション）を集めることは容易に Invisible&Deepなネタデータに大きな可能性信頼性は？

参考：メタデータの抱える問題点 Metacrap 2.1 People lie 人は愚かである http://www.well.com/~doctorow/metacrap.htm 2.1 People lie 人は愚かである 2.2 People are lazy 人は怠け者である 2.3 People are stupid　人はお馬鹿である 2.4 Mission: Impossible -- know thyself　そもそも不可能である 2.5 Schemas aren‘t neutral　非中立的である 2.6 Metrics influence results　 2.7 There‘s more than one way to describe something 同じことをいくつもの方法で表現できる

参考：信頼性とPI理論 Prominence-Interpretation Theory: ユーザはどうやってオンラインで信頼性を評価するのか　（Stanford Persuasive Technology Lab） http://credibility.stanford.edu/pdf/PITheory.pdf １ユーザは目立つものを見つける（際立っているという評価度）→　集計系メタデータ２　ユーザはそれを解釈する（解釈による評価度）　　　　　　　→　編集系メタデータ

今後の課題セマンティックWebのTrustの価値をどこから発生させるか信頼できる機関のStrictなメタデータを増やす Roughなメタデータを処理して信頼性を高める次のステップ“マッピング”に耐えうる信頼度の高いメタデータを統合するサービスが次世代 Webサービスというアクションとの統合で「セマンティックWebエージェント」の時代へ

ありがとうございました「メタデータ、ベタデータ、ネタデータ」 Strict＆Rough Semantics Trust 本日のファイルを下記にアップロードします情報考学 Passion For The Future http://www.ringolab.com/note/daiya/ またはGoogleで「橋本大也」