株式会社ECナビ システム本部 ECナビラボグループ 春山 征吾

Slides:



Advertisements
Similar presentations
All Rights Reserved, Copyright © 2001 GeoBasic® & IIMS® Networking GIS データ共有型 GIS 2001年2月 ジーイーネット 株式会社.
Advertisements

OSC-kansai 2009 EC-CUBE の設計思想 EC-CUBE の設計思想について 2009/7/11( 土 ) 有限会社 Loop AZ 大河内健太郎.
AZUR moodle. Moodle オープンソースの e ラーニングプラットフォーム 一般的には CMS や LMS と呼ばれる Web サイトを管理・更新できるシステム CMS ⇒コンテンツマネジメントシステム LMS ⇒学習管理システム(ラーニングマネジメントシステム)
Integrated Personal Page C05823 森本万里子 C05829 西山礼恵 C05899 高木華子.
Copyright (C) 2010 Cybozu, Inc. サイボウズ ガルーン 3 マルチレポー ト 活用支援資料 サイボウズ株式会社.
RLG 特別セミナー Z39.50 接続デモ 慶應大学三田メディアセンター 2003.2.25. テスト用検索画面.
11 月 17 日 インターネット検索の基礎 インターネット検索 最近の話題 宿題披露 興味を持っているものを検索してみ よう どんな時にインターネット検索するか 宿題 授業資料
データベースの基礎知識 ACEESS の基本操作. データベースの基礎知識 データベース  特定のテーマや目的に毎のデータの集合体 データベースソフトウェア  データベースを作成、管理するソフトウェアの総 称 Oracle(Oracle) IBM(DB2) Microsoft(SQL Server)
カーリルを利用した 書籍活用 / 蔵書管理システム 研究者: J0639 山中勇太 指導教員:越田高志.
New WorkFriend (AS版・PC版 概要説明) <New WorkFriend とは?> ・ネットワーク環境の上で、データベースを日常業務に活用す る。 ・WindowsのExcelとリンクした、照会・更新・分 析をするツール。 <New WorkFriend の機能> 1.データベースの照会機能.
図書系のための アプリケーション開発講習会 2008年7月31日
プログラミング言語ADP 大藤雄久.
詳細検索の方法- EBSCOhost Guided Style 検索フィールド
WagbyR6.5 Update 14 PPT版 更新情報
Kyoto Tycoonのご紹介 FAL Labs
Webアプリケーション開発の 基本的なポイント
ハルビン絵葉書コレクションシステムの再構築と機能追加 -サーバ側:PHPとMySQLを用いて
JPAを利用した RESTful Webサービスの開発
2006年11月15日 植田龍男 Webサービス II (第8回) 年11月15日 植田龍男.
てやんでい!職人気質 株式会社ブースターテクノロジー
UNIX Life KMSF M2 saburo.
情報学類 吉田光男 アドバイザー教官: 山本幹雄 先生
名古屋大学大学院人間情報学研究科 物質生命情報学専攻 情報処理論講座 原 崇
PHPエディタによる 情報システム演習 01.
REST型Webサービスによる 楽曲検索システムの開発
~手続き指向からオブジェクト指向へ(Ⅰ)~
Log4netを使ったロギング機能 オガシン.
Log4netを使ったロギング機能 オガシン.
「絵葉書を通じてのハルビンの 街の印象調査」システムUIの iPadアプリ化 谷研究室  飯 祐貴.
情報爆発A01支援班 マイサーチエンジン開発環境支援グループ 中村聡史, 大島裕明, 田中克己, 喜連川優
WagbyR6.5 Update 12 PPT版 更新情報
ネットで百科 for Library の使いかた
稚内北星学園大学 情報メディア学部 助教授 安藤 友晴
文献管理ソフトRefWorksの利用.
平成19年5月19日 第3版 東京大学理学部生物化学図書室 前田 朗
Androidソースコード公開後のJNI
平成19年11月16日 図書系職員のためのアプリケーション開発講習会
Full Text Finder Publication Finder の概要
クラシック音楽普及プロジェクト KG:mao B3 wakutin.
セマンティクスを利用した 図書検索システム
JQueryでAjax 藤田@ジャストプレイヤー ※参考しまくり文献 jQuery日本語リファレンス.
Web上で管理・利用できる 面接予約データベースシステムの構築
(B2) 親: minami, kazuki 多様な認証機器に対応する 認証システム (B2) 親: minami, kazuki.
CiNii Articlesトップページ クイックガイド <キーワードによる検索方法>
マイクロソフト Access を使ってみよう 第1回
マイクロソフト Access での SQL 演習 第1回 SQL問い合わせ(クエリ)
基礎プログラミング演習 第1回.
Java ソフトウェア部品検索システム SPARS-J のための リポジトリ自動更新機能の実現
実際にたたいてAPI APIの初歩からプログラムまで使用方法のAtoZ.
1 2 ワークスタイルを変えるOffice変革 クラウド導入をサポートする Microsoft CSPプログラムのご案内
ワイヤレス画像投影システムで会議における上記ポイントを実現しませんか?
2004年度 サマースクール in 稚内 JavaによるWebアプリケーション入門
2003年度 データベース論 安藤 友晴.
ふるみ~る 1DS05178S 山下 大二 1DS05179Y 江藤 隆 1DS05183M 川上 泰生 1DS05200R 橋元 史記
Office IME 2010 を使う.
資料1-6 平成26年度 第1回技術委員会資料 支援ツール群整備方針
理学部 情報科学科 指導教官 千葉 滋 助教授 学籍番号 03_03686 内河 綾
只見町 インターネット・エコミュージアムの「キーワード」検索の改善
クイックガイド <キーワードによる検索方法>
マイクロソフト Access を使ってみよう 第2回
JXTAの概要 P2P特論 (ソフトウェア特論) 第3回 /
★CD-ROMを使った情報検索 瞬時に検索できる! ★電子文字化されたデータを使いレポートを仕上げる 電子文字は加工が容易!
第二回 Javaの開発環境 04A2029           古賀慎也.
地域生活支援システムの開発 越田研究室 j0431 野津洋二.
プログラムの差分記述を 容易に行うための レイヤー機構付きIDEの提案
『検索名人』のご案内 朝日 太郎 2003年3月24日 ビズぱそふと株式会社.
Googleマップを活用した 生物調査データベースの構築
第2回 Webサーバ.
高度プログラミング演習 (11).
就職活動.
Presentation transcript:

株式会社ECナビ システム本部 ECナビラボグループ 春山 征吾 Seigo_Haruyama@ecnavi.co.jp Solrスゲェ! 株式会社ECナビ システム本部 ECナビラボグループ 春山 征吾 Seigo_Haruyama@ecnavi.co.jp

ECナビ・ECナビラボ の紹介 ECナビ (http://ecnavi.jp) ECナビラボ(http://labs.ecnavi.jp/) 検索(search)と情報共有(share)をキーワードを 軸に, 次世代のソフトウェア技術, インターネット サービスについての研究開発を行なっています.

今回提供するAPIの紹介 Buzzurl API http://labs.ecnavi.jp/developer/buzzurl/api/ NavicSearch API http://labs.ecnavi.jp/developer/navicsearch/api/

NavicSearch APIの特徴 ECナビで取り扱っている1500万件以上の商品の 検索ができます. 検索クエリの例: 「wii」で検索 http://api.ecnavi.jp/shopping/navic_search/ select?q=wii 「自転車 折りたたみ」で検索 q=自転車 折りたたみ デモサイト! http://s-tanno.net/

NavicSearch API (α)の注意事項 現在開発中のECナビの商品検索機能のプレ ビュー版です. 商品データは実際のものですが, データの更新 は不定期です. プレビュー版であるためほとんどの場合,ECナ ビで検索した検索結果と異なる結果を返します. 予告してもしくは予告せずにサービスを一時停止 する可能性があります.

NavicSearch API のシステム構成 インターネット ゲートウェイ

Solrとは? 「全文検索エンジンライブラリLuceneをベース に、管理画面やキャッシュ機構を取り入れたア プリケーション」(Wikipediaより) 発音: Solarと同じ. 利用例: Diggやインターネットアーカイブ. Javaで作られています. 2008年5月にLuceneの開発者の一人の関口宏 司さんがSolrの開発者になりました. 今後日本における利用も期待されています. BuzzurlでもSolrを使い始めました!

全文検索システムにも Tritonn (MySQL + Senna) Ludia (PostgreSQL + Senna) Namazu Hyper Estraier ... とありますが なぜ Solr を使うことにしたかというと

それはSolr がスゲェから ここからひたすらSolrをたたえます.

高速 特にチューニングしないSolrと特にチューニング していない Tritonn にデータをつっこんでみた (100万件). Solrが10倍以上速かっ た. 検索の速度については十分なデータは取ってい ませんが, Buzzurlの状況を見るとTritonnの同 等以上のようです.

スケールアウトが容易 同じインデックスを複数のマシンで持ってサービス できる(レプリケーション) 異なるデータセットを持つ(パーティショニングされ た)複数のSolrを一括検索できる 理論上いくらでもスケールアウトできます.

機能拡張が容易 結構きれいに設計されているので, 機能拡張が容 易です. 後で示すように, 実際に機能を追加して使っていま す.

アプリケーション作成も容易 HTTP (GET or POST) で検索式入力 出力フォーマットを指定可能 XML, JSON(P) Ruby, Python, PHP なので様々な言語から簡単に扱えます. 「10分で簡単!RailsとSolrの全文検索デモ構築」 (関口さんの会社 RONDHUIT の資料)

ファセット(Facet)機能 ファセット(Facet)とは カテゴリやキーワード, 価格, 日付といったものを 用いた分類 Solrは簡単にファセットごとの件数を出力してくれま す. NavicSearch APIでもカテゴリごとに商品を検索 することが可能 例: 「デンドロビウム」で検索してカテゴリ名でファ セット

最近のSolrの動き 現在のSolrのリリースバージョンは 1.2 ECナビで利用しているSolrは1.3 nightly (1.3は7 月末リリース予定) 開発が活発でばんばん機能追加されてっていま す. Nightly版でないと日本語などを扱える CJKTokenizerが付いてません. 1.2でのNGramTokenizerはあるのでまったく日 本語が扱えないというわけではありません. Tokenizerとは, 検索のためのインデックスを作 るために文書をTokenに分割するもののことで す.

ECナビ独自のTokenizer (といってもパクリだけど) SolrのCJKTokenizerは(すくなくとも6/18時点ので は) 空のトークンが末尾に入る いわゆる半角カナを無視する(これは仕様) という問題があるので, 独自に作りました. といっても, http://twistbendcoupling.net/501/cjktokenizer で Public Domainで公開されていたものをパクリまし た. その名も ECNaviTokenizer. 半角カナの濁点・半濁点も適当にします.

まとめ Solrスゲェ! みんなも使おう Solr