Keep up with Tech!: 第6回Solr勉強会レポ

Solr勉強会にはこれで3回参加しました。
いつもお邪魔しているECナビさん。

フロアの何階か忘れてしまって、本当は８Fなのに
勘で７Fに行ったら違った（＾＾；

今回は特にCookpadさんのお話が聞きたかったのです。
こちらに資料を公開してくださいました！
http://d.hatena.ne.jp/code46/20110913/p1

各発表については、他の方のブログでも参考にしてください。
半分以上話が難しすぎてついていけず…。

★関口さん

Solr3.1-3.3はバグが入ってしまってるので、3.4が公開されたらそちらを使うこと
ドキュメントの親子関係の検索ができるようになった。(子が該当すると親を返すような←曖昧…)
Carrotでクラスタリングの結果を表示してくれる

★Cookpadさん

CookpadはRuby on Rails on AWS上で動作
人気順検索でSolrを利用（Tritonnから移行)
Tritonnはパフォーマンスが悪かったり、フィールド追加が大変
Solr4 nightly on Oracle JVM上で稼働
analyzerを作らない(バッチを書く)
optimizeをすると20%程度速くなる
インデックスのみを格納し、本文はMySQLから検索することでインデックスサイズを小さくしている
監視については、クエリ(QTime/QPS 1インスタンスでどのくらい捌くか)、キャッシュ(hit/eviction)、インデックス(サイズ/ドキュメント数)、、レプリケーションの所要時間をチェックしている
便利だった機能はDynamicField、Facet、HTTPで検索・更新が可能、分散検索(shadingができる)

★データセクションさん

Bobo Solr pluginを使っている
メモリ不足になることが多かった
Solr1.4系ではレプリケーションに問題があった
さまざまなプラグインを利用

★Anuenue（mixiさん)

Solrにはクラスタ用のコマンドがなく、インスタンスごとに個別設定しなくてはならない
Hadoop上にOluolu(オルオル)とLikelike(リケリケ)
今後はSolr Cloudを作ったり、Gosenを使ってみたい

★Apache Manifold CF

2010年～のクローラー
Solrとの親和性があり、セキュリティを考慮した検索ができる
例えば、共有サーバーのクロールでは、営業マンが営業資料を検索
MCFクロールをしてSolrに入れる
Solr Cellを利用

以上、適当ですみません（汗)

Keep up with Tech!

2011年9月12日月曜日

第6回Solr勉強会レポ

0 件のコメント:

コメントを投稿

ラベル

アーカイブ