いつもお邪魔しているECナビさん。
フロアの何階か忘れてしまって、本当は8Fなのに
勘で7Fに行ったら違った(^^;
今回は特にCookpadさんのお話が聞きたかったのです。
こちらに資料を公開してくださいました!
http://d.hatena.ne.jp/code46/20110913/p1
各発表については、他の方のブログでも参考にしてください。
半分以上話が難しすぎてついていけず…。
★関口さん
- Solr3.1-3.3はバグが入ってしまってるので、3.4が公開されたらそちらを使うこと
- ドキュメントの親子関係の検索ができるようになった。(子が該当すると親を返すような←曖昧…)
- Carrotでクラスタリングの結果を表示してくれる
★Cookpadさん
- CookpadはRuby on Rails on AWS上で動作
- 人気順検索でSolrを利用(Tritonnから移行)
- Tritonnはパフォーマンスが悪かったり、フィールド追加が大変
- Solr4 nightly on Oracle JVM上で稼働
- analyzerを作らない(バッチを書く)
- optimizeをすると20%程度速くなる
- インデックスのみを格納し、本文はMySQLから検索することでインデックスサイズを小さくしている
- 監視については、クエリ(QTime/QPS 1インスタンスでどのくらい捌くか)、キャッシュ(hit/eviction)、インデックス(サイズ/ドキュメント数)、、レプリケーションの所要時間をチェックしている
- 便利だった機能はDynamicField、Facet、HTTPで検索・更新が可能、分散検索(shadingができる)
★データセクションさん
- Bobo Solr pluginを使っている
- メモリ不足になることが多かった
- Solr1.4系ではレプリケーションに問題があった
- さまざまなプラグインを利用
★Anuenue(mixiさん)
- Solrにはクラスタ用のコマンドがなく、インスタンスごとに個別設定しなくてはならない
- Hadoop上にOluolu(オルオル)とLikelike(リケリケ)
- 今後はSolr Cloudを作ったり、Gosenを使ってみたい
★Apache Manifold CF
- 2010年~のクローラー
- Solrとの親和性があり、セキュリティを考慮した検索ができる
- 例えば、共有サーバーのクロールでは、営業マンが営業資料を検索
- MCFクロールをしてSolrに入れる
- Solr Cellを利用
以上、適当ですみません(汗)
0 件のコメント:
コメントを投稿
注: コメントを投稿できるのは、このブログのメンバーだけです。