2011年9月12日月曜日

第6回Solr勉強会レポ

Solr勉強会にはこれで3回参加しました。
いつもお邪魔しているECナビさん。

フロアの何階か忘れてしまって、本当は8Fなのに
勘で7Fに行ったら違った(^^;

今回は特にCookpadさんのお話が聞きたかったのです。
こちらに資料を公開してくださいました!
http://d.hatena.ne.jp/code46/20110913/p1

各発表については、他の方のブログでも参考にしてください。
半分以上話が難しすぎてついていけず…。

★関口さん

  • Solr3.1-3.3はバグが入ってしまってるので、3.4が公開されたらそちらを使うこと
  • ドキュメントの親子関係の検索ができるようになった。(子が該当すると親を返すような←曖昧…)
  • Carrotでクラスタリングの結果を表示してくれる


★Cookpadさん

  • CookpadはRuby on Rails on AWS上で動作
  • 人気順検索でSolrを利用(Tritonnから移行)
  • Tritonnはパフォーマンスが悪かったり、フィールド追加が大変
  • Solr4 nightly on Oracle JVM上で稼働
  • analyzerを作らない(バッチを書く)
  • optimizeをすると20%程度速くなる
  • インデックスのみを格納し、本文はMySQLから検索することでインデックスサイズを小さくしている
  • 監視については、クエリ(QTime/QPS 1インスタンスでどのくらい捌くか)、キャッシュ(hit/eviction)、インデックス(サイズ/ドキュメント数)、、レプリケーションの所要時間をチェックしている
  • 便利だった機能はDynamicField、Facet、HTTPで検索・更新が可能、分散検索(shadingができる)


★データセクションさん

  • Bobo Solr pluginを使っている
  • メモリ不足になることが多かった
  • Solr1.4系ではレプリケーションに問題があった
  • さまざまなプラグインを利用


★Anuenue(mixiさん)

  • Solrにはクラスタ用のコマンドがなく、インスタンスごとに個別設定しなくてはならない
  • Hadoop上にOluolu(オルオル)とLikelike(リケリケ)
  • 今後はSolr Cloudを作ったり、Gosenを使ってみたい

★Apache Manifold CF

  • 2010年~のクローラー
  • Solrとの親和性があり、セキュリティを考慮した検索ができる
  • 例えば、共有サーバーのクロールでは、営業マンが営業資料を検索
  • MCFクロールをしてSolrに入れる
  • Solr Cellを利用


以上、適当ですみません(汗)


0 件のコメント:

コメントを投稿

注: コメントを投稿できるのは、このブログのメンバーだけです。