【全文検索】ApacheSolr入門をやってみる 第4回

第3回でApacheSolrで形態素解析にチャレンジしましたが、全然動かないという事態に陥りました。
で、色々とあの後考えてみたのですがやっぱり一旦全部最初から入れなおすか! という結論に
いたったです。

ていうか、@johtaniさんの日記でもっと新しいヤツがあったZ

※もしApacheSolrのサンプルを動かそうとされている方いらっしゃいましたら
@johtaniさんのブログ見たほうが早いと思われますです。
けど、私のようなエンジニア初心者で、いったいなんていうコマンド打てばいいんだぜ?
状態な方のために参考までにコマンド等メモしておきますです。

前回なんで動かなかったのか、ちゃんとソースを読めない私はお手上げでしたが
単に自分の情報収集力が無かったようですww

結論から申し上げますと、上記ブログで案内いただいているソース類でちゃんと動きました笑

さっそくメモメモ

もっかいApacheSolr入れる

※とりあえず、前のソース類は rm で皆殺しにしから実施しますた。

$ cd /usr/local
$ wget http://ftp.riken.jp/net/apache/lucene/solr/3.6.1/apache-solr-3.6.1.zip
$ unzip apache-solr-3.6.1.zip
$ cd apache-solr-3.6.1/example
$ java -jar start.jar

ブラウザで/solr/adminにアクセス
見れる見れる。

けどここからやで、本番は・・・

schema.xmlを交換する

今回の参考ページで案内されているschema.xmlをDLしてつっこんでみる
ただし、また動かなくなったらヤダなとかおもったりするので最初から付属のschema.xmlもちゃんととっておこうと思う。

その辺のメモ

$ wget https://bitbucket.org/johtani/solrbook-lucene-gosen-3.x/raw/48834b2d0465/introduction/ngram/schema.xml
$ cp solr/conf/schema.xml ~/schema.xml.bak
$ cp -f schema.xml solr/conf/schema.xml

で、N-gramのテストをしようと思って

$ java -jar start.jar

あ、なんか変なの流れてきた・・・

致命的: org.apache.solr.common.SolrException: Error loading class ‘solr.GosenTokenizerFactory’
at org.apache.solr.core.SolrResourceLoader.findClass(SolrResourceLoader.java:394)
at org.apache.solr.core.SolrResourceLoader.newInstance(SolrResourceLoader.java:409)



以下略

マジ、なんやねんこれ・・ 怖い、怖いぜー!
ていういか、、致命的って書いてありますけどw

そっとブラウザでアクセスしてみます。
また500かよ!!

けどエラーを見てみると、GosenTokenizerがどうのこうのって書いてある。
gosenて未だ入れてないよね?入ってないぜ
って怒られているような気がする。え、どういう事ww?

無視してlucene-gosenを入れる

一旦、Ctrl+CでSolrを止めまして・・

$ wget http://lucene-gosen.googlecode.com/files/lucene-gosen-2.0.0-ipadic.jar
$ mkdir example/solr/lib
$ cp lucene-gosen-2.0.0-ipadic.jar example/solr/lib/
$ java -jar start.jar

お、
おおおお。?
さっきのエラー風のヤツが出てこなくなってる。

ブラウザでアクセスしてみるでやんす。

きたww
ktkr wwwww

どうやら500エラーは回避できたようなので、早速形態素解析のテストをしてみます。

上部のanalysisをクリックします
Fieldのプルダウンを text_ja に変更
Field value(Index)の下2つにチェックを入れます
一番大きいテキストBOXに適当に日本語入力

はい、出ました。
うれしいwwww
地味にうれしいwwww

というわけで、なんとか形態素解析が動いてくれたので終了
まだ1章だぜ。。。

次回は第2章に突入してみたいと思います。
けど、別に2章以降ってブログに書くこと何もないんじゃないか説
おわり



関連記事

Comment





Comment



*