2007年02月13日

全文検索namazuをインストール


[ Movable Type っぽいの ]

試しに、全文検索namazuをインストールしてみました。さくらのレンタルサーバ・スタンダードです。
「/home/USER」 は仮定の設定です。適宜書き換えてください。一行が長くて改行してあるように見えるところもありますが「%」以下は基本一行です。注意!
※実は試した後すぐに別の全文検索システムに乗り換えましたので。。ちょっとした覚え書き程度です。。御了承を。

【gettextとnkfがインストールされていることを確認】

%which nkf

%which gettext

見つかりません!じゃなく、パスが出ればOK

【KAKASIをインストール】

%tar xvfz kakasi-2.3.4.tar.gz
%cd kakasi-2.3.4
%./configure --prefix=/home/USER/local
%make
%make install

【KAKASIへパスを「.login」に追加】

set path = (/bin /usr/sbin /usr/bin /usr/local/bin /home/USER/local/bin)

【KAKASIのパスを確認】

%which kakasi

これで、通したパスがちゃんと出ればOK

【File::MMagicのインストール】 File::MMagicはnamazuのtarballに含まれています。

%cd ../
%tar zxvf namazu-2.0.16.tar.gz
%cd namazu-2.0.16
%cd File-MMagic
%perl Makefile.PL LIB=/home/USER/local/lib NSTALLMAN3DIR=/home/USER/local/man
%make
%make install

【namazuのインストール】

%cd ../
%./configure --disable-shared --prefix=/home/USER/local/namazu --with-pmdir=/home/USER/local/lib --with-libintl-prefix=/usr/local
%make
%make install

【namazuの確認】

~/local/namazu/bin/mknmz -C

namazuのバージョン等情報が出ればOK。これで一応namazuのインストールは終了。
次は、本体のコピー、namazuの設定とインデックスの作成。

【namazuを使用する適当な場所へコピー】

%cd ../
%cd /home/USER/www/
%cp /home/USER/local/namazu/libexec/namazu.cgi .

【/home/USER/local/namazu/etc/namazu/にあるmknmzrc-sampleとnamazurc-sampleを使ってmknmzrcとnamazurcを作成】
<すみません。。ココ省略>
そうそう、サブドメインも上手く設定すれば、ちゃんと認識。サブドメインを含む複数のドメインから検索したように出来ます。インデックスを分けることも出来るのかも。。やってないけど。

【インデックス作成】

%/home/USER/local/namazu/bin/mknmz --html-split --all --output-dir=/home/USER/local/namazu/var/namazu/index/ /home/USER/www/

インデックスの保存場所「/home/USER/local/namazu/var/namazu/index/」にインデックスを作成する

あとは、コピーしておいた namazu.cgi にアクセスしてページが表示されるとOK

。。自分の場合、UTF-8の文字化け(コレはすぐに対策できました)。。10進コードで書かれた「年 月 日」→「年 月 日」がコード文字と認識されず、そのまま文字列認識し(&を&と勝手に認識)変になってました。。わかち失敗??

namazuインストール参考
Namazu正規版インストール覚え書き
さくらのレンタルサーバに全文検索システム(Namazu 2.0.14)をインストール
さくらのレンタルサーバにNamazuをインストール

namazu 文字化け対策 for Movable Type参考
namazuのUTF-8文字化け対策(Movable Type)

コード文字が気になりますが、とりあえず検索パフォーマンスは言うこと無しです。サクサク検索できます。。が、いくつか問題はありました。

・ブログの主に本文を検索対象にしたい
・インデックス作成に少し時間がかかる
・。。やっぱコード文字の問題

投稿者 こてつ : 2007年02月13日 21:12 | トラックバック
ブックマーク :

はてなブックマークに登録 livedoorクリップに登録 Buzzurlに登録 Yahoo!ブックマークに登録 users

最近の検索テーマ - 旬?!ワード
バリカー  交換  ドアノブ  outlook  追伸  ボラード  喉の腫れ  改造  構文チェック  RAZO  outlook2003  ヌレンザ  移行  悪性リンパ腫とは  コカコーラシート  ケンドル  html  firefox  ラバーポール  かっけ  java  データ移行  ドアノブ交換  イチロー 治験 コブラ  悪性リンパ腫 
[PR] 
[PR] 
トラックバック
このエントリーのトラックバックURL:
(このブログへの記事紹介・リンクがない場合トラックバックできません。)
http://good-match.net/mt/mt-5t5b5.cgi/1082

このリストは、次のエントリーを参照しています: 全文検索namazuをインストール:

» 全文検索namazuを試す from Soliloquy of Webmas
Movable Type の mt-search.cgi 検索があまりに遅くて。... [続きを読む]

トラックバック時刻: 2007年02月13日 22:42

» 全文検索Hyper Estraierにしてみた from Soliloquy of Webmas
検索に時間がかかるmt-search.cgi の代替検索システムを色々模索してお... [続きを読む]

トラックバック時刻: 2007年02月15日 00:09


コメントしてください




保存しますか?