2008/09/15追記:
色々あってタイトル変えました。以上。
暇だったので、Movable Typeで使用されているmt-search.cgiを捨ててHyper Estraierを検索システムとして導入してみました。
インデックス方式として、N.M-gram法と、形態素解析が用意されていたので、MeCabっていう形態素解析エンジンを利用しました。
ちなみにサーバーは共用サーバーで、CORESERVERです。
インストール方法は、マニュアルを見れば大体分かるんじゃないかなと思うけれど、./configureの時になんか指定しなければいけないのでそれもメモ。
手順は以下の通りに進めていきます。
2008/08/06追記:
CORESERVERにzlibは既に最新バージョンがインストールされていたので 2. の作業は行わなくてもokです。
ちなみに、libiconvもインストールされていましたが、バージョンが古くて使えないので最新のものをインストールしてください。
- libiconvのインストール
- zlibのインストール
- QDBMのインストール
- MeCabのインストール(N.M-gram法を使うのであれば不要)
- Hyper Estraierのインストール
- 文章ドラフトの作成
- インデックスの作成
- 検索用CGIの設置
- その後の管理について
やたら長いので、今回は1~5までにします。
下準備
とりあえず、sshが使える環境じゃないと駄目です。
主なsshクライントとしては「Tera Term Pro with TTSSH」とか、「Poderosa」でしょうか。
まあ、それは当たり前として。
で、インストールしたディレクトリが分かるようにパスを設定ファイルをつくります。
設定ファイルはホームディレクトリに「.bashrc」という名前を付けて以下のような内容で配置してください。
PATH=$PATH:$HOME/bin
下準備はこれまでです。
1.libiconvのインストール
まず、sshでログインします。
下準備で作成した「.bashrc」の内容を読み込みます。
そして、作業用ディレクトリとしてtmpフォルダを作成します。
~> source .bashrc
~> mkdir ~/tmp
~> cd ~/tmp
次に、libiconvのアーカイブをダウンロードしてから解凍します。
~/tmp> wget http://ftp.gnu.org/pub/gnu/libiconv/libiconv-1.12.tar.gz
~/tmp> tar xzvf libiconv-1.12.tar.gz
~/tmp> rm libiconv-1.12.tar.gz
~/tmp> cd libiconv-1.12
このままインストールしようとすると、エラーが出ちゃうのでprefixオプションで自分のところにインストールするように修正してからインストールします。
途中でKilledとか、Errorだとか出てきても、次に進まずに同じような事をします。
~/tmp/libiconv-1.12> ./configure --prefix=$HOME
~/tmp/libiconv-1.12> make
~/tmp/libiconv-1.12> make install
そして、シンボリックリンクを作成します。(この辺不明)
~/tmp/libiconv-1.12> cd /virtual/【アカウント名】/lib
~/lib> ln -s libiconv.so.4 libiconv
~/lib> cd ..
成功したら、libiconvのインストールはおしまい。
2.zlibのインストール
次はzlib。とりあえず、tmpフォルダに戻ります。
~> cd tmp
zlibのアーカイブをダウンロードしてから解凍します。
~/tmp> wget http://www.zlib.net/zlib-1.2.3.tar.gz
~/tmp> tar xzvf zlib-1.2.3.tar.gz
~/tmp> rm zlib-1.2.3.tar.gz
~/tmp> cd zlib-1.2.3
同じくprefixオプションで修正してからインストール。
途中でKilledとか、Errorだとか・・・以下略。
~/tmp/zlib-1.2.3> ./configure --prefix=$HOME
~/tmp/zlib-1.2.3> make
~/tmp/zlib-1.2.3> make install
成功したら、zlibのインストールはおしまい。
3.QDBMのインストール
またtmpフォルダへ戻ってからQDBMをダウンロードして解凍。
~/tmp/zlib-1.2.3> cd ..
~/tmp> wget http://qdbm.sourceforge.net/qdbm-1.8.77.tar.gz
~/tmp> tar xzvf qdbm-1.8.77.tar.gz
~/tmp> rm qdbm-1.8.77.tar.gz
~/tmp> cd qdbm-1.8.77
同じくprefixオプションで修正・・・以下略
途中でKilledとか・・・以下略。
他のとは違って、configureの時に--enable-zlibでzlibを有効化した方が良い。
~/tmp/qdbm-1.8.77> ./configure --prefix=$HOME --enable-zlib
~/tmp/qdbm-1.8.77> make
~/tmp/qdbm-1.8.77> make check
~/tmp/qdbm-1.8.77> make install
~/tmp/qdbm-1.8.77> cd ..
成功したら、QDBMのインストールはおしまい。
4.MeCabのインストール(N.M-gram法を使うのであれば不要。)
tmpフォルダへ戻ってからMeCabと辞書をダウンロードして解凍。
形態素解析エンジンは辞書が無いと動かない。
~/tmp> wget http://downloads.sourceforge.net/mecab/mecab-0.97.tar.gz
~/tmp> tar xzvf mecab-0.97.tar.gz
~/tmp> rm mecab-0.97.tar.gz
~/tmp> wget http://downloads.sourceforge.net/mecab/mecab-ipadic-2.7.0-20070801.tar.gz
~/tmp> tar xzvf mecab-ipadic-2.7.0-20070801.tar.gz
~/tmp> rm mecab-ipadic-2.7.0-20070801.tar.gz
とりあえず本体からインストール。
同じくprefixオプションで修正・・・以下略
途中でKilledとか・・・以下略。
~/tmp> cd mecab-0.97
~/tmp/mecab-0.97> ./configure --prefix=$HOME
~/tmp/mecab-0.97> make
~/tmp/mecab-0.97> make check
~/tmp/mecab-0.97> make install
~/tmp/mecab-0.97> cd ..
次は辞書のインストール。
同じくprefixオプションで修正・・・以下略
途中でKilledとか・・・以下略。
文字コードはUTF-8にしているので--with-charset=utf8を追記。
2008/07/14追記:
↑違うじゃん。すんません。マニュアルにきちんとEUC-JPだよって書いてありました。
~/tmp> cd mecab-ipadic-2.7.0-20070801
~/tmp/mecab-ipadic-2.7.0-20070801> ./configure --prefix=$HOME
~/tmp/mecab-ipadic-2.7.0-20070801> make
~/tmp/mecab-ipadic-2.7.0-20070801> make install
~/tmp/mecab-ipadic-2.7.0-20070801> cd ..
成功したら、MeCabのインストールはおしまい。
5.Hyper Estraierのインストール
ようやくメインのHyper Estraierのインストールです。
Hyper Estraierをダウンロードして解凍。
~/tmp> wget http://hyperestraier.sourceforge.net/hyperestraier-1.4.13.tar.gz
~/tmp> tar xzvf hyperestraier-1.4.13.tar.gz
~/tmp> rm hyperestraier-1.4.13.tar.gz
~/tmp> cd hyperestraier-1.4.13
同じくprefixオプションで修正・・・以下略
途中でKilledとか・・・以下略。
MeCabを使う場合は--enable-mecabを付加します。
~/tmp/hyperestraier-1.4.13> ./configure --prefix=$HOME --enable-mecab
~/tmp/hyperestraier-1.4.13> make
~/tmp/hyperestraier-1.4.13> make check
~/tmp/hyperestraier-1.4.13> make install
~/tmp/hyperestraier-1.4.13> cd ..
成功したら、Hyper Estraierのインストールはおしまい。
続きは次回で。
0 コメント:
コメントを投稿
注: コメントを投稿できるのは、このブログのメンバーだけです。