SSブログ

LINUX勉強 ~その11~ centosとLAMP環境 [CENTOS de LAMP]

○senna のインストール2

 まぁ当然似たような境遇の方が多いわけで、sennaってやつにたどりつきました。
 インストールしてみます。

  1:MeCabのインストール
   http://sourceforge.net/projects/mecab/files/ 0.98本体 2.7.0辞書
  2:sennaのインストール
   http://sourceforge.jp/projects/senna/releases/ 1.1.4
  3:Tritonnのインストール
   
 の順で行います。

 1:MeCabのインストール
  なにかはよくわからん。必須との事なのでいれる。
  参考は こちら

  1.1:ダウンロードと解凍
   相変わらずダウンロードしておいて /tmp/に置きます。
   mecab-0.98.tar.gz
   mecab-ipadic-2.7.0-20070801.tar.gz
   両方とも tar xvzf で解凍しておきます。

  1.2:configure と make と make install
   cd mecab-0.98
   ./configure --prefix=/usr/local/ --with-charset=utf8
   make
   make install

   cd ../mecab-ipadic-2.7.0-20070801
   ./configure --prefix=/usr/local/ --with-charset=utf8
   make
   make install

  1.3:おまじない?
   いらないかも
   /usr/local/libexec/mecab/mecab-dict-index -c utf8

  1.4:辞書確認
   適当なパスで mecab
   空のプロンプトになるから、日本語をうつ。

   # mecab
   空のプロンプトになるから、日本語をうつ。
   空 名詞,一般,*,*,*,*,空,ソラ,ソラ
   の 助詞,連体化,*,*,*,*,の,ノ,ノ
   プロンプト 名詞,一般,*,*,*,*,*
   に 助詞,格助詞,一般,*,*,*,に,ニ,ニ
   なる 動詞,自立,*,*,五段・ラ行,基本形,なる,ナル,ナル
   から 助詞,接続助詞,*,*,*,*,から,カラ,カラ
   、 記号,読点,*,*,*,*,、,、,、
   日本語 名詞,一般,*,*,*,*,日本語,ニホンゴ,ニホンゴ
   を 助詞,格助詞,一般,*,*,*,を,ヲ,ヲ
   うつ 動詞,自立,*,*,五段・タ行,基本形,うつ,ウツ,ウツ
   。 記号,句点,*,*,*,*,。,。,。
   EOS

   正常完了。Ctrl+Cで終了

 2:sennaのインストール
  1.1:ダウンロードと解凍
   相変わらずダウンロードしておいて /tmp/に置きます。
   senna-1.1.4.tar.gz
   tar xvzf で解凍しておきます。

  1.2:configure と make と make install
   cd senna-1.1.4
   ./configure --prefix=/usr/local/
   make
   make install

 3:Tritonnのインストール
  3.1:ダウンロードと解凍
   cd /tmp/
   たまにはwgetで落してみる
   wget http://osdn.dl.sourceforge.jp/tritonn/36449/tritonn-1.0.12-mysql-5.0.67.tar.gz
   tar xvzf tritonn-1.0.12-mysql-5.0.67.tar.gz

  3.2:configure と make と make install
   cd tritonn-1.0.12-mysql-5.0.67
   ./configure
    --prefix=/usr/local/mysqltri
    --libexecdir=/usr/local/mysqtri/bin
    --localstatedir=/home/mysqltri/data
    --enable-thread-safe-client
    --enable-assembler
    --enable-local-infile
    --with-charset=utf8
    --with-collation=utf8_general_ci
    --with-extra-charsets=all
    --with-pic --with-pthread
    --with-mysqld-user=mysql
    --with-innodb
    --with-mecab=/usr/local
    --with-senna=/usr/local

   ※ mecab と senna は、/usr/localではなく /usr/にいれるべきだったらしい。。。。

   make
   make install

  ※参照 http://xavier-logs.blog.so-net.ne.jp/2009-11-09-2

  3.3:設定
   cd /usr/local/
   chown -R mysql:mysql mysqltri
   cd mysqltri
   mkdir var
   chown -R mysql:mysql var

  3.4:my.cnf修正
   vi /etc/my.cnf

   innodb_data_home_dir = /usr/local/mysqltri/var/
   innodb_log_group_home_dir = /usr/local/mysqltri/var/

  3.5:mysql起動ファイル
   vi /etc/init.d/mysql
   mysql をmysqltriに修正

  3.6:初期化
   /usr/local/mysqltri/bin/mysql_install_db --user=mysql

  ※注意点
   mysql.server ファイルと、my.cnfファイルは元々インストール済の
   設定ファイルを使うと痛い目にあう。
   てゆうか起動しない。
   ちゃんと tritonn版のをコピーしないとNGでした。

  3.7:起動
   /etc/init.d/mysql start
   はいOK!

 4:phpのインストールし直し
  configure時に、mysqlのパスだけ mysqltriに修正

  一度、make clean, make distclean を忘れずに。

 5:やってみる
  CREATE TABLE t1 (c1 TEXT, FULLTEXT INDEX ft USING NGRAM (c1)) ENGINE = MyISAM DEFAULT CHARSET utf8;

  SHOW SENNA STATUS\G

  適当にデータをつっこみ、

  SELECT * FROM t1 WHERE MATCH(c1) AGAINST("キーワード1 キーワード2" in boolean mode);
  ※boolean modeは日本語検索で必ずつける
  ※キーワードはスペース区切り
  ※デフォルトだと or検索なので、and検索したい時はキーワードの頭に「+」(プラス)をつける。

タグ:CentOS MySQL
nice!(0)  コメント(0)  トラックバック(0) 
共通テーマ:パソコン・インターネット

nice! 0

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

トラックバック 0

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。