RAILS PRESS RUBY on RAILS, it’s DRY and COOL …

RSS Feed

RAILS PRESS RSS

Tag Cloud

はてなブックマーク - railspress.matake.jp の注目エントリー
象形文字くさび形文字ミイラそろばんの玉そろばんコーラン占いの板?象牙大英博物館
Tagged by MeCab

Posted on
2008/03/27

Tags
MeCab, ノウハウ, 文字コード

0 Comment

この記事をはてなブックマークに登録 この記事のはてなブックマーク数 この記事を livedoor クリップに登録この記事の livedoor クリップ数 このエントリを del.icio.us に追加
ブックマークに追加する

RailsアプリからEUC-JPエンコードされた辞書を持つMeCabを使う方法

通常RailsアプリからMeCabを利用するには、MeCab側でUTF-8の辞書を選択すると思います。
しかしHyperEstraierとMeCabを連携させる為には、MeCab辞書がEUC-JPエンコーディングである必要があります。

そこで、RailsアプリからEUC-JP環境のMeCabを使う為に、以下のようなフィルタを定義しました。

LANG : RUBY
  1. require 'nkf'
  2. require 'MeCab'
  3.  
  4. module MeCab
  5.   class Tagger
  6.     def parseToNode_with_eucjp_to_utf8(text)
  7.       text = NKF.nkf("-W -e", text)
  8.       parseToNode_without_eucjp_to_utf8(text)
  9.     end
  10.     alias_method_chain :parseToNode, :eucjp_to_utf8
  11.   end
  12.   class Node
  13.     def surface_with_eucjp_to_utf8
  14.       NKF.nkf("-E -w", surface_without_eucjp_to_utf8)
  15.     end
  16.     alias_method_chain :surface, :eucjp_to_utf8
  17.     def feature_with_eucjp_to_utf8
  18.       NKF.nkf("-E -w", feature_without_eucjp_to_utf8)
  19.     end
  20.     alias_method_chain :feature, :eucjp_to_utf8
  21.   end
  22. end

これで
・MeCabに単語を入力する際には「UTF-8 => EUC-JP」変換
・MeCabから結果が出力された際には「EUC-JP => UTF-8」変換
というフィルタができます。

ps.
これでalias_method_chainの使い方を覚えた。


Posted on
2008/03/21

Tags
HyperEstraier, MacOSX, MeCab, インストール/設定, ノウハウ, 検索

0 Comment

この記事をはてなブックマークに登録 この記事のはてなブックマーク数 この記事を livedoor クリップに登録この記事の livedoor クリップ数 このエントリを del.icio.us に追加
ブックマークに追加する

HyperEstraierとMeCabを連携させる方法

HyperEstraierをMacにインストールする方法については「Mac OS X に Hyper Estraier をインストールする - METAREAL」に詳しい説明が載っています。

しかしMETAREALで紹介されている方法では、HyperEstraierはN-gram方式でしかインデックスしてくれません。HyperEstraierにN-gramと形態素解析を併用させるには、以下のようにMeCabとの連携を行うように設定する必要があります。

以下、MeCabとHyperEstraierのインストールから、HyperEstraierの動作確認までをまとめておきます。

MeCabのインストール

MeCab本体のインストール

http://mecab.sourceforge.net/より

mecab-0.97.tar.gz

をダウンロードします。

LANG : shell etc.
  1. tar xvzf mecab-0.97.tar.gz
  2. cd mecab-0.97
  3. ./configure
  4. make
  5. sudo make install

» このエントリーには続きがあります。続きを読む »


MeCabタグ