日本語を形態素解析したり、漢字の読みがなを取得したりするコマンド。
使い方は作者のサイトを見るのが正確である。
MeCab: Yet Another Part-of-Speech and Morphological Analyzer
http://taku910.github.io/mecab/
taku910/mecab: Yet another Japanese morphological analyzer
https://github.com/taku910/mecab
MeCab本体とは別に辞書もインストールが必要。
以下はyumとかapt-getとかのパッケージマネージャではなくて、ソースからインストールする方法。
まずはMeCab本体のインストール。
wget https://mecab.googlecode.com/files/mecab-0.996.tar.gztar xvzf mecab-0.996.tar.gzcd mecab-0.996./configuremakesudo make installcd ..
次はipadicの辞書のインストール。
wget https://mecab.googlecode.com/files/mecab-ipadic-2.7.0-20070801.tar.gztar xvzf mecab-ipadic-2.7.0-20070801.tar.gzcd mecab-ipadic-2.7.0-20070801./configure --with-charset=utf8makesudo make installcd ..
unidicの辞書のインストール。unidicも使いたければ。
wget -O mecab-unidic-2.1.2_src.zip 'http://sourceforge.jp/frs/redir.php?m=osdn&f=%2Funidic%2F58338%2Funidic-mecab-2.1.2_src.zip'unzip mecab-unidic-2.1.2_src.zipcd mecab-unidic-2.1.2_src./configure --with-charset=utf8makesudo make installcd ..
(Ubuntu 13.10, 14.04 で確認)
-Oyomi
オプションを付ける。
$ echo "形態素解析" | mecab -Oyomiケイタイソカイセキ