読者です 読者をやめる 読者になる 読者になる

mathematikの すうがく ブログ

機械学習とかRとかPythonを中心に書いていく予定です

python用 MeCabのインストール

Linux MeCab 形態素解析

ちょっとハマったのでメモがてら。

前提条件

私はlinux mint 環境です。apt-getでmecabをインストールしています。

またpythonPython 2.7.6です。

 

MeCabのインストール

 

まずはMeCabをインストールする必要があります。

本当はビルドするのが正しいのかもしれませんが、面倒なのでapt-getで私はインストールしました。

すでにMeCabのインストールが終わっている人は「mecab-config」が存在すればスキップして大丈夫です。

 apt-get install mecab
 apt-get install mecab-ipadic
 apt-get install mecab-utils
 apt-get install mecab-ipadic-utf8
 apt-get install libmecab-dev

どうもmecabのインストールだけでは後述するmecab-configが無いためpython用のMeCabをbuild時にエラーになります。

あと「 apt-get install mecab-utils」や「apt-get install mecab-ipadic-utf8 」が必要十分なインストールかは未検証です。本当は必要ないかもしれません。。。。

 

MeCabpython用のライブラリをインストール

公式サイトからMeCabpython用ライブラリを落とします。

以前はgoogle code が公式サイトだったようですが、本サービスの終了に伴い、githubに移動されたようです。

Google Project Hosting

MeCab: Yet Another Part-of-Speech and Morphological Analyzer

 

 

こちらの「perl/ruby/python/java バインディング 」と書かれているところの「ダウンロード」とあるところからGoogle Driveに移動します。

こちらから私は「mecab-python-0.996.tar.gz」を入手して、展開しました。

こちらの「README」に従い、ビルドすると私の時は以下のエラーが発生しました。

$python setup.py build
sh: 1: mecab-config: not found
Traceback (most recent call last):
  File "setup.py", line 13, in <module>
    version = cmd1("mecab-config --version"),
  File "setup.py", line 7, in cmd1
    return os.popen(str).readlines()[0][:-1]
IndexError: list index out of range

mecab-configが無いためエラーとなっている様子です。

ではmecab-configとはなんぞ、とコマンドを実行してみると

mecab-config
The program 'mecab-config' is currently not installed. You can install it by typing:
sudo apt-get install libmecab-dev

といわれます。ですので前述「MeCabのインストール」の

 apt-get install libmecab-dev

 が必要でした。

MeCabのソースからビルドすればそもそもそんなエラーにはぶつからないかもしれません。

そして

python setup.py build

sudo python setup.py install

python test.py

 でビルドとインストールおよびテストの実行が行えました。

短いですが、以上です。