AI アプリ インフラ

Mecabの拡張辞書「mecab-ipadic-neologd」を導入する手順

投稿日:2018年2月27日 更新日:

こんにちは!シミダイ(@shimidai2100)です。

Mecabの辞書は古い!ということで、新語や固有名詞に強いとされている辞書「mecab-ipadic-neologd」を導入してみたいと思います。

MecabをまだLinuxにインストールしていない人は↓の記事を確認してください。

LinuxにMeCabをインストールする手順

LinuxにMeCabをインストールする手順を紹介します。 最終的には、Pythonを使用して「マルコフ連鎖」を使用して自動文章作成ツールを作成したいと思います。 Pythonのインストール手順は以下 ...


mecab-ipadic-neologdをダウンロード

まずは「git」を使用して、「mecab-ipadic-neologd」をダウンロードします。

↓が実行ログです。

mecab-ipadic-neologdの初期設定

gitでのダウンロードが完了したら、辞書データをコンパイルします。

なおコンパイル要件として、「メモリ空き容量が1.5GByte」必要とのことのなので注意してください。

↓が実行ログです。

私の環境の場合、「patch」コマンドが使用出来ないと怒られました。

なので「patch」をインストールして再度実行します。

mecab-ipadic-neologdを使ってみる

実際に動かしてみるコマンドは↓になります。「-d」オプションを使用して、辞書の格納先を示すことがポイントです。

↓が実際に動かしたログです。

中居正広のミになる図書館 」が新語として使用出来ていることが確認できます。

mecab-ipadic-neologdのオススメ設定

cronを使用して常にをアップグレードすることがおススメです。↓がcronの定義です。

この例ですと、火・金曜日の午前 3 時に最新の辞書データに更新が掛かります。

マニュアル場所

参考https://github.com/neologd/mecab-ipadic-neologd/blob/master/README.ja.md

 

スポンサードリンク

関連記事

-AI, アプリ, インフラ

Translate »

Copyright© shimidai2100 , 2018 All Rights Reserved.