こにしき(言葉・日本社会・教育)

関西学院大学(2016.04~)の寺沢拓敬のブログです(専門:言語社会学)。

MeCabであらたな単語を "僕の環境で" 辞書に登録する手順メモ

完全に自分専用メモです(この手のメモ、ローカルHDDに保存しておいても絶対に忘れるので)。

私は、コマンドプロンプトの cd 指定すらおぼつかないレベルなので、完全にコピペで再現できるようにまとめました。

登録する単語の情報を .csv に登録する

C:\data を開いて、userdict.csv を編集

dicコンパイル

  • 注1 半角スペースのせいかもしれないけれど、" " でくくらないと、エラーが出る
  • 注2 ネット上には、 -t を utf-8 指定の記事が多いが、このままの状態で自分のRを実行するとアボートする。shift-jis に変更必要
"C:\Program Files (x86)\MeCab\bin\mecab-dict-index"      -d "C:\Program Files (x86)\MeCab\dic\ipadic"      -u "C:\data\userdict.dic"       -f utf-8 -t shift-jis "C:\data\userdict.csv"





というわけで、C:\data に生成された userdict.dic を利用する。

mecabrc の編集(最初だけ)

C:\usr\local\lib\mecab\dic\userdic 内にある mecabrc を開いて

; userdic = /home/foo/bar/user.dic

を(セミコロンはコメントアウト

userdic = C:\data\userdict.dic

に置き換える。ただし、フォルダ直下で作業すると、管理者権限で保存できないので、一回外にコピペ→編集したものを、もう一度コピペで戻す。2022-10-20の14時にこの作業は成功したので、フォルダを変えたりした場合以外はとりあえず必要ない。