Does it taste good?

「そんなことも知らないの?」って言わないでほしい。

WindowsにRMeCabを導入する 2019年夏の陣

オフライン環境のWindows10にR環境を作る 2019年夏の陣 の関連記事です。

kyyonko.hatenablog.com

オフライン環境のWindows10への導入が前提ですが、オフラインに限らず汎用的な内容だと思います。

基本的に以下リンク先の方法を追えばOKです。 ただ、手前味噌だけれどもこれを最後まで読んでからインストールするのを推奨します。

MeCabをインストール

こちらからインストーラーをオンライン環境でダウンロードし、オフライン環境に置き、オフライン環境で実行する。

http://taku910.github.io/mecab/#download

いくつかの参考先ではMeCab本体のインストールと辞書のインストールはそれぞれ別に行う必要があると書いてあるところもあるけれど、この作業で辞書も一緒にダウンロードされてくるらしい。

詰まりポイント その1

デフォルトのMeCabのインストール先はC:\Program Files hogeになっているけれども、セキュア環境のようなところは案外環境構築者がフルに権限を持っていないパターンがあるので、C:\Program Files hogeの書き込み権限がなく、MeCabインストールエラーになる場合がある。自分はなった。

その場合は、 こちらの参考先に書いてあるように、C:\MeCabに変更しても大丈夫。自分はそれでいけました。

インストール先変えたので(かは知らないが)、パスを通しておく。これもこちらの参考先参照して、

  • コントロールパネル>すべてのコントロールパネル項目>システム>システムの詳細設定
  • システムのプロパティ>詳細設定>環境変数
  • PathでC:\MeCab\binを追加
  • MECABRCでC:\MeCab\etc\mecabrcも追加しておく

詰まりポイント その2

こちらの参考先ではWindows10にMeCabを入れるところまでで終わりだが、今回の自分の目的はRMeCabを使えるようにすることである。

文字コード選択画面で みんな大好き UTF-8を指定してMeCabを入れてしまうと、RMeCabを実行したらエラーになる。 みんながあまり好きではない SHIFT-JISを選択しましょう。

dictionary_sjis

動作確認

こちらの参考先と同じように

in.txt

これはカルビ、ロースとは別次元の旨さだ

を作成し、コマンドプロンプト

mecab in.txt -o out.txt

を実行すると、こんな感じになる。

mecab_res

そう、文字コード選択画面でSHIFT-JISを選択したがゆえに文字化けするのだ。 一旦はMeCabが動くことが確認できたので一旦これでOK。

②RMeCabをインストール

WindowsRMecabパッケージのファイルをオンライン環境にダウンロードする。

http://rmecab.jp/R/bin/windows/contrib/3.5/RMeCab_1.00.zip

これをオフライン環境に置き、こちらの「⑥オフライン環境でzipファイルをソースにしてパッケージをインストールする」に従いインストールする。

動作確認

[こちら]を参考に動作確認。ちなみにMeCab本体の文字コード選択画面でUTF-8を選んだときの失敗例も出てます。自分もUTF-8で入れちゃったときはこうなりました。(https://noneme.hatenablog.com/entry/2019/04/03/190356)

library(RMeCab)
unlist(RMeCabC("すもももももももものうち"))

rmecab_res_1

良い感じ。ちなみにunlistをつけなかったらこうなる。

rmecab_res_2

とりあえずRMeCabのおおよその環境構築はこれで完成だと思います。