WindowsにRMeCabを導入する 2019年夏の陣
オフライン環境のWindows10にR環境を作る 2019年夏の陣 の関連記事です。
オフライン環境のWindows10への導入が前提ですが、オフラインに限らず汎用的な内容だと思います。
基本的に以下リンク先の方法を追えばOKです。 ただ、手前味噌だけれどもこれを最後まで読んでからインストールするのを推奨します。
- Windows10にMeCabをインストール(スクショ付きで非常にわかりやすかったです)
- Mecabと辞書をインストールする
- Windows10でRとRMeCabを使いたい
①MeCabをインストール
こちらからインストーラーをオンライン環境でダウンロードし、オフライン環境に置き、オフライン環境で実行する。
http://taku910.github.io/mecab/#download
いくつかの参考先ではMeCab本体のインストールと辞書のインストールはそれぞれ別に行う必要があると書いてあるところもあるけれど、この作業で辞書も一緒にダウンロードされてくるらしい。
詰まりポイント その1
デフォルトのMeCabのインストール先はC:\Program Files hoge
になっているけれども、セキュア環境のようなところは案外環境構築者がフルに権限を持っていないパターンがあるので、C:\Program Files hoge
の書き込み権限がなく、MeCabインストールエラーになる場合がある。自分はなった。
その場合は、 こちらの参考先に書いてあるように、C:\MeCab
に変更しても大丈夫。自分はそれでいけました。
インストール先変えたので(かは知らないが)、パスを通しておく。これもこちらの参考先参照して、
- コントロールパネル>すべてのコントロールパネル項目>システム>システムの詳細設定
- システムのプロパティ>詳細設定>環境変数
- Pathで
C:\MeCab\bin
を追加 - MECABRCで
C:\MeCab\etc\mecabrc
も追加しておく
詰まりポイント その2
こちらの参考先ではWindows10にMeCabを入れるところまでで終わりだが、今回の自分の目的はRMeCab
を使えるようにすることである。
文字コード選択画面で みんな大好き UTF-8を指定してMeCabを入れてしまうと、RMeCab
を実行したらエラーになる。
みんながあまり好きではない SHIFT-JISを選択しましょう。
動作確認
こちらの参考先と同じように
in.txt
これはカルビ、ロースとは別次元の旨さだ
を作成し、コマンドプロンプトで
mecab in.txt -o out.txt
を実行すると、こんな感じになる。
そう、文字コード選択画面でSHIFT-JISを選択したがゆえに文字化けするのだ。 一旦はMeCabが動くことが確認できたので一旦これでOK。
②RMeCabをインストール
WindowsのRMecab
パッケージのファイルをオンライン環境にダウンロードする。
http://rmecab.jp/R/bin/windows/contrib/3.5/RMeCab_1.00.zip
これをオフライン環境に置き、こちらの「⑥オフライン環境でzipファイルをソースにしてパッケージをインストールする」に従いインストールする。
動作確認
[こちら]を参考に動作確認。ちなみにMeCab本体の文字コード選択画面でUTF-8を選んだときの失敗例も出てます。自分もUTF-8で入れちゃったときはこうなりました。(https://noneme.hatenablog.com/entry/2019/04/03/190356)
library(RMeCab) unlist(RMeCabC("すもももももももものうち"))
良い感じ。ちなみにunlist
をつけなかったらこうなる。
とりあえずRMeCabのおおよその環境構築はこれで完成だと思います。