ページ

2016年8月14日日曜日

【R】 MeCabとRMeCab

MeCab: Yet Another Part-of-Speech and Morphological Analyzer
MeCabのWindows版をインストールしてみる
公式ページ: MeCab
形態素解析システム MeCab

Rでテキストマイニングを分析する前提として、文書の形態素解析を行わなければならない。ここでは、広く使われている形態素解析エンジン「MeCab」をインストールしてみよう。



MeCabのインストールと動作試験

  1. 一番上のリンクからインストーラ(mecab-0.98.exe)をダウンロードする。
  2. インストーラを起動する。漢字コードを選択する必要がある。デフォルトのShift-JISで良いだろう。
  3. インストール完了すると、デスクトップに起動アイコンが出来ているので、起動。コマンドプロンプト上で動いている。適当な文章をコピー&ペーストすると以下のように形態素解析する。


RMeCabパッケージの導入と動作試験
RとLinuxと...

管理者権限にてRを立ち上げ、次のように入力。

install.packages("RMeCab", repos = "http://rmecab.jp/R")

通常のユーザー権限でRを立ち上げなおし、動作テストする。

> library(RMeCab)
> res <- RMeCabC("すもももももももものうち")
> unlist (res)
    名詞     助詞     名詞     助詞     名詞     助詞     名詞 
"すもも"     "も"   "もも"     "も"   "もも"     "の"   "うち" 

これでとりあえず自宅での分析環境は整備できた。