としおの読書生活

田舎に住む社会人の読書記録を綴ります。 主に小説や新書の内容紹介と感想を書きます。 読書の他にもワイン、紅茶、パソコン関係などの趣味を詰め込んだブログにしたいです。

タグ:Windows

Python3でtweetの形態素解析を行うためにWindows10でMeCabの辞書をNEologd辞書に変更しようとしたら思いのほかてこずったので変更手順をまとめました。

MeCabをインストールしていることを前提として進めるのでまだインストールしていない方は下の記事を参考にしてください。




NEologd辞書とは


Neologd辞書とは佐藤敏紀(@overlast)が開発しているオープンソースのMeCabと共に使う単語分かち書き辞書です。

特徴として週二回以上という頻繁なペースで更新されているため新語や固有表現に強く、語彙数が多くなっています。

そのためSNSなどの新語が多い環境で自然言語処理を行う際一般的にNeologd辞書が使われています。



NEologd辞書のインストール

動作環境

本記事における動作環境は下記の通りになります。
  • Windows10 Home
  • Python 3.6.7


コマンドプロンプトでLinuxコマンドをたたけるようにする


Linuxコマンドを使ってneologd辞書をインストールしていくので最初にコマンドプロンプトでLinuxコマンドを入力できるようにしていきます。

1. Windows Subsystem for Linuxを有効にする


コントロールパネル > プログラム
neologd1

Windowsの機能の有効化または無効化

neologd2

Windows Subsystem for Linuxにチェックして再起動

neologd3

2. Ubuntuをインストール


Windows Subsystem for Linuxを有効にしたら次はMicrosoft StoreからUbuntuをインストールします。

Microsoft Storeを起動してUbuntuと検索したら下記の画面がでるので入手をクリックしてください。
neologd4

3. ユーザ登録


インストールが完了したらUbuntuを起動してください。そうするとユーザ名とパスワードを入力するように指示がでますのでにゅうりょくしてください。

4. パッケージを最新化する


ユーザ登録ができたらパッケージを最新化するために下記のコマンドを入力してください。

sudo apt update
sudo apt upgrade





NEologdをインストール

1. ビルドに必要なものをインストール


下記のコマンドを入力してビルドに必要なものをインストールします。

sudo apt install mecab
sudo apt install libmecab-dev
sudo apt install make

2. UbuntuでNeologdをインストール

git clone https://github.com/neologd/mecab-ipadic-neologd.git
cd mecab-ipadic-neologd
sudo bin/install-mecab-ipadic-neologd

3. NEologdをWindowsにコピーする

cd ..
sudo cp -R /usr/lib/x86_64-linux-gnu/mecab/dic/mecab-ipadic-neologd/  /mnt/c/

コピー先は各自好みで指定してください。


NEologdがWindows10で使えるか確認


上記の作業が全て完了したらWindowsで使えるか確認します。

下記のコードが動いたら正しくインストールできています。

import MeCab

mecab = MeCab.Tagger("-Ochasen -d C:\mecab-ipadic-neologd")
print(mecab.parse("進撃の巨人の発売日だ"))

実行結果は以下の通りになります。

neologd5

ちなみに最初からMeCabに入っている辞書を使った場合の結果は以下の通りになります。

neologd6






以前Windowsの環境でPythonでMeCabを使おうと思ったら上手くいかず諦めてUbuntuを使っていたのですが、今回久しぶりに挑戦してみるとあっさりと使うことができたので環境構築方法をまとめました。


動作環境


本記事における動作環境は下記の通りになります。
  • Windows10 Home
  • anaconda
  • Python 3.6.7
今回はanacondaを使っていますがanacondaを使ってなくても手順通り進めればインストールすることができます。



MeCab(64bit版)のインストール

1. MeCab(64bit版)のインストーラのダウンロード


MeCabのインストーラは下記のページからダウンロードできます。




2. mecab-0.996.exeを実行する


インストーラをダウンロードできたらmecab-0.996.exeを実行してインストールしていきましょう。



環境変数の設定


MeCabを無事インストールすることができたら次は環境変数の設定を行います。

1. 環境変数に「MeCabのインストール先\bin」を設定する


インストール先を特に指定せずデフォルトの設定でインストールしたのなら下記の例と同じもので問題ありません。

環境変数の例:C:\Program Files\MeCab\bin


2. 環境変数が正しく通せているか確認する


環境変数を設定できたら設定を正しく行えているか確認します。

コマンドプロンプトを起動してMeCabと入力した後に好きな文章を入力して形態素解析が実行されたら正しく環境変数を設定できています。

この際文字化けがおきますがそれはコマンドプロンプトがUTF-8に対応していないのが原因で起きるので気にしなくて大丈夫です。

MeCab1




mecab-python-0.996のセットアップ

1. mecab-python-0.996.tarのダウンロード


mecab-python-0996.tarは下記のページのperl/ruby/python/java バインディングの下にあるダウンロードリンクからダウンロードができます。

ダウンロードの際様々なバージョンのものがありますが0.996のものをダウンロードしてください。


2. mecab-python-0.996.tarを解凍する


mecab-python-0.996.tarをダウンロードすることができたら好きな場所に解凍してください。


3. setup.pyの編集


mecab-python-0.996のフォルダ内にあるsetup.pyはpython2.xxに合わせて書かれているものなのでpython3で利用できるように中身を少し書き換える必要があります。

下記に編集後のコードを乗せておくのでこれをそのままコピーしたらほぼほぼ大丈夫です。

ただMeCabのインストール先をデフォルトとは別の場所にした場合その部分だけインストール先に合わせて修正してください。

#!/usr/bin/env python

from distutils.core import setup,Extension,os

setup(name = "mecab-python",
    version = '0.996',
    py_modules=["MeCab"],
    ext_modules = [
        Extension("_MeCab",
            ["MeCab_wrap.cxx",],
            include_dirs=[r'C:\Program Files\MeCab\sdk'],
            library_dirs=[r'C:\Program Files\MeCab\sdk'],
            libraries=['libmecab'])
    ]
)


4. ビルドとインストール


Anaconda Promptを起動してmecab-python-0.996のフォルダに移動してください。

移動できたら下記のコマンドを入力してビルドしてください。

python setup.py build

ビルドができたら下記のコマンドを入力してインストールしてください。

python setup.py install


5. 実行確認


インストールができたら最後に実行できるか確認を行います。

下記のコードを実行して形態素解析の結果がかえってきたら作業は終了です。

import MeCab
mecab = MeCab.Tagger("-Ochasen")
print(mecab.parse("すもももももももものうち"))

実行結果は下記の通りになります。

MeCab2



最後に


環境を構築中にVisual Studioをインストールしていない場合はそれ関連のエラーが出るかもしれませんが適宜対応してください。

もし何か分からないことがあればコメントをもらえれば返しますのでコメントしてください。


Python9


普段はUbuntuを使ってPythonのコードを書いているのですがとある都合でWindowsでコードを書かなければいけなくなったためそのついでにWindows10でPython3をインストールする方法をまとめました。


Pythonインストーラーのダウンロード


下記のPythonの公式サイトにアクセスします。

https://www.python.org/

公式サイトにアクセスしたらDownloadsをクリックします。

Python1

ページが遷移したら次にWindowsをクリックします。

Python2


下記の画面に遷移したら、64bit バージョンを使用する場合は "Windows x86-64 executable installer" をクリック してくださいそうするとインストーラーのダウンロードが始まります。インストールするバージョンは基本的に最新バージョンにしましょう。(2018年7月22日現在では3.70が最新バージョン)

32bit バージョンを使用する場合は "Windows x86 executable installer" をクリックしてください。

Python3


インストール


インストーラーがダウンロードできれば次はインストールです。先ほどダウンロードしたインストーラーを起動してください。

インストーラーが起動したら最初に "Add Python 3.7 to Path" のチェックボックスにチェックをいれてください。こうすることで自動的にPATHを通してくれるので後でPATHを通す作業がいらず楽です。

インストール方法は "Install Now" と "Customize installation" のどちらを選択してもよいのですが今回は、インストールを指定したいので "Customize installation" を選択します。

Python4


次の画面では、自分が必要なものにチェックを入れてください。分からなければそのままNextをクリックしても大丈夫です。

Python5


次の画面でも必要なものがあればチェックボックスにチェックを入れましょう。基本的にそのままで大丈夫です。

インストール先を指定した場合 "Browse" から好きな場所を指定しましょう。

"Install" をクリックしたらインストール完了です。


Python6



正しくインストールできたか確認する


インストールが完了したら正しくインストールができているか確認しましょう。

確認するのにコマンドプロンプトを使います。起動のし方が分からない場合は,windowsキー + r  を押し cmd と入力すれば起動することができます。

Python7

コマンドプロンプトを起動したら "Python -V" と入力してください。下の画像のように正しくバージョンが表示されれば正しくインストールができている証拠です。

もしエラーが出てしまった場合どこかの手順で失敗している可能性がありますのでもう一度確認してみましょう。(おそらくPATHがうまく通せていない)

Python8



まとめ


現在はpipも自動的にインストールされるみたいなのでライブラリをインストールするときとかも便利ですね。Pythonの使い方を学びたい場合下記の本が参考になるので読んでみてください。



647498_s


オープンソースのグラフ可視化ソフトであるGephiをWindowsにインストールしてみたところ、起動中にアプリがダウンするというトラブルが発生したので、対処策を忘備録として記録しておきます。


Gephiとは


Gephiはネットワークの可視化と分析のためのオープンソースソフトウェアです。

Gephiを使うことで誰でも簡単にお洒落なグラフを書くことができます。

ソーシャルネットワーク分析や生物学的ネットワーク解析など様々な分野で活用されています。



起動しないときの解決策


Javaがインストールされていない


起動時にJava 6以上がインストールされていないと以下のような画面がでて起動に失敗します。

キャプチャ

この画面が出た場合は以下のサイトからJavaの最新版をインストールしましょう。




古いバージョンのGephiをインストールしている


Javaをインストールしているが以下の起動画面がでてしばらくするとアプリがダウンするということがあります。

キャプチャ

この場合はおそらくGephiのバージョンが古いことが原因だと考えられます。

以下の日本語のサイトからGephiをダウンロードした場合、Gephiのバージョンじゃ0.8 alphaです。



0.8 alphaはWindows10では起動することができないみたいです。

なので一度Gephiをアンインストールしてから、以下の開発元サイトから最新版の0.9.2をインストールしましょう。



起動に成功したら以下のような画面が開きます。

キャプチャ



まとめ


おそらくGephiの起動で失敗するほとんどの人は古いバージョンをインストールしていたことが原因だと思われます。

分かりやすいからって日本語のサイトだけを見ていたら痛い目にあいますね…。





3753817_s

今までVisual Studioをインストールしている環境でしか、C#をコンパイルしたことがなかったのですが、Visual Studioがない環境でもC#をコンパイルしたいと思い方法を調べました。

今回は、VSCodeを使ってコンパイルしていきます。



.NET Frameworkのパスと通す


C#をコンパイルするためには.NET Frameworkが必要です。

Windowsではデフォルトで.は.NET Frameworkはデフォルトでインストールされています。

C:\Windows\Microsoft.NETにアクセスするとFrameworkとFramework64がありそれぞれ32bit用と64bitようになります。

キャプチャ

今回は64bit用の「v4.0.30319」のパスを通していきます。

パスはコントロールパネル>システムとセキュリティ>システム>システムの詳細設定>環境変数 から通すことができます。

環境変数には「C:\Windows\Microsoft.NET\Framework64\v4.0.30319」を追加してください。



C#のプログラムをコンパイルする


パスが通せたところでC#のプログラムをVSCodeでコンパイルしていきましょう。

まずはVSCodeを起動して、コードが読みやすくなるように拡張機能をインストールしていきます。

拡張機能の検索ボックスで「C#」と入力して検索して、一番上に現れる拡張機能をインストールします。

キャプチャ

これでC#のコードが読みやすくなりました。

今回は、以下のサンプルコードをコンパイルします。

using System;

class Hello
{
    public static void Main()
    {
        Console.WriteLine("Hello World");
    }
}

ファイル名は何でもいいのですが、今回は「Hello.cs」としておきます。

コンパイルしたいC#のコードができたら、コードが置いているディレクトリにいどうしてターミナルに以下のコマンドを入力してください。

csc .\Hello.cs

これだけでコンパイルは完了です。

コンパイルが終わると実行ファイルができるはずなので実行してみるとターミナルに「Hello World」と表示されるはずです。



まとめ


C#をコンパイルするのは難しいと思っていたのですが、やってみたらむちゃくちゃ簡単でした。

本記事で分からないことがあればコメントをください。





↑このページのトップヘ