This post is also available in: English-US (英語)
最近、新しいPCにpythonの機械学習(流行の人口知能系)のライブラリ(scikit-learnとか)をインストールする機会があったので、メモしておきます。
環境はwindows7 32bitです。
追記:
ちなみに、Pythonを新しくインストールする場合には、Anaconda(https://www.anaconda.com/download/)を使うと、機械学習のライブラリをインストールする際に必要なNumpy/Scipy/Matplotlib等のライブラリが最初から入っていて便利です。
また、windowsの64bit環境でNumpy/Scipy/Matplotlibをインストールする場合には少し手間がかかります。詳細は過去の記事64bit環境でPythonのNumpy/Scipy/Matplotlibをインストールを参考にしてみてください。
Contents
1.まずはpython2.7系をインストール
Python Japan(http://www.python.jp/)からpython2.7系をダウンロード・インストールします。
python3.0系はpython2.0系に対して下位互換がないので、最終的に製品をローンチする環境を良く調べてから2系か3系を決めるのが良いかと思います。
2.pythonのPATHを通す
pythonの環境変数PATHを通します。pythonのインストールディレクトリをデフォルトから変更していない場合には以下のようになるかと思います。
C:\Python27; C:\Python27\Scripts;
3.pipをインストール
pipはpythonのライブラリパッケージ管理ツールのようなものです。
以下のURLの「To install or upgrade pip, securely download get-pip.py. [1]」からget-pip.pyをダウンロードする。
https://pip.pypa.io/en/latest/installing.html
ダウンロードしたファイルをコマンドプロンプトから以下のコマンドで実行すると、pipのインストールが開始されます。(管理者権限が必要な場合もあるとのこと)
python get-pip.py
インストールが終わったら、コマンドプロンプトでpipと叩いて確認してみてください。pipで指定可能なコマンド一覧が出てきます。
4.pythonライブラリをpipでインストールしていく
コマンドプロンプトからpipコマンドを使ってpythonライブラリをインストールしていきます。
pip install <ライブラリ名>
以下のコマンドでインストール済みのライブラリを確認することができます。
pip list
個人的にインストールしている機械学習系のライブラリ
pythonの機械学習のライブラリで有名なのはscikit-learnです。流行のディープラーニングとかはマシンのスペックと相談した上で試してみてください。
ちなみに、インストールしたpythonライブラリはデフォルトでは以下のフォルダにあります。
C:\Python27\Lib\site-packages
matplotlib (1.2.0) :グラフ描写
nltk (2.0.4) :自然言語処理
numpy :数値計算(1.7.0)
pandas (0.14.0) :データ分析支援
PyYAML (3.11) : YAMLライブラリ
scikit-learn (0.13) : 機械学習ライブラリ
scipy (0.12.0) : 科学技術計算ライブラリ
scipyとnumpy,matplotlibはなぜかpip installではエラーが出て上手くいきませんでした。なので次のステップに書いてあるように、windows版のインストーラーを利用しました。
また、pandasのdevelopment branchからのインストールには、cythonが必要だったりします。
Cython is required to compile pandas from a development branch. Please install Cython or download a release package of pandas.
5.scipyとnumpy,matplotlibはインストーラーを利用しました
以下のそれぞれのリンク先の「Download URL:」(sourceforgeというサイト)からwindowsインストーラーを入手してください。
scipy(https://pypi.python.org/pypi/scipy/)
numpy(https://pypi.python.org/pypi/numpy)
matplotlib(https://pypi.python.org/pypi/matplotlib/)