Python Scikit-learnとは

はじめに

皆さんこんにちはALEXです。応用編の中で人気講座のscikit-learnについて解説します。

scikit-learnとは

scikit-learnは、Pythonの機械学習ライブラリで「サイキット・ラーン」と読んでくだい。scikit-learnはオープンソース(BSD license)で公開されているので、個人/商用問わず、誰でも無償で利用することができます。

scikit-learnには、多くの機械学習アルゴリズムが実装されていますが、どのアルゴリズムもコピペで利用することができます。また、irisなどのサンプルのデータセットが付属しているため、インストールしてすぐ機械学習にまなぶことができます。

チートシート

scikit-learnで提供されているアルゴリズムはチートシートとしてすべてリストされています。これに沿って勉強していき、すべて網羅することができれば、マシンラーニングの実務を始めるのに必要な知識が頭に入ると思います。

scikit-learnチートシート

個人的にはMINITABのチートシートににているな、と思っています。

最低限身に着けたい知識

といっても、このチートシート、初学者にはかなりボリュームが多いです。@_@

なので、まずは最低限身に着けていただいきたいものをリストアップします。上の三つは解説記事がありますので勉強してください。

分類

決定木

回帰

単回帰分析

重回帰分析

クラスタリング

クラスタリング分析(k-means法)

主成分分析

 

まとめ

今後、ALEXの「Pythonすごいぜ!塾」のe-learing講座の中でも、メニューとしてscikit-learnを取り上げますので、当ウェブサイトをどんどんご活用ください。