応用編

Pyhton – R 連携

はじめにみなさんこんにちはALEXです。今回はPythonとRの連携について解説します。Rはとても優れた統計解析用のフリーソフトです。統計解析、シックスシグマなどに関しては非常に豊富なコードが開発されています。Pythonユーザとしてはデータサイエンスの分野はPythonがいいのか?Rがよいのか?という議論がありますが、Rはリソースが豊富なのでこれを使わない手はないと思

TableauとRでIRISデータをクラスタ分析

今回は、いきなり中上級のレッスンです。 このサイトでは、Tableau、Python、Rを使って、「稼げる」データサイエンティストを育成することが目標です。いずれも安くて(Talbeau以外は無料)スグレモノのツールですが、まずはデータ解析の基本を抑えることが大切です。「統計」のカテゴリに基本的な記事を執筆しているのですが、ある生徒さんから「もっ

Pythonで利用可能な機械学習ライブラリ

はじめにみなさんこんにちはALEXです。今回はPythonで使える機械学習ライブラリをざっと解説します。 NumPyNumPy

Python Scikit-learnとは

はじめに皆さんこんにちはALEXです。応用編の中で人気講座のscikit-learnについて解説します。scikit-learnとはscikit-learnは、Pythonの機械学習ライブラリで「サイキット・ラーン」と読んでくだい。scikit-learnはオープンソース(BSD license)で公開されているので、個人/商用問わず

Python tf-Idfを使ってナイーブベイズ分析をやってみる(1)

はじめにみなさんこんにちは、ALEXです。今回は、Pyhon応用編として「文書の特徴」を数値で表現するためによく使われている、文書に含まれる単語の重要度を評価する「tf-idf」という概念について。tf-idfとは

Python scipy2 様々な分布(t分布、カイ二乗分布、二項分布、ポアソン分布)をプロットする。

皆さんこんにちはALEXです。当サイトでは”プログラミングと統計の融合”が重要なテーマです。今回は、統計の分野ではおなじみな分布をmatplotlibでプロットしてみるということをご紹介します。前回では正規分布をやりましたので、その続編です。 scipy1 インストールから正規分布

Python scikit-learn4 決定木分析

はじめに 皆さんこんにちは、ALEXです。今回はscikit-learn編「決定木」分析です。これまでiris…

Python Scikit-learn4 クラスタリング分析(k-means法)

みなさんこんにちはALEXです。Python の機械学習ライブラリの scikit-learnシリーズの第4弾 を用いてクラスタリング分析をご紹介します。  クラスタリング分析ラベル付けがなされていないデータに対し、近い属性を持ったデータをグループ化する手法です。例をあげると、下に示すデータの活用方法がのような知られています。

Python クラスメソッド

クラスメソッド (class method) とはクラスメソッドとは、クラス内で定義するメソッドのことでインスタンス化しなくても呼び出すことができるのが大きな特徴です。ですので、クラスメソッドはクラスそのものに対し、何かしらの操作をするメソッドを使いたいときに定義します。   通常、クラス内でメソッドを呼び出したいときは、まず

Python scikit-learn2  線形回帰(単回帰)分析

はじめに数量などの連続値をとる目的変数を予測するのに役立つのが回帰分析です。この記事では、目的変数と説明変数の関係をモデル化する線形回帰をScikit-learnライブラリを使って行う方法を解説