Python Pandas2 Seriesの基本操作

はじめに

皆さんこんにちは。今回はPandasの第二弾Seriesオブジェクトの基本操作について解説します。   Seriesオブジェクトとは一次元配列のオブジェクトです。NumPyのndarrayの1次元配列に近いですが、いくつか相違点があります。Seriesオブジェクトには1セットのデータが格納されてます。Seriesオブジェクトを複数つなぎあわせるとDataFrameオブジェクトとして扱うこともできます。 実際にSeriesオブジェクトを作ってみましょう。

Seriesオブジェクトを作成する

pandas,numpyをインポートします。

pd.series()内に一次元のリストを入力すればseriesオブジェクトを生成することができます。

以下のように返ります。dtypeはint64となっています。

numpyのarrayからも生成することができます。

以下のように返りますがdtypeはint32となっていました。

辞書からも作成することができます。

以下のようにSeriesが生成されました。

一つのオブジェクトに数値、文字、欠損値を混在させることも可能です。

この場合dtypeはオブジェクトになります。

Seriesオブジェクトを操作する

.iloc[数値]はオブジェクトの値を抽出します。

この場合1番目の要素、2を抽出して返します。要素は0から始まりますので注意が必要です。

要素の範囲を抽出することもできます。

1番目から4-1=3番目の要素を抽出します。

.ndimは次元の数を返します。

ここでは1を返します。

.valuesはデータの中身を配列で返します。

 

まとめ

Seriesオブジェクトの使い方をご紹介しました。中心的にまとめました。Seriesオブジェクト操作はDataFrameオブジェクトと共通点が多いことがわかるかと思います。