コンテンツにスキップ

Python相関係数の計算と使用方法を簡単に解説!

[

NumPy, SciPy, and pandas: Pythonによる相関関係

相関関係

相関係数は、データセットの変数または特徴量間の関連性を定量化するものです。これらの統計量は科学や技術において非常に重要であり、Pythonにはそれらを計算するための便利なツールがあります。SciPy、NumPy、およびpandasの相関計算メソッドは高速で包括的で、詳細なドキュメントがあります。

このチュートリアルでは以下を学びます:

  • ピアソン、スピアマン、ケンドールの相関係数とは何か
  • SciPy、NumPy、およびpandasの相関関数の使い方
  • データ、回帰直線、相関行列をMatplotlibを使って可視化する方法

まず、相関についての説明から始め、3つの短い導入例を見て、最後にNumPy、SciPy、およびpandasの相関について詳細に説明します。

無料ボーナス: ここから無料のNumPyリソースガイドにアクセスできます。NumPyスキル向上のための最良のチュートリアル、ビデオ、書籍をご紹介します。

相関関係

お手持ちのデータセットには変数と観測値があります。例えば、以下のようなことについて理解したい場合があります:

上記の例では、身長、シューティング精度、経験年数、給与、人口密度、国内総生産などが特徴量または変数です。プレイヤーのデータ、従業員のデータ、国ごとのデータが観測値です。

データが表の形式で表される場合、その表の行は通常観測値であり、列は変数です。