物流情報ポータルサイト

24.05.01 富士通とJR貨物/「車両管理システム」を共同で展開~鉄道車両のメンテナンス業務の省力化 24.05.01 サッポロHD/広島と埼玉県加須に新たな物流拠点を設置 24.05.01 アマゾン/相模原市に国内最大の「アマゾン ロボティクス」を導入する物流拠点新設

連載:
掲載日:16.07.27

「データ分析」を武器として物流を変える:第9回
お手軽かつ効果絶大なわりに、「今一つ知られていない」グラフの書き方で差をつける ~「散布図」でワンランク上の分析を行う~(その2)

 本コーナーでは前回、データ分析の有効なツールとなるグラフとして「散布図」をご紹介しました。今回は、この散布図の使い方の応用編として、「グループ別散布図」の作り方および使い方をみてみたいと思います。
まず散布図とは、たとえば図表1のように、横軸を身長、縦軸を体重として、分析対象となった人それぞれの身長と体重の組み合わせに対応する場所に点を打ったものです。このような散布図により、「身長が高い人ほど体重が重い」という傾向がかなり明確に示されています。

図表1 散布図(成人10人の身長と体重に関するデータを使用)


 このように、2種類のデータ、それも対になったデータ(たとえば図1のような同一人物における身長と体重等)の関係を見るのに役立つのが散布図なのです。
 そして、この散布図は手書きで作ろうと思うとかなり面倒ですが、表計算ソフトのエクセルには、この散布図を手軽に作成するための機能があることもご紹介しました。
 ただ、実際に散布図を使った分析を行おうとすると、「グループ別」での分析が行いたくなることもあります。たとえば、図表2は図表1と同じく、身長と体重の関係を示す散布図なのですが、図表1と違って、どうも身長と体重の関係が明確ではありません。

図表2 散布図(成人男女14人の身長と体重に関するデータを使用)


 その原因として、この図表2の散布図を作るためのデータには男性のものと女性のものの両方が含まれるためではないか、という仮説を立てたとします。
 この仮説を検証するためには、男女別それぞれの散布図を作るのも一つの方法ですが、同じ散布図の中に、たとえば男性は青、女性は赤で示す、つまり2つのグループが見分けられる形で散布図をまとめて作れれば、散布図を作る手間も省けますし、より男性と女性の傾向の違いが分かりやすくなります。
 そのような散布図をエクセルで作る方法は次のとおりです。
 まず、図表2の元となったデータは次の図表3のようなものだったとします。

図表3 図表2の元データ


 この図表3のデータを次の図表4のような形に加工します。

図表4 図表3のデータを加工したもの


 この図表4のデータのうち、性別以外のデータを指定して散布図を作成した結果が図表5です。凡例については、本来なら「男性」・「女性」と表示したいところが、元のデータの表記を反映して「体重(男性)」、「体重(女性)」となってしまっていますが、これは元のデータを直す等すれば良いのはお分かりと思います。

図表5 男女別散布図


 この図表5をみると、男性・女性それぞれ別にみれば、身長が高いほど体重が重いという傾向がかなり明確に示されています。逆に言えば、もし、この男女グループ別での散布図を行わなければ、対象となったデータにおいては身長と体重の対応関係が全く見られない、と結論してしまったかもしれません。このように、散布図はグループを識別できる形で作成すると、より適切な分析を行えることがあります。そのため、散布図を利用する際には、「何らかのグループ別に見れば、別の傾向が見られるのではないか」と常に気を配ることが重要です。

※本コラムに対するご意見・ご質問がありましたら、こちらにお願いします。

物流プラザに関するご意見・ご要望はこちら
b_plaza@nittsu.co.jp