散布図作成

散布図

散布図とは?  |折れ線グラフ

対応すると推測される2種類のデーターが本当に関係があるかどうかを難解な統計計算を使用しないで図だけで調べるためQC手法のひとつ。
具体的には対応する2種類のデーターを横軸、縦軸にとって打点して作った図のことをいいます。

英語:scatter diagram

対応する2種類のデーターの事例

1)特性(結果)と要因(原因)の関係

2)ある特性(結果)と他の特性(結果)との関係

3)ある特性(結果)に対する2つの要因(原因)どうしの関係

関連記事:QC七つ道具

2010,2013 エクセル 散布図  フリー 

下記にエクセルで作成した散布図があります、ご自由にダウンロードしてご使用ください。

 エクセル 散布図 ファイル

散布図の作り方 書き方 基本

そのつくり方は、次のようにします。

スポンサーリンク

散布図 データー収集

関係があるかどうか調べたい、対のデータを30個以上集める

散布図 データー収集

横軸と縦軸|折れ線グラフ

二つの項目を横軸と縦軸に取る。このとき、横軸は右にいくほど大きな値を、縦軸は上にいくほど大きな値とするとともに、両軸の目盛幅を同じ幅にする。

二つの項目に原因と結果の関係がある場合は、横軸に原因系を、縦軸に結果系を取る。

散布図 作成4

プロット図に打点|XYグラフ

一対のデータをグラフに打点する。
同じデータがある場合は、前に打点した点を○で囲むか、または接近したところに打点する

最後に標題、調査日、サンプル数、作成者などを記入する。

散布図 作成 打点プロット

基本的な散布図の見方と活用の仕方

散布図のパターンには、図Aのように、横軸の増加に伴い縦軸も増加する「正の相関」と、図Bのように、横軸の増加に伴い縦軸が減少する「負の相関」とがあります。

また、図Cのように、横軸が増加しても縦軸が増加も減少もしないものは、「無相関」といいます。
図Aおよび図Bのように相関がある場合は、横軸または縦軸の項目を管理することによって、縦軸または横軸を管理することができます。
打点の幅が大きくバラツキが大きい場合は、横軸または縦軸の管理精度を上げることによって、バラツキを小さくすることができます。また飛び離れたものがある場合には、その原因を調べて是正処置を行ないましょう。

相関があると考えられるデータであるにもかかわらず無相関となった場合には、条件が異なったデータが混入していることが考えられます。データを層別し、もう一度、散布図を作成することが必要です。

散布図 見方

2013 エクセル 散布図の作成|折れ線グラフ

散布図データーの採取

上記の散布図 エクセルファイルを基に散布図を説明します。

調査したい2種類のデーターを対応する形で集めます。
対応するデーターをそれぞれ変数x、yとする。

例では下面(X)と上面(Y)の端振れ測定値をサンプルデーターとしています。
データーが少ないと正確な判断ができなくなるので30組以上のデーターを集めること。

散布図データー

散布図データー選択|エクセル 散布図 2軸

散布図データーの範囲を設定してから散布図グラフを選び、散布図。

手順は下記のとおりです。

下面(X)と上面(Y)の端振れのデーターを選択します。

散布図 グラフデーター選択

散布図挿入|エクセル XYグラフ

挿入タグ選択→散布図(X,Y)の挿入を選択します。

散布図 グラフ選択3

散布図の決定

下図のように色々な散布図が表示されるので必要な散布図を選択します。

散布図の決定2

散布図の自動作成|エクセル プロット

散布図を選択すると自動的に散布図が作成、描かれます。

但し、サイズおよび表示項目がマッチしていないので修正が必要です。

散布図 作成1

軸ラベルの設定の変更

散布図グラフの枠を選択し、グラフ要素を表示させます。

次に軸ラベルをチェックを入れると、軸ラベルが表示されるのでX変数、Y変数に適合する

ラベルを入力します。

例ではX変数には下面振れ、Y変数には上面振れと修正します。

軸ラベル2



エクセル 散布図の完成

サイズ、タイトル等の修正を行い、エクセル 散布図の完成です。

エクセル散布図 完成図

エクセル 散布図の近似曲線の求め方|回帰直線

エクセルで散布図の近似曲線を求めたいときは下記のようにします。

1)グラフを選択し、グラフ要素を表示させます。

2)次に近似曲線にチェツクを入れます。

3)近似曲線の書式設定が表示されるので「線形近似」を選択します。

4)グラフに数式を表示させたい場合は「グラフに数式を表示する」を選択します。

回帰直線とは、散布図において、予定値を求める際に用いられる直線のことである。2組のデータの中心的な分布傾向を表すもの、予測する際に用いられる。

散布図 近似曲線

エクセル 散布図の相関係数の求め方

次に相関係数を求めます。

シートの空いているところ(ここではセルC110)に「相関係数」を作成します。

下記のようなCORREL関数の数式を入力します。

=CORREL(B58:B107,C58:C107)

『B58:B10』X変数データー入力範囲

『C58:C107』Y変数データー入力範囲

相関係数の求め方

セルC110に相関係数 -0.8112118が計算、表示されます。

X変数、Y変数がともに数量(間隔尺度・比尺度)であり、直線的関係が見られる場合は、ピアソンの積率相関係数(単相関係数)を用います。この例でも変数はともに数量(間隔尺度)ですからピアソンの積率相関係数(単相関係数)を求めることができます。

CORREL関数 説明:

CORREL関数は指定した二つの配列の相関係数を返す事で二つの配列の相関関係を調べる事ができます。

引数の指定方法:
配列1 数値を含む名前、配列、セル範囲の参照を指定
配列2 もう一方のデータが入力されているセル範囲、数値を含む名前や配列を指定

C2セルに =CORREL(A2:A4,B2:B4)を入力すると以下の表の結果となります。

C2セル=CORREL(A2:A4,B2:B4)では収益の行のA2:A4を参照し、B2:B4は来店者数を参照しています。
そして、CORREL関数によって利益と生産数の相関関係を表す相関係数0.9958がC2セルに出力されます。
(小数点第四位まで表示)

A B C
1 利益 生産数 相関係数
2 50000 120 0.9958
3 60000 130
4 30000 90

散布図の相関係数 グラフの見方

相関係数による相関関係の強弱の判断基準は下記のとうりである。

0.8 ≦| r | → 強い相関あり

0.6 ≦| r | <0.8 → 相関あり

0.4 ≦| r | <0.6 → 弱い相関あり

| r |<0.4 → ほとんど相関なし

強い相関有

相関あり

相関なし

色々な散布図の見方

正の相関があり

正の散布図

xが増えるとyも増えていく傾向があるので”正の相関がある”といえる。Xを正しく管理すればyも管理することができる。

 

 負の相関があり

負の散布図

xが増えるとyが減少する傾向があるので”負の相関が
ある”といえる。Xを正しく管理すればyも管理することが
できる。

正の相関がありそう

 

散布図サンプル2

xが増えると傾向的にyも増えているように見えるので”正の相関があるそうだ”といえる。

但し点の並びが直線的でないのはyの値がx以外にも影響を受けていると推測されます。
x以外の要因についても調査することが必要です。

負の相関がありそうだ

負の散布図2

xが増えると傾向的にyも減少しているように見えるので”負の相関があるそうだ”といえる。
但し点の並びが直線的でないのはyの値がx以外にも影響を受けていると推測されます。
x以外の要因についても調査することが必要です。

相関がない

sanpu13

xが増えがない”と いいます。x以外のyに影響する要因を見つけることが大切です。

 

 

散布図を見るときの注意事項

異常点がないか?

全体のならびから異常に飛び離れている点があればその原因を調べること。多くの場合測定誤り、不良品混入などの特別な原因なのでその際はそのデーターを省くこと。

 散布図サンプル3

層別の有無

散布図サンプル4
   全体としてみると相関がないようだが層別すると相関がある場合や逆に相関がありそうだが層別すると相関がない場合があるので散布図を作成する前に層別について検討し点の色を変更するとか印を変更(○、●)する必要があります。

 

 

統計学の相関係数

2つのデーターの間に相関関係があるかどうかを数値的に判断するには相関係数と呼ばれる指標を利用する。

変数x, yのデータがn組あるとき、つまり(X1,Y1)(X2,Y2)・・・・(Xn,Yn)相関係数は下記の式で表せる。

相関係数 計算式

*つまり、相関係数は共分散SxyをXの標準偏差SxとYの標準偏差Syで割ったものである。

image010

相関係数は通常rと言う記号で表示されー1から1までの値をとる。

-1 ≦ r ≦ +1

Excelで相関係数を計算するには、correl という関数を使 =correl(範囲1,範囲2)
相関係数は対になっている量に対して与えられるもので、範囲1と範囲2は並んでいなけれなりません。

 相関に関する検定と推定

サンプルから求めたrは試料相関係数であって母集団の相関係数ρと一致するわけではない。
そこで母集団の相関の有無を正しく判断するために試料相関係数rの有意性の検定を行うことが必要になってくる。

相関に関する検定(無相関の検定)

1)仮説の設定

・帰無仮説 Ho:  母相関係数 ρ =0

・対立仮説 H1:  母相関係数 ρ≠0

2)検定統計量tの計算

・データーから相関係数rを計算する。

・相関係数rの自由度φを求める。
データーの対の数をnとすると

φ=n-2

・相関係数rとnより検定統計量tを算出する。

image018

3)有意確率Pを求める

検定統計量tから有意確率P(%)を求める

t分布表もしくはExcel関数(TDIST)を使用する。

4)帰無仮説の判定をする。

有意確率P(%)と有意水準α(%)の比較をし判定を下す

P(%)>α(% →採択 『母相関係数ρ=0と相関係数rの差がない』

P(%)≦α(% →不採 『母相関係数ρ=0と相関係数rの差がある』

t分布

有意確率Pを求める

有意確率Pを求める

相関に関する検定と推定(具体事例)

Exercise1:
サンプル組数が24、相関係数が0.476の時、母相関係数が0であるか
を検定てください。
<仮説の設定>
・帰無仮説 Ho:  母相関係数 ρ =0

・対立仮説 H1:  母相関係数 ρ≠0
<計算>

相関係数r 0.48
サンプル組数 24
自由度 22
検定統計量to 2.54 ← 計算式'(ABS(r)*SQRT(n-2))/SQRT(1-r*r)
有意確率P ### ← TDIST(to *両側検定

<判定:  P=1.87% α(%)=5%

∴P≦α

→不採択 『母相関係数ρ=0と相関係数rの差がある』

つまり有意水準5%で有意差がある。

<説明>

相関係数r 0.476 自由度φ=22のときの検定統計量toは2.53869であるから図Aのようなt分布となる。(両側確率:1.87%)

一方、図Bは検定統計量toは2.538689の時のt分布である(両側確率:5%)

母相関係数ρがゼロの場合でも、相関係数rは-1から1の間でばらつくがB図のように有意水準を5%として信頼区間を表現すると黄色部分が95%の信頼区間となりこの範囲に入れば帰無仮説 Ho:  母相関係数 ρ =0 は採択される。

けれども例題の場合は95%の信頼区間の外にあるために仮説は破棄される。
但し有意水準を1%とした場合は採択される。

相関に関する検定と推定

相関に関する検定と推定

 母相関係数の区間推定

1)相関係数rをZ変換した値Z(フィシャーのZ変換)をz変換図表もしくは’Excel関数FISHERを用いて求める。

2)母相関係数をZ変換した値ξ(フィシャーのZ変換)の信頼度95%の信頼限界を次式より求める

image024

3)ξの信頼限界を逆変換して母相関係数の信頼限界を求める。

*z変換図表もしくは’Excel関数FISHERINVを用いて求める。

参考文献:QSS-普通科テキスト 統計的手法   日本規格協会

動画 散布図の書き方と相関

おすすめソフト エクセル統計2015

搭載機能:基本統計、1標本の推定と検定、2標本の比較、集計表の作成と分析、分散分析・多重比較、ノンパラメトリック検定、生存分析・ハザード分析、時系列分析・曲線のあてはめ、多変量解析、管理図・ROC曲線、特殊なグラフ、ユーティリティなど。

統計データはおもしろい! -相関図でわかる経済・文化・世相・社会情勢のウラ側

関連コンテンツ