かたより(偏り) bias 【イラスト図解】
英語:bias 中国語:偏差
かたより(偏り)とは
推定量の分布の中心と真の値との差。
観測値・測定結果の期待値から真の値を引いた差.」(Z 8101-2)
統計学においては,ある母数に対する推定量の期待値とその真の値との差という限定した意味でかたより(偏り)という言葉を用いる。バイアスともいう。
すなわち推定量をT,母数をθとしたとき,E(T)-θ がかたより(偏り)である。かたよりがないことを不偏(unbiased)といい,不偏な推定量のことを不偏推定量と呼ぶ。
かたよりが生じる原因としては,
①推定量自身の問題
②サンプリング誤差
③測定誤差などが考えられる。
引用先:クォリティーマネジメント用語辞典 日本規格協会
偏り(正確さ)とバラツキ(精度)
偏りとは、 正確さ とも呼ばれ、測定値の 平均値 とあらかじめ認められた基準値との差を意味します。偏り=正確さの欠如であります。
一方、バラツキは各測定データが、平均的に、どれぐらい平均値から離れているのかを指標化したものです。
平均値から大きく離れた測定データの場合は、各データと平均値の差が大きくなります。 このようなデータが多い場合には、分散が大きくなり、データのばらつきは大きいといえます。
つまり、偏り(かたより)は測定値が測定対象の真の値からどれだけ平均的にずれているかを、ばらつきは測定値の広がりを表しています。
実際の測定値の一つ一つの値は、それがどれだけ真の値からずれているか分かりません。 しかし、平均的にどれだけずれているか分かれば、それを補正することができますから、より正確な測定を行うことができます。
砂糖袋(重量:1㎏)の重量の正規分布のイメージが下記の図です。
次は投げ矢(ダーツゲーム)にて解説します。
①がバイアス(偏り)は小さく、精度は高い 上手な投げ方の人です。
②はバイアス(偏り)は大きいが、精度は高い人。
③は一番悪い投げ方、バイアス(偏り)は大きいし、精度も低い。
かたより(バイアス)の種類
かたより(偏り)の種類には,選択バイアス,情報バイアス,交絡バイアスの3つがあり,対象の選択,データの収集,結果の分析などで起こりやすいとされています。
選択バイアス
観察するサンプリング(抽出)された集団が、全体の様子を反映していない偏りのことを「選択バイアス」といいます。
情報バイアス
情報バイアスは,調査や測定によってデータを収集するときに生じるバイアスであり、情報の取り違いや測定方法が不十分であるために一方向に偏って測定結果がでてしまう偏りです。
交絡バイアス
交絡とは要因と結果の両方に影響を及ぼすもので、その結果、一見関係のない要因と結果に因果関係があるように見えてしまいます。
例えば,ある集団を抽出・調査したときに,アルコール飲用と肺がんに正の関連(アルコールを飲む人が肺がんになっている)があったとする.しかし,これは真の因果関係ではなく,喫煙する人がアルコールをよく飲む傾向があり,喫煙が肺がんを引き起こすために生じている関連である。
このように交絡バイアスを生じさせる第三の要因のことを交絡要因(confounder, confounding variable)と呼んでいる。
偏りと 片寄りの違い
「偏り」は,ある基準から一方に寄っていることです、抽象的な言葉です。
統計学上のかたより(系統誤差)は下図に示される量を表しており「正確であるが、精密ではない」「精密であるが、正確ではない」といった用られかたをされています。
一方、「片寄り」は,真ん中から外れて片方に寄っていることです、主に物や形に使います。
ブックマーク