バイアス(偏り) bias 【イラスト図解】
英語:bias 中国語:偏差
バイアス(偏り)とは
バイアス(bias)とは、一般的に「偏り」「偏見」「先入観」などを意味し、認識の歪みや偏りを表現する言葉として使われます。
統計学上はデータの母集団や標本、分析結果から立てられる仮説などに生じる偏りを意味します。
バイアス(正確さ)とバラツキ(精度)
バイアスとは、 正確さ とも呼ばれ、測定値の 平均値 とあらかじめ認められた基準値との差を意味します。偏り=正確さの欠如であります。
一方、バラツキは各測定データが、平均的に、どれぐらい平均値から離れているのかを指標化したものです。
平均値から大きく離れた測定データの場合は、各データと平均値の差が大きくなります。 このようなデータが多い場合には、分散が大きくなり、データのばらつきは大きいといえます。
つまり、バイアスは測定値が測定対象の真の値からどれだけ平均的にずれているかを、ばらつきは測定値の広がりを表しています。
実際の測定値の一つ一つの値は、それがどれだけ真の値からずれているか分かりません。 しかし、平均的にどれだけずれているか分かれば、それを補正することができますから、より正確な測定を行うことができます。
砂糖袋(重量:1㎏)の重量の正規分布のイメージが下記の図です。
次は投げ矢(ダーツゲーム)にて解説します。
①がバイアス(偏り)は小さく、精度は高い 上手な投げ方の人です。
②はバイアス(偏り)は大きいが、精度は高い人。
③は一番悪い投げ方、バイアス(偏り)は大きいし、精度も低い。
かたより(バイアス)の種類
かたより(偏り)の種類には,選択バイアス,情報バイアス,交絡バイアスの3つがあり,対象の選択,データの収集,結果の分析などで起こりやすいとされています。
選択バイアス
観察するサンプリング(抽出)された集団が、全体の様子を反映していない偏りのことを「選択バイアス」といいます。
情報バイアス
情報バイアスは,調査や測定によってデータを収集するときに生じるバイアスであり、情報の取り違いや測定方法が不十分であるために一方向に偏って測定結果がでてしまう偏りです。
交絡バイアス
交絡とは要因と結果の両方に影響を及ぼすもので、その結果、一見関係のない要因と結果に因果関係があるように見えてしまいます。
例えば,ある集団を抽出・調査したときに,アルコール飲用と肺がんに正の関連(アルコールを飲む人が肺がんになっている)があったとする.しかし,これは真の因果関係ではなく,喫煙する人がアルコールをよく飲む傾向があり,喫煙が肺がんを引き起こすために生じている関連である。
このように交絡バイアスを生じさせる第三の要因のことを交絡要因(confounder, confounding variable)と呼んでいる。
関連用語:かたより(偏り)
ブックマーク