データー Data

Google Translator
スポンサーリンク
データー
スポンサーリンク

データー Data

ある目的のために集められた資料.画像情報を集めた画像データ,自由形式で書かれた文章もデータであるが,通常は,数値化された(あるいは数値化できる)情報をさす.
  データは幾つかの観点から分類を行うことができる.収集のために計画された工場試験,臨床試験,農事試験などの実験に基づいて得られる実験データ,世論調査やアンケート調査によって得られる調査データ,実験や調査とは異なり,積極的に対象に働きかけることのない観察によって得られる観察データという区別は,収集の仕方による分類である.
 一つの対象について継時的に観測を行うことによって得られる縦断的データ
(時系列データ),時点を固定し複数の対象を観測して得られる横断的(クロスセ
クショナル)データという分け方も可能である.一つの対象について幾つの特性
が観測されているかによって,1変量データ,2変量データ,多変量(多次元)データという区別もできる.多変量データは,各対象を行,各特性を列とした行列の表で表せる.
 各特性値の測定の尺度によって分類を行うことも可能である.重さ・長さのよ
うに連続量で測られ,かつ原点Oに意味がある(比に意味がある)尺度を比例尺度,連続ではあるが,原点Oに意味がない(差のみに意味がある)間隔尺度といい,両者をまとめて連続尺度という.性別のように属性で示される尺度を名義尺度,良化・不変・悪化のように属性ではあるが,その間に自然な順序のあるものを順序尺度といい,両者をまとめて離散尺度あるいは分類尺度という.
 離散尺度で測られた特性をもつ多変量データのことを分類(カテゴリカル)デー
タと呼ぶが,これは多重クロス表にまとめることができる.分類データにおいて,
各特性をアイテム,特性のそれぞれの水準(属性)をカテゴリーと呼ぶこともある.
ある対象がある属性をもつとき1,それ以外のときOとすれば,離散的な多変量
データは0,1からなる行列で表される.これをアイテムカテゴリーデータと呼ぶ.
 対象の数がどの程度かという量の問題も重要であるが,データの質に基づく分
類も解析の上では重要である.特に欠測値の頻度や,データの精度が問題となる.
打切り(センサー)を伴ったり,切られたけランケート)分布からの特性値を含む
ときには,特別な考慮が必要となる.

スポンサーリンク
facebook