第16回 データの種類


いわゆるビッグデータ時代と言われるように大量のデータが扱えるようになった今だからこそ、そもそもデータとは何か?ということをあえて問いかけてみたいと思います。

まず、一言でデータといっても様々な種類のものがあります。

例えば、野球選手の背番号。これは、名義データに当たります。名義データとは、それぞれ固有のものを分類するために用いられ、数字そのものには意味がありません。質的データともいわれます。

質的データには、もう一つ「順序データ」があります。ランキングで用いられる1位や2位などがこれに当たります。理由は後述しますが、質的データは計算に使えないものと考えてください。

これに対して、一定の間隔を保っているものが「間隔データ」です。温度(℃)や長さ(cm)など、データ間の間隔が等しく表せるもののことをいいます。計算して意味のある、量的データとも言います。

質的データは、なぜ計算しても意味がないのか、例を挙げてみていきましょう。例えば、サッカーJリーグのチームごとの成績について論じている記事があったとします。成績は、過去10年間の優勝回数と平均順位が記載されているとします。

優勝回数は、0~10までの等間隔データになりますので、意味がありますが、平均順位は、1位以下は同率の場合もあり、等間隔で評価されていないため、データとしての意味がありません。極端な話、1位以下が全て同率2位だった場合、評価のしようがないということです。

計算しても意味のないデータ(質的データ)を根拠に議論を展開してしまうと議論自体が意味のないものになってしまいます。しかし、実際テレビや雑誌で行われている調査でも、このようなデータの誤用は意外と頻繁に見受けられます。何かしらのデータ分析を目にした際は、取り扱っているデータの種類を確認し、意味がある計算なのか?を自問自答することで、分析の目は鍛えられるはずです。ぜひこの機会に、その特訓を行ってみてはいかがでしょうか♪

ビジネスマン
同じ数字でも、どういう意味合いの数字なのかをしっかり把握することが議論の大前提なんですね。

次回は、「商品戦略」についてお話します!

C級のオフィシャルテキストが改訂2版になりました!

当検定のホームページリニューアルと同時にC級のオフィシャルテキストが改訂2版になりました!