データマイニングとは
データマイニングとは、大量のデータの中から、役に立つ知識を取り出すことです。そもそもデータマイニングのマイニングには、採鉱や採掘といった意味があります。つまり、大量のデータの中から役立つ情報を発掘することが、データマイニングなのです。
大量のデータから役立つ情報を得るデータマイニングは、データ分析と同じだと思われるかもしれません。ですが、データマイニングとデータ分析には、明確な違いがあります。
データ分析では、まず分析を始める前にある仮説を立て、その仮説が間違っていないか検証を行います。しかし、データマイニングは仮説を立てず、目の前にあるデータの中から事実だけを抽出するのです。
事前に仮説を立てずに事実だけを掘り出すので、仮説検証型と言われるデータ分析とは違い、データマイニングとは仮説発見型と言われることもあります。
データマイニングの実例で有名なのは、ビールとおむつです。
ビールとおむつは一見すると、無関係に思える商品です。しかし、アメリカにある大手スーパーが販売データの分析をしてみると、ビールとおむつを一緒に買う顧客が多いことが分かりました。そこでビールと紙おむつを売り場で並べて販売したところ、スーパーの売り上げは上昇しました。
ビールとおむつの売り上げが結びついている理由は、母親が父親におむつの購入を頼んで、来店した父親がおむつを買うついでにビールを買っていたからと言われています。
一般的なデータの分析では、始めにこうした顧客の行動理由を考えてから、データを分析し正しいのか判断するでしょう。しかし、データマイニングでは事実に対する理由は、後から考えるのが基本です。データ分析なら、最初に仮説を立てて分析し検証を行いますが、データマイニングでは、分析して取り出した事実から仮説を発見するのです。
蓄積したデータは、仮説を元に検証し分析するのが一般的です。しかし、分析者の想像もつかないような事実も、データの中には存在しています。そうした事実は、仮説を立てて検証するだけでは見つけることができません。そんな場合、蓄積したデータの中から事実を見つけ出すデータマイニングを活用することで、仮説を発見することができる可能性があります。
マーケティングなどにデータを活用するなら、データマイニングも使いながら、役立つ情報を取り出すことが大切です。データマイニングとは、これまで想像もできないような新しい情報を探したいときに、向いているデータ分析の手法と言えるでしょう。