データマイニング
Data Mining
でーたまいにんぐ
他の資格での定義
大量のデータから統計的手法やAI技術を用いて、隠れたパターンや有用な知識を発見する技術。顧客の購買傾向の分析や不正検出などに活用される。
大量のデータから統計学やAI・機械学習の手法を用いて、未知のパターンや相関関係、有用な知識を自動的に発見する技術。マーケティング分析、顧客分析、リスク予測、不正検知などに活用される。
大量のデータから統計的手法やAI技術を用いて、隠れたパターンや関係性を発見する分析手法。クラスター分析、決定木分析、ロジスティック回帰分析、アソシエーション分析などの手法があり、経営戦略の意思決定やマーケティングに活用される。
大量のデータから統計的手法や機械学習を用いて、有用なパターンや知識を発見する技術。相関ルール分析、クラスタ分析、決定木、回帰分析などの手法がある。データウェアハウスと組み合わせて活用される。
関連キーワードの用語
SoRやSoEから得られたデータを分析・活用し、洞察(インサイト)を得るためのシステム。BI、データ分析基盤、AIなどが該当し、経営判断の高度化を支援する。
企業内外のデータを収集・蓄積・分析し、経営上の意思決定を支援する手法やシステムの総称。データウェアハウス、OLAP、ダッシュボードなどの技術を活用して、データに基づく経営判断を実現する。
母集団から一部の標本(サンプル)を抽出して調査・分析を行う手法。全数調査が困難な場合に、統計的に有効な結論を導くために用いられる。無作為抽出法や層別抽出法などがある。
データの収集や分析において、系統的な偏りが生じること。標本の偏り(選択バイアス)や測定方法の偏り(測定バイアス)などがあり、分析結果の妥当性を損なう原因となる。
従来のデータベース技術では処理が困難な大規模・多種多様・高速に生成されるデータの総称。Volume(量)、Variety(多様性)、Velocity(速度)の3Vで特徴づけられ、AIや機械学習と組み合わせた分析活用が進む。
目的変数が2値(有/無、成功/失敗など)の場合に、説明変数から目的変数の発生確率を推定する統計的分析手法。マーケティングにおける購買予測やリスク分析に活用される。