SC情報セキュリティマネジメントの推進又は支援に関すること · 情報セキュリティに関する動向・事例の収集と分析

データポイズニング

Data Poisoning

でーたぽいずにんぐ

AIモデルの学習に使用される訓練データに悪意のあるデータを混入させることで、モデルの判定精度を低下させたり、特定の誤動作を引き起こす攻撃手法。敵対的サンプルが推論時の攻撃であるのに対し、データポイズニングは学習時の攻撃である点が異なる。

共有:

関連キーワードの用語

機械学習モデルに対し、人間には知覚できない微小なノイズや変更を入力データに加えることで、AIの判定結果を意図的に誤らせる攻撃手法、またはそのために加工されたデータ。画像認識の誤判定誘導やマルウェア検知の回避などに悪用される。推論時（利用時）の攻撃に分類される。

大規模言語モデル（LLM）などの生成AIに対して、悪意のある指示や入力を与えることで、本来の制約やガードレールを回避させ、意図しない動作や情報漏えいを引き起こす攻撃手法。直接的な入力によるものと、外部データに攻撃文を埋め込む間接的なものがある。

AI技術（特にディープラーニング）を用いて、人物の顔や声を精巧に合成・改変する技術、またはその生成物。ビジネスメール詐欺（BEC）やなりすましによるソーシャルエンジニアリング攻撃に悪用されるリスクがあり、音声・映像の真正性検証が課題となっている。

AI技術を攻撃ツールとして悪用するサイバー攻撃の総称。ディープフェイクによるなりすまし、AIによるフィッシングメールの自動生成、マルウェアコードの生成、脆弱性の自動探索などが含まれる。IPA「情報セキュリティ10大脅威 2026」で初めてランクインした新たな脅威カテゴリである。

機械学習においてデータの特徴を数値化したもの。画像であれば色やエッジ、テキストであれば単語の出現頻度など、学習や予測に使う入力データの属性を表す。

コンピュータがデータからパターンや規則性を自動的に学習し、予測や判断を行う技術。教師あり学習・教師なし学習・強化学習の3種類に大別される。