データレイク
Data Lake
でーたれいく
他の資格での定義
構造化・半構造化・非構造化データをそのままの形式で大量に蓄積するストレージ基盤。データウェアハウスと異なり、事前のスキーマ定義なしにデータを格納し、必要時に加工・分析を行う。
構造化データ、半構造化データ、非構造化データを元の形式のまま一元的に蓄積する大規模ストレージ。データウェアハウスとは異なりスキーマを事前に定義せず、分析時に必要に応じてデータを整形する。
構造化データ、半構造化データ、非構造化データを元の形式のまま大量に蓄積するストレージ基盤。データウェアハウスと異なり、格納時にスキーマを定義する必要がなく(スキーマオンリード)、多様なデータソースからの生データを柔軟に保持できる。
構造化データ・非構造化データを問わず、生データをそのままの形式で大量に蓄積するストレージ基盤。データウェアハウスが事前にスキーマを定義して格納するのに対し、データレイクはスキーマオンリードの方式で柔軟な分析を可能にする。
構造化・半構造化・非構造化を問わず、あらゆるデータを元の形式のまま一元的に蓄積する大規模データストレージ。データウェアハウスと異なり、格納時にスキーマを定義する必要がなく、分析時にスキーマを適用する(スキーマオンリード)。
関連キーワードの用語
NANDフラッシュメモリを記録媒体とするストレージデバイス。HDDに比べて高速アクセス、低消費電力、耐衝撃性に優れる。ウェアレベリング、ガベージコレクション、TRIM等の管理技術が組み込まれている。組込みシステムではeMMCやUFSが利用される。
データをファイルとディレクトリの階層構造で管理するソフトウェア。組込み向けにはFATFS、LittleFS(フラッシュメモリ向け、ウェアレベリング対応)、JFFS2/UBIFS(NANDフラッシュ向け)などがある。ログ保存やデータ記録に使用される。
特定の機能を実現するために、家電製品、自動車、産業機器などの機器に組み込まれたコンピュータシステム。汎用コンピュータと異なり、リアルタイム性、省電力性、小型化、高信頼性などの制約の下で設計される。
定められた時間制約内に処理を完了することが要求されるシステム。ハードリアルタイム(時間制約違反が致命的)とソフトリアルタイム(時間制約違反が許容範囲内)に分類される。組込みシステムの多くがリアルタイム性を要求される。
ハードウェアに組み込まれた制御用ソフトウェア。ROMやフラッシュメモリに格納され、機器の基本的な動作を制御する。ソフトウェアとハードウェアの中間的な存在であり、OTA(Over-the-Air)更新などにより書き換え可能な場合もある。
Linuxカーネルを組込みシステム向けにカスタマイズしたOS。オープンソースで柔軟なカスタマイズが可能であり、ネットワーク機能やファイルシステムが充実している。リソースの豊富な組込み機器(ルータ、デジタル家電等)で広く利用される。