ロゴ

構造化データ

こうぞうかでーた

ひとことで言うと

あらかじめ定義されたスキーマに従い行と列で整理された、検索・分析が容易なデータ形式。

解説

リレーショナルデータベースのテーブルやCSVファイルのように、あらかじめ定義されたスキーマ(構造)に従って整理されたデータ。行と列で管理され、SQLなどで容易に検索・分析が可能である。テキスト、画像、動画などの非構造化データや、XMLやJSONなどの半構造化データと対比される概念である。

くわしく解説

構造化データとは、リレーショナルデータベースのテーブルやCSVファイルのように、あらかじめ定義されたスキーマ(データの型・形式・構造)に従って行と列の形式で整理されたデータを指す。SQLを用いた検索・集計・結合が容易であり、業務システムで広く利用されている。これに対し、テキスト文書・画像・動画・音声など形式が定まっていないデータを非構造化データと呼ぶ。XMLやJSONのように一定の構造を持ちつつ柔軟性もある半構造化データも存在する。ビッグデータの文脈では全データの約80%が非構造化データとされ、AIや機械学習によるテキストマイニングや画像認識で活用されている。中小企業診断士試験では3種のデータ分類と具体例の識別が問われる。

具体例で考えよう

販売管理システムの売上テーブルに「日付・商品コード・数量・金額」という列で記録されたデータは構造化データの典型例である。一方、顧客からのクレームメールや商品の写真は非構造化データにあたる。

試験対策ポイント

構造化・半構造化・非構造化データの3分類と具体例の対応が頻出。XMLとJSONが半構造化データに分類される点は要注意。ビッグデータとの関連(3Vや活用場面)も整理すること。

関連用語

経営情報システム」の他の用語