Data curation とは

データキュレーションとは、さまざまなソースから収集されたデータの編成や統合、データの注釈付け、データの公開と提示に関連するプロセスや活動を示して、データの価値が時間の経過とともに維持されるようにするための広い用語です。データは再利用と保存のために利用可能なままです。データのキュレーションには、「原則的に制御されたデータの作成、保守、管理に必要なすべてのプロセスと、データに価値を付加する能力」が含まれます。科学において、データキュレーションは、専門家による研究論文などの科学テキストから重要な情報を抽出し、生物学的データベースの入力などの電子形式に変換するプロセスを示す場合があります。
大規模なデータの現代では、データのキュレーションがより顕著になりました。特に、大容量で複雑なデータシステムを処理するソフトウェアの場合に顕著になりました。この用語は、歴史的用途や人文科学分野でも使用されています。デジタル人文プロジェクトからの文化的および学術的データの増加には、データキュレーションの専門知識と分析的実践が必要です。広い意味で、キュレーションとは、コンポーネントを作成、管理、保守、検証するために行われる一連のアクティビティーとプロセスを意味します。具体的には、データのキュレーションは、保存する価値のある情報と保存する期間を決定する試みです。