Binary code とは

バイナリコードは、テキスト、コンピュータプロセッサ命令、または2シンボルシステムを使用する他のデータを表す。使用される2シンボルシステムは、2進数システムの0および1であることが多い。バイナリコードは、各文字、命令などに2進数字のパターン(ビットとしても知られている)を割り当てる。たとえば、8ビットのバイナリ文字列は、 256の可能な値のいずれかであり、従って、様々な異なるアイテムを表すことができる。
計算および電気通信では、バイナリコードは、文字列などのデータをビット列に符号化するさまざまな方法に使用されます。これらのメソッドは、固定幅または可変幅の文字列を使用できます。固定幅バイナリコードでは、各文字、数字、または他の文字は、同じ長さのビット列で表されます。そのビットストリングは、通常、バイナリ番号として解釈され、8進、10進または16進表記でコード表に表示されます。多くの文字セットと多くの文字エンコーディングがあります。
2進数として解釈されるビット列は、10進数に変換できます。例えば、小文字aは、ビット列01100001(標準のASCIIコードのように)で表される場合、10進数97として表すこともできます。

Data in use とは

使用中のデータは、典型的にはコンピュータランダムアクセスメモリ(RAM)、CPUキャッシュ、またはCPUレジスタ内に非永続デジタル状態で格納されているアクティブデータを参照する情報技術用語である。
使用中のデータは、転送中のデータおよび安静時のデータという用語の補完として使用され、これらが一緒になってデジタルデータの3つの状態を定義する。

Schema-agnostic databases とは

スキーマに依存しないデータベースや語彙に依存しないデータベースは、データの表現から抽象化されたユーザーをサポートし、クエリとデータベースの自動セマンティック・マッチングをサポートします。 Schema-Agnosticismは、ユーザーの用語と構造で発行されたクエリをマッピングし、データセットボキャブラリに自動的にマッピングするデータベースのプロパティです。
サイズの増加とデータベーススキーマのセマンティクスの異質性により、ユーザーは構造化データを照会および検索するための新しい要件が生じます。このスケールでは、データ消費者がデータを表現するためにデータ表現に精通していることは、実行不能になる可能性があります。この議論の中心となるのは、ユーザーとデータベースの間のセマンティック・ギャップであり、データの規模と複雑さが増すにつれてより集中的になります。

Streaming data とは

ストリーミングデータは、さまざまなソースから連続して生成されるデータです。このようなデータは、すべてのデータにアクセスすることなくストリーム処理技術を使用して段階的に処理する必要があります。さらに、コンセプトドリフトがデータ内で発生する可能性があることを考慮する必要があります。これは、ストリームのプロパティが時間とともに変化する可能性があることを意味します。
これは通常、高速で多くの異なるソースによって生成される大きなデータのコンテキストで使用されます。

Data recovery hardware とは

データリカバリソフトウェアは、データリカバリソフトウェアがすべての紛失または破損したデータファイルを処理する能力がないために開発されました。多くの場合、不良セクタを含むメディアファイル、ファームウェアの障害、PCB(プリント基板)の障害、ハードドライブのヘッドの障害などの障害を修正することはできません。

Data at rest とは

情報技術の中にあるデータとは、物理的にどのようなデジタル形式(例えば、データベース、データウェアハウス、スプレッドシート、アーカイブ、テープ、オフサイトバックアップ、モバイルデバイスなど)に格納されている非アクティブなデータを意味します。
休止中のデータは、使用中のデータと通過中のデータという3つの状態のデジタルデータ(図1参照)を補完するものとして使用されます。

Data preservation とは

データの保存は、データの安全性と完全性の両方を維持し、維持する行為です。保存は、データとそのメタデータの存在と真正性を保護し、延長するための方針、規制、戦略によって管理される正式な活動を通じて行われます。データは、知識および情報が作成される要素またはユニットとして記述することができ、メタデータはデータ要素の要約サブセットです。またはデータに関するデータである。データ保存の主な目的は、データが失われたり破壊されないように保護したり、データの再利用と進化に貢献することです。

Distributional–relational database とは

分散リレーショナルデータベースまたはワードベクトルデータベースは、分布ワードベクトル表現を使用して構造化データの意味を豊かにするデータベース管理システム(DBMS)です。大規模なコーパスから自動的に分布する単語ベクトルを自動的に構築することができるため、大規模な常識的な背景知識を業務に組み込むことができるデータベースの構築を支援します。分布 – リレーショナル・モデルは、スキーマに依存しないデータベース(ユーザーがそのスキーマを意識することなくデータを照会できるデータベース)、意味検索、スキーマ統合、帰納的および誘導的な推論、および意味的に柔軟な知識表現モデルが必要である。純粋に論理的/セマンティックWebモデルよりも分散関係モデルの主な利点は、手動でキュートされたオントロジとルール知識ベースの定義とは対照的に、コア意味論的関連がコーパスから自動的に取り込まれるという事実です。

Data recovery とは

コンピューティングでは、データリカバリは、セカンダリストレージ、リムーバブルメディアまたはファイルからアクセスできない、紛失した、壊れた、破損した、またはフォーマットされたデータを通常の方法でアクセスできない場合に救済するプロセスです。データは、内蔵または外付けのハードディスクドライブ(HDD)、ソリッドステートドライブ(SSD)、USBフラッシュドライブ、磁気テープ、CD、DVD、RAIDサブシステム、その他の電子デバイスなどのストレージメディアから最も頻繁に回収されます。ストレージデバイスへの物理的な損傷やファイルシステムの論理的な損傷により、ホストオペレーティングシステム(OS)によってマウントされないようにするために、リカバリが必要な場合があります。
最も一般的なデータ復旧のシナリオには、オペレーティングシステムの障害、ストレージデバイスの誤動作、ストレージデバイスの論理的な障害、偶発的な損傷や削除などが含まれます(通常、シングルドライブ、シングルパーティション、シングルOSシステム)この場合、究極の目的は、損傷したメディアのすべての重要なファイルを別の新しいドライブにコピーすることだけです。これは、システムドライブとバックアップドライブまたはリムーバブルメディアをマウントし、ファイルマネージャまたは光ディスク作成ソフトウェアを使用してファイルをシステムドライブからバックアップメディアに移動する手段の多くを提供するLive CDを使用して簡単に実行できます。このようなケースは、ディスクパーティショニングによって軽減され、貴重なデータファイル(またはそれらのコピー)を交換可能なOSシステムファイルとは異なるパーティションに一貫して保存することができます。
別のシナリオには、ファイルシステムやドライブパーティションの破損、ハードディスクドライブの障害など、ドライブレベルの障害が含まれます。いずれの場合も、データはメディアデバイスから容易に読み取られません。状況に応じて、論理ファイルシステム、パーティションテーブルまたはマスターブートレコードの修復、またはファームウェアまたはドライブリカバリのテクニックのアップデートが含まれます。ソフトウェアベースの破損データのリカバリ、ハードウェアおよびソフトウェアベースの破損したサービスエリアのリカバリハード・ディスク・ドライブの「ファームウェア」とも呼ばれる)を物理的に損傷したドライブ上のハードウェア交換に使用し、新しいドライブへのデータの抽出を可能にします。ドライブのリカバリが必要な場合、ドライブ自体は通常永久的に故障しており、一度のリカバリではなく、何らかのデータを読み取ることができます。
第3のシナリオでは、ファイルはユーザによって記憶媒体から誤って「削除」されている。通常、削除されたファイルの内容は物理ドライブからすぐに削除されません。代わりに、ディレクトリ構造内のそれらへの参照が削除され、その後、削除されたデータ占有領域は、後のデータ上書きのために利用可能になる。エンドユーザーの意識では、標準のファイルマネージャでは削除されたファイルを検出できませんが、削除されたデータは技術的には物理ドライブに存在します。その間、元のファイルの内容は、多くの場合切断されたフラグメントのままであり、他のデータファイルによって上書きされなければ回復可能である可能性があります。
「データリカバリ」という用語は、暗号化されたデータや破損されていないデータが復元されるフォレンジックアプリケーションやスパイ活動のコンテキストでも使用されます。場合によっては、コンピュータの法医学的専門家によってのみ回復可能なウイルス攻撃のような理由により、コンピュータに存在するデータが暗号化または隠蔽されることがあります。

Compressed pattern matching とは

コンピュータサイエンスでは、圧縮パターンマッチング(略してCPM)は、圧縮データをほとんど、またはまったく抽出せずにパターンを検索するプロセスです。圧縮された文字列を検索するのは、圧縮されていない文字列を検索するよりも速く、スペースも少なくて済みます。