White pages schema とは

ホワイト・ページ・スキーマは、ディレクトリ・サービス、データベース、またはアドレス帳などのアプリケーションのエントリに含まれるデータを編成するためのデータ・モデル、特に論理スキーマです。ホワイトページディレクトリでは、通常、各エントリは、電子メールを受信するか、システムにログインするためのアカウントを持つなど、ネットワークリソースを利用する個人を表します。環境によっては、スキーマに組織部門、役割、グループ、およびデバイスの表現も含まれる場合があります。この用語は、典型的には個人のホームロケーション(例えば、都市)によってソートされ、次にその名前によってソートされた電話帳における個人のリストであるホワイトページから導出される。
多くの電話サービスプロバイダは、電話帳に加入者のリストを数十年にわたって掲載していましたが、社内のディレクトリに従業員のリストを掲載していましたが、電子メールシステムが登場して以来、異なるシステム間の加入者情報の電子交換が現れた。
ホワイトページスキーマは、典型的には、表現されている各実世界オブジェクトに対して、
 そのオブジェクトのどの属性がそのオブジェクトのエントリに表されるか他のオブジェクトに対するそのオブジェクトの関係がどのように表現されるべきかDITの中でどのようにエントリの名前が付けられるかクライアントがエントリをどのように探し出すかどのように似たエントリを区別すべきかリストに表示されたときにエントリがどのように順序付けられるか
X.500仕様の一部であるX.520とX.521には、X.400のアドレス指定要件から導かれ、ディレクトリ情報ツリーが定義されていましたそれは住宅および組織の加入者を代表するエントリを持つ国際電話システムを反映しています。これは、RFC 2256でLightweight Directory Access Protocol標準スキーマに進化しました。組織コンテキストで個人を表すためにLDAPで使用される最も広く配布されているホワイトページスキーマの1つは、RFC 2798で定義されているinetOrgPersonです。Active Directoryのバージョンは、クラス、ユーザー。多くの大企業では、アイデンティティ管理アーキテクチャの一環として、社員または顧客向けに独自のホワイトページスキーマを定義しています。異なるスキーマを使用してデータベースとディレクトリを変換することは、多くの場合メタディレクトリの機能であり、Common Indexing Protocolなどのデータ交換標準です。
一部の初期のディレクトリ展開では、以下のようなホワイトページスキーマの設計上の選択肢が悪いために苦しんでいました。
 名前の目的に使用される属性は、大規模な環境(人の共通名など)では一意ではなく、社会保障番号などの個人情報の盗難につながる可能性のある(姓のような)ユーザーはプロビジョニング中に一意ではありますが依然として記憶に残る属性を選択する必要がありました
汎用ディレクトリでの使用に適したスタンドアロン定義としても、ネットワークプロトコルに組み込みとしても、多数の提案されたスキーマが存在します。
その他の一般的なホワイトページスキーマの例には、RFC 2426で定義されているvCardとFOAFがあります。

Relational data stream management system とは

リレーショナルデータストリーム管理システム(RDSMS)は、標準に準拠したSQLクエリを使用して、非構造化および構造化データストリームをリアルタイムで処理するように設計された、分散型のメモリ内データストリーム管理システム(DSMS)です。従来のRDBMSで実行され、結果と終了を返すSQLクエリとは異なり、RDSMSで実行されたSQLクエリは終了せず、新しいデータが利用可能になると結果が連続的に生成されます。 RDSMS内の連続したSQLクエリは、SQLウィンドウ機能を使用して、固定またはスライディングウィンドウ上でデータストリームを分析、結合、集約します。 Windowsは、時間ベースまたは行ベースとして指定できます。

SciDB とは

SciDBは、科学、地理空間、金融、および産業アプリケーションに共通する多次元データ管理と分析のために設計されたデータベース管理システム(DBMS)です。これはParadigm4によって開発され、チューリング賞を受賞したMichael Stonebrakerによって共同制作されました。

Big memory とは

大容量メモリは、大量のRAM(ランダムアクセスメモリ)メモリを搭載したマシン上で実行する必要があるサーバの負荷を表す用語です。ワークロードの例としては、データベース、メモリ内キャッシュ、グラフ分析などがあります。または、より一般的には、データサイエンスと大きなデータです。
データベースシステムの中には、大部分がメモリ内で実行されるように設計されており、ディスクやフラッシュメモリからデータを取得することはめったにありません。インメモリー・データベースのリストを参照してください。
大容量メモリシステムの性能は、CPUまたはCPUコアが従来のメモリコントローラまたはNUMA(非一様なメモリアクセス)を介してメモリにアクセスする方法に依存します。パフォーマンスは、CPUキャッシュのサイズとデザインによっても異なります。
パフォーマンスはOSの設計にも依存します。 Linuxの「巨大なページ」機能は、仮想メモリの効率を向上させることができます。 Linuxの新しい「透過的な巨大なページ」機能は、いくつかの大容量メモリのワークロードに対してより優れたパフォーマンスを提供します。 Microsoft Windowsの「ラージページサポート」により、サーバーアプリケーションは通常、ネイティブページサイズよりも3桁大きいラージページメモリ領域を確立できます。

Data architect とは

データアーキテクトは、データアーキテクチャの実践者であり、組織のデータアーキテクチャの設計、作成、展開、管理に関わる情報技術分野です。データ設計者は、さまざまなデータエンティティとITシステム、および何らかの方法でそのデータを使用または処理するアプリケーションによって、データの格納、消費、統合、および管理方法を定義します。これはビジネスアーキテクチャーと密接に関連しており、エンタープライズアーキテクチャーの4つのドメインの1つと考えられています。

Bitmap index とは

ビットマップ索引は、ビットマップを使用する特別な種類のデータベース索引です。
従来、ビットマップ索引は、カーディナリティーの低い列では、絶対的に、またはデータを含むレコードの数に比例して、わずかな数の別個の値を持つように機能すると考えられてきました。カーディナリティが低い極端なケースは、真偽値と偽値の2つの値を有するブール値データ(例えば、都市の居住者はインターネットアクセス可能か)である。ビットマップ索引は、ビット配列(通常はビットマップと呼ばれます)を使用し、これらのビットマップに対してビット単位の論理演算を実行することによってクエリに応答します。ビットマップ索引は、そのようなデータの問合せに対して、他の構造よりも大きなスペースとパフォーマンス上の利点があります。欠点は、データが頻繁に更新される列の伝統的なBツリー索引よりも効率が悪いことです。そのため、高速問合せに特化した読取り専用システム(たとえば、データ・ウェアハウス)で頻繁に採用されています。オンライントランザクション処理アプリケーション。
ある研究者は、ビットマップ索引は、読み取り専用の方法でアクセスされる中位または高位のカーディナリティ・データ(一意の値のデータなど)にも役立ち、問合せはAND、ORまたはXORを使用して複数のビットマップ索引付けされた列にアクセスする演算子は広範囲に及ぶ。
ビットマップ索引は、大規模なファクト表をスタースキーマに配置されたものなどのより小さいディメンション表に結合するためのデータ・ウェアハウス・アプリケーションでも役立ちます。
ビットマップベースの表現は、グラフデータベース内のクエリに使用されるラベル付けされた属性付きマルチグラフであるデータ構造の表現にも使用できます。ビットマップインデックスに基づく効率的なグラフ管理では、ビットマップインデックス表現を使用して、データポイント)を生成し、グラフに関連する質問に効率的に応答する。

Data curation とは

データキュレーションとは、さまざまなソースから収集されたデータの編成や統合、データの注釈付け、データの公開と提示に関連するプロセスや活動を示して、データの価値が時間の経過とともに維持されるようにするための広い用語です。データは再利用と保存のために利用可能なままです。データのキュレーションには、「原則的に制御されたデータの作成、保守、管理に必要なすべてのプロセスと、データに価値を付加する能力」が含まれます。科学において、データキュレーションは、専門家による研究論文などの科学テキストから重要な情報を抽出し、生物学的データベースの入力などの電子形式に変換するプロセスを示す場合があります。
大規模なデータの現代では、データのキュレーションがより顕著になりました。特に、大容量で複雑なデータシステムを処理するソフトウェアの場合に顕著になりました。この用語は、歴史的用途や人文科学分野でも使用されています。デジタル人文プロジェクトからの文化的および学術的データの増加には、データキュレーションの専門知識と分析的実践が必要です。広い意味で、キュレーションとは、コンポーネントを作成、管理、保守、検証するために行われる一連のアクティビティーとプロセスを意味します。具体的には、データのキュレーションは、保存する価値のある情報と保存する期間を決定する試みです。

The Groundwork とは

グラウンドワークは、2014年6月に結成された非公開のテクノロジー会社、Michael Slabyによって運営されています。キャンペーンファイナンスの開示により、Hillary Clintonの大統領選挙はグラウンドワークのクライアントであることが明らかになりました。 Groundworkの従業員のほとんどは、Netflix、DreamHost、Googleなどのハイテク企業で経験を積んだバックエンドのソフトウェア開発者です。
グラウンドワークは、技術資源を使って有権者に関するデジタルデータを消費し、ヒラリークリントン大統領選挙キャンペーンがこれらの有権者を資金調達、広告、アウトリーチの対象とするための技術的手段を開発することによって、「近代運動の重要な機能」を担っています。将来の有権者のための顧客関係管理システムです。

Data recovery hardware とは

データリカバリソフトウェアは、データリカバリソフトウェアがすべての紛失または破損したデータファイルを処理する能力がないために開発されました。多くの場合、不良セクタを含むメディアファイル、ファームウェアの障害、PCB(プリント基板)の障害、ハードドライブのヘッドの障害などの障害を修正することはできません。