ND4J (software) とは

ND4Jは、Java仮想マシン(JVM)上で動作し、Java、Scala、およびClojure言語と互換性がある、プログラミング言語C ++で書かれた科学計算ライブラリです。 ND4Jは2017年10月にEclipse Foundationに寄稿されました。
ND4Jは、プロダクション環境で線形代数と行列操作を実行するためのもので、Apache HadoopとSparkを統合してCPU(中央演算処理装置)やGPU(グラフィック処理ユニット)を処理するためのものです。 JVMベースの言語用のn次元配列をサポートしています。
ND4Jは、Apache License 2.0でリリースされた無料のオープンソースソフトウェアであり、主にAdam Gibsonが率いるDeeplearning4jを構築したサンフランシスコのグループによって開発されました。これはApache Software Foundationライセンスの下で作成されました。

Distributed R とは

Distributed Rは、R言語用のオープンソースの高性能プラットフォームです。実行時間を短縮し、大きなデータセットを分析するために、複数の処理ノード間でタスクを分割します。分散Rは、分散データ構造、分散データの関数を実行する並列性プリミティブ、タスクスケジューラ、および複数のデータローダを追加することでRを強化します。これは主に、機械学習タスクの分散バージョンを実装するために使用されます。 Distributed RはC ++とRで書かれており、Rの使い慣れた外観を保ちます.Hewlett-Packard(HP)は2015年2月現在、Verticaデータベースの高速データローダーなど独自の追加機能を備えたDistributed Rのエンタープライズサポートを提供します。

Programming with Big Data in R とは

R(pbdR)のビッグデータによるプログラミングは、一連のRパッケージであり、高性能の統計計算を使用してビッグデータによる統計計算を行う環境です。 pbdRは、統計ソフトウェアを開発するために統計学者とデータマイナーの間で使用されるS3 / S4クラスとメソッドで、Rと同じプログラミング言語を使用します。 pbdRとRコードの大きな違いは、pbdRは主に複数のプロセッサに分散され、バッチモードでデータが分散される分散メモリシステムに焦点を当てる一方、プロセッサ間の通信は大規模な高性能コンピューティング(HPC)システム。 Rシステムは、主に、GUIインタフェースなどのインタラクティブモードによるデータ解析用のシングルマルチコアマシンに重点を置いています。
MPIを使用するRの主な2つの実装は、pbdRのRmpiとpbdMPIです。
 pbdMPI上に構築されたpbdRは、すべてのプロセッサがワーカーとみなされ、データの一部を所有するSPMD並列処理を使用します。 1980年代半ばに導入されたSPMD並列処理は、大規模なデータのための同種のコンピューティング環境では特に有効です。たとえば、大規模な行列で特異値分解を実行する、高次元の大規模データに対してクラスタリング分析を実行するなどです。一方、SPMD並列処理環境では、マネージャ/ワーカー並列処理を使用する制限はありません。 Rmpiは、1つのメインプロセッサ(マネージャ)が他のすべてのプロセッサ(ワーカー)の制御としてサーバを管理するマネージャ/ワーカー並列処理を使用します。 2000年初頭に導入されたマネージャ/ワーカーの並列処理は、ブートストラップ法やi.i.d以降の適用統計のモンテカルロシミュレーションなど、小さなクラスタでの大規模な作業に特に効率的です。仮定は、ほとんどの統計分析で一般的に使用されます。特に、異種コンピューティング環境では、タスクプルパラレル化はRmpiの方が優れたパフォーマンスを示します。
SPMD並列化の考え方は、すべてのプロセッサが同じ量の作業を行うことですが、大規模なデータセットの異なる部分に適用することです。たとえば、最新のGPUは、比較的小さなデータの異なる部分に同じ計算を単純に適用できる低速コプロセッサの大規模な集まりですが、SPMDの並列処理は最終的なソリューションを得るための効率的な方法で終わります(つまり、短い)。 pbdRは小規模クラスタに適しているだけでなく、大きなデータを分析する上でより安定しており、スーパーコンピュータではよりスケーラブルであることも明らかです。要するに、pbdR
 RのRmpi、Snow、Snowfall、do-like、Rの並行パッケージはインタラクティブコンピューティングやマスタ/ワーカーに重点を置いていませんが、SPMDとタスクの並列処理の両方を使用することはできません。

CellCognition とは

CellCognitionは、バイオイメージインフォマティクスおよびシステム顕微鏡の分野におけるハイスループット蛍光顕微鏡(時間経過)画像の定量分析のための無料のオープンソースの計算フレームワークです。 CellCognitionフレームワークは、単一細胞追跡および細胞形態の分類のための画像処理、コンピュータビジョンおよび機械学習技術を使用する。これは、細胞相の時間的進行の測定、細胞動態のモデル化、および表現型マップの生成を可能にする。

Pipeline Pilot とは

Pipeline Pilotは、Accelrys Enterprise Platformのオーサリングツールです。これは科学的な視覚的およびデータフロープログラミング言語であり、ケミンモデムおよびQSAR、次世代シーケンシング、画像解析、テキスト解析などのさまざまな科学分野で使用されています。

Aphelion (software) とは

Aphelion Imaging Software Suiteは、画像処理および画像解析アプリケーションに対応するための3つの基本製品(Aphelion Lab、Aphelion Dev、およびAphelion SDK)を含むソフトウェアスイートです。このスイートには、イメージング技術の恩恵を受ける特定の垂直アプリケーションを実装するための一連の拡張プログラムも含まれています。
Aphelionソフトウェア製品は、アプリケーションのプロトタイプおよび展開に使用することができます。また、処理およびビジュアライゼーション・ライブラリとしてDLLまたは.NETコンポーネントとしてコンポーネントを利用できるため、ユーザーのシステム全体または一部に統合することもできます。

ELKI とは

ELKI(Index-StructuresでサポートされているKDDアプリケーションの開発環境)は、もともとHans-Peter教授のデータベースシステム研究部門で研究と教育のために開発されたデータベース(KDD、 "データマイニング")ソフトウェアフレームワークの知識発見です。ミュンヘン、ルートヴィッヒ・マクシミリアン大学のクリエゲル。高度なデータマイニングアルゴリズムの開発と評価、およびデータベースインデックス構造との相互作用を可能にすることを目的としています。

Zeroth (software) とは

Zerothは、クアルコムの脳を中心としたコンピューティングのプラットフォームです。これは、ニューラルプロセッシングユニット(NPU)AIアクセラレータチップとプラットフォームと相互作用するソフトウェアAPIをベースにしています。これは、モバイルデバイスで利用可能な深い学習と呼ばれる機械学習の一形態を作ります。これは、音声認識を含む画像および音声処理に使用されます。このソフトウェアは、クラウドアプリケーションとしてではなく、ローカルで動作します。
クアルコムは、2015年3月、次世代携帯デバイスチップであるSnapdragon 820プロセッサとソフトウェアをバンドルすると発表しました。