Distributed R とは

Distributed Rは、R言語用のオープンソースの高性能プラットフォームです。実行時間を短縮し、大きなデータセットを分析するために、複数の処理ノード間でタスクを分割します。分散Rは、分散データ構造、分散データの関数を実行する並列性プリミティブ、タスクスケジューラ、および複数のデータローダを追加することでRを強化します。これは主に、機械学習タスクの分散バージョンを実装するために使用されます。 Distributed RはC ++とRで書かれており、Rの使い慣れた外観を保ちます.Hewlett-Packard(HP)は2015年2月現在、Verticaデータベースの高速データローダーなど独自の追加機能を備えたDistributed Rのエンタープライズサポートを提供します。