Applicability domain とは

QSARモデルの適応可能領域(AD)は、モデルの訓練セットが開発された物理化学的、構造的または生物学的な空間、知識または情報であり、新しい化合物の予測に適用可能である。
ADの目的は、モデルの仮定が満たされているかどうか、どの化学物質に対してモデルが確実に適用可能かどうかを示すことです。一般に、これは外挿ではなく補間の場合です。現在までに、ADを決定するための一般的に受け入れられているアルゴリズムは一つではない:包括的な調査は、ECVAMワークショップ52の報告書および勧告に見出すことができる。補間領域を定義するためのかなり体系的なアプローチが存在する。このプロセスは、外れ値の除去と、カーネル加重サンプリングを用いた確率密度分布法とを含む。回帰QSARモデルの構造ADに対するもう1つの広く使用されているアプローチは、モデリング分子記述子のハット行列の対角値から計算されたレバレッジに基づく。いくつかのADアルゴリズムの最近の厳密なベンチマーク研究では、モデル予測の標準偏差が最も信頼性の高いアプローチであることが確認されています。化学物質の訓練セットのADを調べるために、訓練化合物の多変量記述子空間の特性を直接的に、または距離(または類似性)メトリクスを介して間接的に分析することができる。距離メトリックを使用する場合は、直交した有意なベクトル空間を使用するように注意する必要があります。これは、フィーチャ選択と逐次的な主成分分析の異なる手段によって達成することができる。