Machine learning in bioinformatics とは

データに基づいて予測を行う方法を学ぶアルゴリズムの開発を含むコンピュータサイエンスのサブフィールドである機械学習は、バイオインフォマティクスの分野において数多くの新興アプリケーションを有している。バイオインフォマティクスは、生物学的データを理解し処理するための計算上および数学的アプローチを扱っています。
機械学習アルゴリズムの登場に先立ち、バイオインフォマティクスアルゴリズムを手で明示的にプログラムしなければならず、タンパク質構造予測などの問題に対して非常に困難であることが判明しました。ディープ・ラーニングなどの機械学習技術は、アルゴリズムが自動フィーチャ学習を利用することを可能にします。つまり、データセットだけに基づいて、入力データの複数のフィーチャを複数のフィーチャを組み合わせてフィーチャのより抽象的なセットにする方法を学習できます。さらなる学習。入力データ内のパターンを学習するこの多層アプローチは、そのようなシステムが大規模なデータセットで訓練されたときにかなり複雑な予測をすることを可能にする。近年、利用可能な生物学的データセットのサイズと数が急増しており、バイオインフォマティクス研究者はこれらの機械学習システムを利用することができます。機械学習は、ゲノミクス、プロテオミクス、マイクロアレイ、システム生物学、進化、テキストマイニングの6つの主要なバイオインフォマティクス分野に適用されています。