Gene prediction とは

計算生物学において、遺伝子予測または遺伝子発見は、遺伝子をコードするゲノムDNAの領域を同定するプロセスを指す。これには、タンパク質コード遺伝子およびRNA遺伝子が含まれるが、調節領域などの他の機能的要素の予測も含まれ得る。遺伝子の発見は、一度それが配列決定された種のゲノムを理解するための最初の最も重要なステップの1つである。
初期の「遺伝子の発見」は、生きている細胞や生物に対する苦労した実験に基づいていました。いくつかの異なる遺伝子の相同組換え率の統計的分析は、ある染色体上のそれらの秩序を決定することができ、このような多くの実験からの情報を組み合わせて、既知の遺伝子のおおよその位置を特定する遺伝地図を作成することができる。今日、包括的なゲノム配列と強力な計算資源を用いて、研究コミュニティの処分で、遺伝子発見は大部分計算上の問題として再定義されました。
配列が機能的であることを決定することは、遺伝子またはその産物の機能を決定することとは区別されるべきである。バイオインフォマティックス研究のフロンティアは、その配列だけに基づいて遺伝子の機能を予測することがますます可能になっているが、遺伝子の機能を予測し、遺伝子予測が正確であることを確認することは、遺伝子ノックアウトおよび他のアッセイによってインビボ実験を依然として要求する。
遺伝子予測は、配列アセンブリ、非コード領域のフィルタリング、および反復マスキングに続く、ゲノム注釈の重要なステップの1つである。
遺伝子予測は、DNA結合タンパク質(転写因子)がどのようにゲノム内の特異的結合部位を見つけるかを調べる、いわゆる「標的探索問題」と密接に関連している。構造遺伝子予測の多くの局面は、細胞内の基礎的な生化学的プロセス、例えば、転写転写、プロテオミクス、転写、転写、転写、転写、翻訳などの様々なオミックス分野で活発な研究が行われている遺伝子転写、翻訳、メタボロミクス、より一般的には構造的および機能的なゲノミクスを含む。