Brill tagger とは

Brillタグは、品詞タグ付けのための帰納的方法である。 1993年の博士論文でEric Brillによって記述され発明されました。これは、「エラー駆動の変換ベースのタグ」として要約することができます。それは:
 エラーを最小限に抑えることを目的とした教師あり学習の一形態。タグは各単語に割り当てられ、事前定義されたルールのセットを使用して変更されるという意味での変換ベースのプロセスです。
変換プロセスでは、単語がわかっている場合は、最初に最も頻繁にタグを割り当てるか、単語が不明の場合はタグ「noun」を割り当てます。これらのルールを何度も繰り返し適用し、間違ったタグを変更すると、非常に高い精度が達成されます。このアプローチは、語の形態論的構成のような貴重な情報が自動タグ付けプロセスに用いられることを保証する。