Word embedding とは

ワード埋め込みとは、自然言語処理(NLP)における語彙モデリングやフィーチャラーニング技術の総称であり、ボキャブラリの語句が実数のベクトルにマッピングされます。概念的には、単語ごとに1次元の空間から、はるかに低い次元の連続ベクトル空間への数学的埋め込みを含む。
このマッピングを生成する方法には、ニューラルネットワーク、単語共出現行列の次元削減、確率モデル、説明可能な知識ベース方法、および単語が現れるコンテキストの観点からの明示的表現が含まれる。
単語やフレーズの埋め込みは、基本的な入力表現として使用されるとき、構文解析や感情分析などのNLPタスクのパフォーマンスを向上させることが示されています。