Just This Once とは

ジャスト・ワン・ワンスは1993年のロマンス小説で、プログラマーのスコット・フレンズとのコラボレーションで「ハル」というMacintosh IIcxコンピュータでJacqueline Susannのスタイルで書かれています。フランス人は、Susannの作品を分析し、Susannが書いたかもしれない小説を作ろうとする人工知能プログラムを開発するのに4万ドルと8年を費やしたと言われています。 Jacqueline Susannの不動産と出版社との間の法的紛争が、利益を分割する和解をもたらし、著作権法に関するいくつかの法律ジャーナルの記事で参照されました。この本には合計35,000部の小規模な印刷物が2つあり、レビューが混在しています。

Transderivational search とは

Transderivational search(TDSと略記されることが多い)は、心理学的サイバネティクス用語であり、広い分野にわたってファジーマッチの検索が行われているときに意味されます。コンピューティングでは、同等の機能は、連想メモリを使用して実行できます。
リテラル(すなわち、正確な、論理的な、または正規表現の)マッチを探す通常の検索とは異なり、トランスデベロッシブ検索は、通信の一部として可能な一致または可能な一致の検索であり、まったく。それは処理言語の不可欠な部分であり、コミュニケーションに意味を付けるものです。
TDSの心理学的な例は、エリクソニアの催眠療法であり、患者が自分の意味を見つけるために患者を強く処理しなければならない漠然とした示唆が使用され、従業員が被験者の内面に自分の信念を侵害しないようにします。

Entity linking とは

自然言語処理では、エンティティリンク、名前付きエンティティリンク(NEL)、名前付きエンティティ曖昧性除去(NED)、名前付きエンティティ認識と曖昧さ回避(NERD)または名前付きエンティティ正規化(NEN)は、本文中で言及されたエンティティの識別を決定するタスクです。たとえば、「パリはフランスの首都です」という文章を考えれば、「パリ」はパリの都市を指し、パリ・ヒルトンまたは「パリ」と呼ばれることができる他のエンティティではありません。 NERは、名前付き実体の出現または言及をテキスト中で特定するが、それがどの特定の実体であるかを特定しないという点で、名前付き実体認識(NER)とは異なる。
エンティティリンクには、エンティティの記述をリンクできるエンティティを含むナレッジベースが必要です。オープンドメインテキスト上でのエンティティリンクの一般的な選択肢は、各ページが名前付きエンティティとみなされるWikipediaに基づく知識ベースです。 Wikipediaエンティティを使用するNEDは、ウィキケーションとも呼ばれています(Wikify!初期エンティティリンクシステム参照)。知識ベースは、トレーニングテキストから自動的に誘導されてもよいし、手動で構築されてもよい。
名前付きエンティティの記述は非常にあいまいである可能性があります。どんなエンティティリンク方法も、この固有のあいまいさに対処しなければならない。この問題に取り組むための様々なアプローチが今まで試みられてきた。ミルンとヴィッテンの精神的アプローチでは、Wikipediaエンティティのアンカーテキストを訓練データとして用いて教師あり学習を採用しています。他のアプローチも、明白な同義語に基づいてトレーニングデータを収集した。Kulkarni et al。局所的に一貫性のある文書は、強く関連するタイプに属するエンティティを参照する共通の性質を利用していました。
エンティティリンクは、情報検索システムのパフォーマンスを向上させ、デジタルライブラリの検索パフォーマンスを向上させるために使用されています。 NEDはセマンティック検索の重要な入力です。例えば、すべてのテキストが特定のスコープとコンテキストを持つという基本的な仮定を使用することによって、名前付きエンティティ認識メソッドの出力を検証するために、エンティティリンクが首尾よく使用されているため、そのテキストに記述されているエンティティはそれらの間に意味的関係を持つ必要があります。同じエンティティに対して複数の解釈が可能な場合でも、意味論的類似性測度を使用して、コンテキストからエンティティを識別することによってエラーを除外することができます。
エンティティリンク評価キャンペーンは、テキスト分析会議のナレッジベース集計タスクのコンテキストで米国標準技術局(NIST)によって組織されています。

William Aaron Woods とは

Bill Woodsとして知られているWilliam Aaron Woods(1942年6月17日生まれ)は、自然言語処理、連続音声理解、知識表現、知識ベース検索技術の研究者です。彼は現在、人々が組織内の情報を整理して使用するのを支援するテクノロジーの使用に関心を持っています。

Named entity とは

情報抽出において、名前付きエンティティは、人、場所、組織、製品などのような、実際のオブジェクトであり、適切な名前で表すことができる。それは抽象的でも物理的な存在でもあります。名前付き実体の例には、バラク・オバマ、ニューヨーク市、フォルクスワーゲン・ゴルフ、または名前を挙げることのできるものが含まれます。名前付きエンティティは、単にエンティティインスタンス(例えば、ニューヨーク市は都市のインスタンス)として見ることができる。
歴史的観点からは、MUC-6評価キャンペーン中に名前付きエンティティという用語が作成され、ENAMEX(人名、場所、組織などのエンティティ名の表現)とNUMEX(数値表現)が含まれていました。
より正式な定義は、Saul Kripkeの厳格な指定子から導出することができる。 「名前付きエンティティ」という表現では、「名前付き」という単語は、エンティティの可能なセットを、1つまたは複数の厳格な指定子が参照対象とするものに限定することを目的としています。指名者は、すべての可能な世界で同じことを指定するときに厳格です。逆に、弛緩的な指名者は、異なる可能な世界で異なるものを指定するかもしれない。
例として、「オバマはアメリカの大統領です」という文章を考えてみましょう。 「Obama」と「United States」の両方は、特定のオブジェクト(Barack ObamaとUnited States)を参照するため、名前をつけたエンティティです。しかし、「社長」は、異なる世界のさまざまなオブジェクトを参照するために使用することができるため、名前のついた実体ではありません(異なる人物を指す異なる大統領時代、または異なる人物を指し示す異なる国や組織でさえ)。厳格な指定子は、通常、生物種や物質のような特定の自然の用語と同様に固有名詞も含みます。
また、名前付きエンティティ認識コミュニティには、金額や他のタイプの単位などの時間的および数値的表現を名前付きエンティティとして考慮することが一般的に合意されています。
テキスト中の名前付きエンティティを認識するタスクは、名前付きエンティティ認識であるが、テキスト中で言及された名前付きエンティティのアイデンティティを決定するタスクは、名前付きエンティティ曖昧性除去と呼ばれる。どちらのタスクも、専用のアルゴリズムとリソースを必要とします。

Calais (Reuters product) とは

CalaisはThomson Reutersのサービスであり、セマンティックWeb上で使用できる形式でWebページから意味情報を自動的に抽出します。カレーは2008年1月に発足し、自由に使用できます。
Calais Webサービスは、構造化されていないテキストを読み取り、テキスト内のエンティティ、ファクトおよびイベントを識別するResource Description Frameworkのフォーマット済みの結果を返します。このサービスは、ロイターが2007年にClearForestを購入したときに獲得した技術に基づいているようだ。
この技術は、ブログの記事に自動的にタグを付け、美術館のコレクションを整理するためにも使用されています。
カレは自然言語処理技術をWebサービスインターフェイス経由で提供しています。

Language identification とは

自然言語処理では、言語識別または言語推測は、コンテンツが与えられた自然言語を決定する問題です。この問題に対する計算上のアプローチは、さまざまな統計的方法で解決されたテキスト分類の特別なケースです。

Automatic acquisition of sense-tagged corpora とは

知識獲得のボトルネックは、おそらく、語義曖昧さ除去(WSD)問題を解決するための大きな障害である。教師なし学習方法は、辞書や語彙データベースではほとんど作成されていない単語感覚に関する知識に依存します。教師付き学習方法は、すべての単語感覚の手作業で注釈を付けた例の存在に大きく依存しています。これは、Sensevalの演習で行われているように、これまでテスト目的の単語のほんの一握りしか満たされていない必要条件です。

Bag-of-words model とは

bag-of-wordsモデルは、自然言語処理および情報検索(IR)で使用される単純化表現です。ベクトル空間モデルとも呼ばれます。このモデルでは、文章や文章などの文章は、文章や単語の順序を無視して複数形になっていて、その単語の袋(マルチセット)として表現されています。バッグオブワードモデルもコンピュータビジョンに使用されています。
bag-of-wordsモデルは、各単語の(出現頻度)が分類子を訓練するための特徴として使用される文書分類の方法で一般的に使用される。
言語学的文脈における「単語の袋」への早期の言及は、Zellig Harrisの1954年の流通構造に関する記事に見出すことができる。

Confusion network とは

混同ネットワークは、複数の機械翻訳システムからの出力を組み合わせた自然言語処理方法です。混乱ネットワークの定義上の特徴は、複数のあいまいな入力を許可し、処理の後の段階までコミット翻訳の決定を延期することです。このアプローチは、IBM Bluemix Watsonのオープンソースのマシン翻訳ソフトウェアMosesと独自の翻訳APIで使用されています。