PVLV とは

一次価値学習値(PVLV)モデルは、ドーパミン(DA)ニューロンの報償予測発火特性の可能性のある説明である。 Pavlovianコンディショニングおよび予想外の報酬に比例して発火する中脳ドーパミン作動性ニューロンに関する行動データおよび神経データをシミュレートします。これは時間差(TD)アルゴリズムの代替方法です。
それはLeabraの一部として使用されます。