Thompson sampling とは

人工知能では、William R. Thompsonにちなんで名付けられたThompsonのサンプリングは、複数武装の赤道上の問題における探査開発のジレンマに対処する行動を選択するヒューリスティックである。無作為に描かれた信念に対して期待される報酬を最大にする行動を選ぶことにあります。