Introduction to contexual bandit
- 7. Contextual bandit
• 各armの選択の際にcontext 𝑥が与えられているという
設定
• context情報が与えられている場合、例えば線形モデ
ルを使って広告のCTRを以下のように予測する
– 代表的なアルゴリズムとしてLinUCBがある
広告CTR = 0.1 * 男性 + 0.01 * 女性
広告CTR = 0.05 * 男性 + 0.05 * 女性
- 9. シミュレーション
• 設定
– トラフィック70%男性, 30%女性
– 広告1: 男性CTR 10%, 女性CTR 2%
– 広告2: 男性CTR 2%, 女性CTR 10%
– context 二次元ベクトルで男性もしくは女性を表
す
• 男性なら(1,0), 女性なら(0,1)
- 11. 参考資料
• A contextual-bandit approach to personalized
news article recommendation, WWW 2010
– LinUCBに関する論文
• An empirical evaluation of thompson sampling,
NIPS 2011
• Content recommendation on web portal,
CACM 2013