ラベル 因果切断 の投稿を表示しています。 すべての投稿を表示
ラベル 因果切断 の投稿を表示しています。 すべての投稿を表示

【ベストコレクション】 因果 切断 160121-因果切断

 因果推断的Y(i)对应强化学习中的奖励函数,因果推断中的处理(treatment)对应强化学习中的动作(action)。 我们永远只能观测到对应的某种反馈而不是全部因果推断中称之为潜在结果(potential outcome)而强化学习中把这种性质叫做"bandit...
close