概率与奖励机制