抱歉,您的浏览器无法访问本站

本页面需要浏览器支持(启用)JavaScript


了解详情 >

有关多臂老虎机问题的一些算法

用数理统计方法解决多臂老虎机问题 摘要 多臂老虎机问题(Multi-Armed Bandit problem,简称MAB问题)是概率论与数理统计中一个经典问题,也属于机器学习中强化学习的范畴。 在这个问题中,赌徒必须决定在一系列试验中使用不同的老虎机中的哪一个,以最大化他的回报。这一经典问题之所以受到广泛关注,是因为它提供了一个简单的模型,在探索(尝试每个机器以找到回报最好的一台)、利...