Leo Lee's Blog
博客
分类
标签
归档
友链
关于
博客
分类
标签
归档
友链
关于
Leo Lee's Blog
Welcome everyone
博客
分类
标签
归档
友链
关于
有关多臂老虎机问题的一些算法
用数理统计方法解决多臂老虎机问题 摘要 多臂老虎机问题(Multi-Armed Bandit problem,简称MAB问题)是概率论与数理统计中一个经典问题,也属于机器学习中强化学习的范畴。 在这个问题中,赌徒必须决定在一系列试验中使用不同的老虎机中的哪一个,以最大化他的回报。这一经典问题之所以受到广泛关注,是因为它提供了一个简单的模型,在探索(尝试每个机器以找到回报最好的一台)、利...
2021-12-02
阅读全文