抱歉,您的浏览器无法访问本站

本页面需要浏览器支持(启用)JavaScript


了解详情 >

有关self-attention的笔记

这学期一直都在看ViT(Vision Transformer),现在的transformer近似于一种“大道至简”,在各个领域都可以作为一个baseline。 如果谈到Transformer那首先就会谈到self-attention。 Transformer是一个Sequence to Sequence model,特别之处在于它大量用到了self-attention。 要处理一个Se...

有关多臂老虎机问题的一些算法

用数理统计方法解决多臂老虎机问题 摘要 多臂老虎机问题(Multi-Armed Bandit problem,简称MAB问题)是概率论与数理统计中一个经典问题,也属于机器学习中强化学习的范畴。 在这个问题中,赌徒必须决定在一系列试验中使用不同的老虎机中的哪一个,以最大化他的回报。这一经典问题之所以受到广泛关注,是因为它提供了一个简单的模型,在探索(尝试每个机器以找到回报最好的一台)、利...