六合彩、俄罗斯六合彩、开奖、台湾彩、香港六合、、柬埔寨六合、新澳门、澳门

1396网

 找回密码
 立即注册
查看: 18|回复: 4

打了一辈子德州,居然输给了新手AI!(下篇)

[复制链接]

40

主题

0

回帖

153

积分

注册会员

积分
153
发表于 2024-11-22 21:33:59 | 显示全部楼层 |阅读模式
    此时,对B而言,就是一个不完美博弈,他无法从A选择play从而判断A手中的硬币是正面还是反面。    这时有两个极限情况,如果B总是猜正面,那么聪明的A就会变化策略,当他抛到正面时就卖掉硬币,如果抛到反面才玩游戏,这样B必然会输。此时,A的期望分数为0.5(抛到正面的概率)*0.5(选择sell的得分)+0.5(抛到反面的概率)*1(选择play的得分)=0.75        如果B总是猜反面,那么A抛到正面时就会选择play,得一元;抛到反面就会选择sell卖掉硬币,这样只赔五毛钱。所以A的期望是0.5(抛到正面的概率)*1(选择play的得分)+0.5(抛到反面的概率)*(-0.5)(选择sell的得分)=0.25    此时,出现一个知识点,叫纳什均衡,也就是B为了有效的降低损失,他最有效的策略就是以0.25的概率猜正面,以0.75的概率猜反面,这样可以确保他的胜算最大。    而博弈永远是一个动态的过程,如果B持续按照固有的策略做决策,那么A也会根据B的决策结果调整自己的策略。所以,对B最安全的方法,就是不断更新A卖掉硬币会得到的回报,持续寻找最优解。    我们聪明的计算机就是通过这样的方法动态的计算牌友们押注所带来的回报期望,进而“持续更新对手的套路”,最终获得了「比赛过程中,人类选手整体上从未领先过」的效果。    看来,想要和AI斗智,人类的小脑筋maybe还需要转的更快才行嘞,也许没有套路才是最大的套路哦。    都说金融大佬都爱玩德州,看完这篇文章,金融大佬们是否有些启发呢?

0

主题

1936

回帖

3931

积分

论坛元老

积分
3931
发表于 2024-11-29 15:07:20 | 显示全部楼层
谢谢分享

0

主题

1940

回帖

3939

积分

论坛元老

积分
3939
发表于 2024-11-29 15:07:22 | 显示全部楼层
谢谢分享

0

主题

1927

回帖

3901

积分

论坛元老

积分
3901
发表于 2024-12-7 11:15:12 | 显示全部楼层
感谢无私分享哟

0

主题

1919

回帖

3889

积分

论坛元老

积分
3889
发表于 2024-12-7 11:15:11 | 显示全部楼层
感谢无私分享哟
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|论坛|1396网

GMT+8, 2024-12-23 12:17 , Processed in 0.318830 second(s), 18 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表