设为首页收藏本站繁体中文

轻之国度

 找回密码
 注册(右键在新窗口打开)

QQ登录

只需一步,快速开始

查看: 2341|回复: 14
收起左侧

[研究讨论] 猜拳游戏的博弈策略[纸上空谈= =]

[复制链接]
发表于 2015-2-28 13:26 来自手机 | 显示全部楼层 |阅读模式
石头,剪刀,布这个简单的猜拳游戏可能无人不会。石头胜剪刀,剪刀胜布,布胜石头,出相同算平局。但是可曾有人考虑过从这个游戏中算出一个长胜之法?

po在此提出一个博弈策略。

我们假设两台机器人A和B随机地出拳,很容易地根据统计规律得出,A和B各有一半的胜率(平局不计胜负)。

但是人不是机器,人不会做到真正的随机,人具有一定的固有思维模式。

• 人不会做到真正的随机,人具有一定的固有思维模式

以上是本策略分析的前提,若对此表示疑问,诸位可以进行一个简单的实验。

连续迅速地写下一串数字,每次选择写下1,2,3之中的一个,例如:123 332 122 123 213 211 232 123 212 332 123 213

然后每三个数分成一组(如上)。在上面的例子中123出现的频率最高,原因可能只是123写着比较顺手而已。

现在,你继续实验。实验的主办者看了你写的数字,告诉你他也写下了一个三位数可能是频率最高的123,也可能是其他组合的数字。要求你接着继续挑选1,2,3这些数字写出一串数字,但如果一旦出现和主办者写的数字一样,游戏就会失败。

想必大多数人听到这个说明后都会有意识地规避123这个原本出现频率最高的数字,甚至于在后续的实验中根本不会出现123这种组合。究其原因则是主办者暗示了123这个数字是“不安全”的策略,尽管他根本没有明确说明123这个数字是不安全的。

上述实验的结论可以有两种解释方法:
1 人比机器聪明,懂得趋利避害。
2 人容易受到干扰,会受到他人有意地误导。

从第二种解释出发,我们可以制订一些博弈策略。这些策略的关键都是想办法掌握对手的思维模式,然后便可以推知对手根据什么条件会做出什么样的行动。

举个例子,要从1,2,3三个数字每次挑出一个写出一串数字,随机得到了这样一串数字:111111111111
下个数字最可能是?

如果是一个人写出是这样一串数字:111111111111
下个数字最可能是?

对真正的随机数而言,前面的已生成的数不对之后生成的数产生任何影响。但对于人来说,一连串的1心理上会有很强的暗示作用下一个仍然会是1,并且这个判断经常是合理的。

在猜拳游戏中,如果一方能做到完全的随机出拳,那么从统计上来讲双方都是不胜不败的,50对50的公平游戏。如果一个脑子算得很快的话他可以简单地设计一个模3算法生成大量伪随机数(笑),从而实现随机出拳的策略。

但随机猜拳缺乏吸引力的一点在于,这个策略不会提高游戏的胜率,它并不能让50%的胜率变得更高,无论对手使用任何策略。

但随机猜拳仍然是可取的一点在于,它在不降低自己胜率的同时提供观察对手猜拳模式的机会。一旦掌握了对方的思维模式,就可以获得先机。在划酒拳的时候,有人总能获胜的原因除了运气和酒量,就是他会“抓包”对手的常用出拳。

再有一个策略就是“暗示法”。

假设两个人A和B猜石头剪刀布,第一局A出石头B出剪刀,A赢了;第二局A还是出石头B也出石头,平局。

此时,由于前局的结果,A就对B形成了一种下一局我还会出石头的暗示。B也会怀疑A会不会继续出石头。如果第三局A真的出石头,就会进一步加强这种暗示。或者A直接说“你相信我会出石头吗?”,或者眼神手势之类都会对B的判断造成干扰和暗示。

当B完全接受这种暗示信以为真时,B就会出布以期获胜。同时,A突然改变一贯出石头的策略,改成出剪刀,就可以出奇制胜。

但是“暗示法”策略的成功率取决参与游戏者的相互了解的程度和信任程度。如果陷入无休止的猜疑链的话,其实际意义的话可能就是形成另一种形式的随机猜拳吧。

一个针对对手“抓包”自己,防止对方掌握自己的被动防守策略就是“随机化”策略,将自己的出拳方法随机化。这是一个合理的策略。但是这个策略容易陷入另一种盲区:根据之前的猜拳结果来进行平均化,比如出了5次石头以后下一次就一定不能出石头。这个“一定”就是没有根据的,因为要做到随机性,前面的结果对后续行动是没有影响的。如果按照平均出拳的方法来,反而可能被对手“抓包”。

总结

• 进攻策略:观察对手猜拳模式,猜测对手到固有策略进行针对;利用暗示和干扰的方法,误导对手做出自己想要的错误判断。

• 防守策略:模拟随机数生成,避免被对手针对,改变自己的猜拳模式。
发表于 2015-2-28 15:48 | 显示全部楼层
 楼主| 发表于 2015-2-28 16:39 来自手机 | 显示全部楼层
wangww 发表于 2015-2-28 15:48
太长不看版:
http://www.guokr.com/post/278331/
http://www.guokr.com/post/37598/

第一,只要是策略,就不可能存在
必胜的。任何策略只要被事先洞察,就可以制订针对性的对策。

机器人猜拳,天下武功唯快不攻?为防止快慢拳,存在背身猜拳的做法:猜拳双方背对背出拳,相互看不见,由第三方统计猜拳结果。如是这般,猜拳机器人反应再快也没有用。

再者第二种将的所谓“必胜”策略也只是根据统计结果得出的属于人群的规律,对上个人未必屡屡成功。而且如果以此策略自以聪明对付同样了解此策略的对手,反而可能陷入大败的境地。
发表于 2015-2-28 19:30 | 显示全部楼层
小苹果萌萌哒 发表于 2015-2-28 16:39
第一,只要是策略,就不可能存在
必胜的。任何策略只要被事先洞察,就可以制订针对性的对策。

        ←_←好吧,咱确实没注意到第二个帖子的标题写着“必胜”,但如果说长胜的话,那帖子完全可以满足你的要求

        另外,咱确实想不出猜拳策略有什么能深入讨论的突破口
头像被屏蔽
发表于 2015-2-28 23:37 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
 楼主| 发表于 2015-2-28 23:52 | 显示全部楼层
zxy900906 发表于 2015-2-28 23:37
你说的事先洞察策略应对机器人的快慢拳反应制胜,和统计学构建的整体战略战术不一样,总体的组合散列是只 ...

说人话。

顺便字数补丁混积分。
头像被屏蔽
发表于 2015-2-28 23:59 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
 楼主| 发表于 2015-3-1 00:25 | 显示全部楼层
zxy900906 发表于 2015-2-28 23:59
就是你的背身拳只要记得出过的拳的回合组合,就可以归入统计学构建的整体战略战术,和正面出拳并没有不同 ...

第一,除了后出作弊,不存在任何必胜的方法

第二,我不知道你说的其一其二是什么。如果你指的是那两个链接,我再解释一遍。机器人能赢是因为作弊,为防止作弊才提出背身猜拳;第二个链接号称必胜只是标题党而已,根据统计规律提出的策略实际应用中根本不可能做到必胜。
头像被屏蔽
发表于 2015-3-1 18:01 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
 楼主| 发表于 2015-3-1 19:32 | 显示全部楼层
zxy900906 发表于 2015-3-1 18:01
原来你说的是比反映时间的背身拳啊,我还以为直接背手第三方观察记录判定标准,这又降低反作弊标准

如果 ...

怎么可能必胜……假设做5次,7次,11次,21次猜拳,你分别说说必胜策略。
头像被屏蔽
发表于 2015-3-1 20:16 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
 楼主| 发表于 2015-3-2 01:37 来自手机 | 显示全部楼层
zxy900906 发表于 2015-3-1 20:16
所以这还是在过程考虑过程,NGNL有模板

游戏人生原文:

像仔细说给斯蒂法妮听一样,空慢慢地说。
    “不只是普通的猜拳——明白吗?我只会出布。”
    “——啊?”
    “我要是出了布以外的,那么就算‘我输’……但是,我如果出了布以外的赢了你的话,由于你也输了所以这种情况算是‘平局’——当然,要是我出了布以外依旧不分胜负的话还是‘我输了’”


正如文中分析的一样,史蒂夫出石头可能2胜1负,剪刀可能2胜1平,布可能1胜2平。就单纯的猜拳而言,只要出剪刀或者布史蒂夫就不可能失败。相反,提出这个额外规则的空则非常难以取胜。所谓的必胜根本就是扯淡。

空的胜利是基于模糊的条款解释——

“要是——平手的话?”
    “那样的话我只给你巧诈的一点提示……作为代价。”
    空突然一变,像是很困扰般挠挠头笑着说。
    “能否满足我点小小的愿望呢。虽然凭手头的东西总算能撑过几天————但是直截了当的说,在这里住了4天以后,住宿也好食物也好就都没有着落了。而且说到底我们还在为接下来该怎么办而伤脑筋呢……”
    “——也就是说,要我为你们提供食宿?”
    对于斯蒂芬妮的反问,空只是回以一个微笑……
    ——什么话都没有说。

结果是只要平局,空就可以随意许愿了——这个也真是便宜,比起隔壁英灵打死打活争夺许愿机来得便宜多了-_-||为什么现在签合同办事都要这么多解释条款还不放心,一个防的就是这种模糊条款的空子。

但就游戏本身而言,不存在必胜的猜拳策略。
发表于 2015-3-2 10:11 | 显示全部楼层
        ←_←咱觉得这个问题可以结了……既然明知没有必胜策略,能够增加胜率的策略又是建立在统计学基础上,那还有什么可讨论的余地呢?楼主说的那些策略,只不过是“已知结论”而已(尤其是“建立在大量数据基础上的形势预测”),这个在第二个帖子的后半部分已经说的很明白了。
头像被屏蔽
发表于 2015-3-3 00:19 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2015-3-3 21:46 | 显示全部楼层

我就发两张图,不说话

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册(右键在新窗口打开)

x

本版积分规则

手机版|Archiver|轻之国度

JS of wanmeiff.com and vcpic.com Please keep this copyright information, respect of, thank you!JS of wanmeiff.com and vcpic.com Please keep this copyright information, respect of, thank you!

  

GMT+8, 2024-5-18 00:00

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表