参考结论
1.标准池和角色池五星实际的综合概率为1.605%,而非公示的1.600%
2.标准池和角色池四星实际的综合概率为13.057%,而非公示的13.00%
3.武器池五星实际的综合概率为1.878%,而非公示的1.850%(武器池四星我还没研究)
4.抽卡的概率递增确实是线性递增
5.如果认为下文我的模型为精准的模型,则常驻池及角色池第90发出五星的概率约亿分之七(7.23e-8)。作为参考,一次十连五金的理论概率约十亿分之二(1.90e-9),一次十连四金的理论概率约千万分之三(2.63e-7)。考虑到第90发出五星需要抽90抽才行,而十连只需要十抽,体验了十连五金和第90发出五星的玩家应该属于同一个数量级。
6.如果你能够解答一些我还没有弄明白的细节,欢迎补充在下面!
再分析一段时间,我会将之前的研究成果加上这次的修正,添加武器池情况后整理一份完备且精准的抽卡模型出来。
模型解释
此前我在收集数据研究抽卡机制时发现标准池及常驻池的五星分布曲线在73抽后分布上升得比我的理论更迅速,四星概率显著高于公示值。我便怀疑实际的概率比公示值更高,尤其是四星,并建立了一个经验模型。
感谢tesiacoil提供了二测文件的解包文件,从中得到了抽卡保底概率相关文件如下:
经过解读和标注为:
可以发现原神二测抽卡系统采用轮盘选的方式,随机一个1-10000中的整数,随机整数落在哪个区间就判定为抽取到某个道具。使用整数可以避免浮点误差,轮盘选也是一种常见的随机模型。
其中的圆桌优先度应该是指在分配轮盘选区间时,当概率提升后是谁的概率被占去,那么若四星概率上升到1/2,五星概率上升到1/3,那么抽到三星的概率应是(1-1/2-1/3)=1/6,这也和我之前的推测吻合。
对比发现二测时常驻池和角色池的五星和正式服一样概率从第74抽开始递增,每次递增6%,故结合收集到的数据进行对比如下:
注:收集数据中87抽处有一尖峰,在我发贴称很少有玩家高于84发出货后新收集的数据导致出现了这一现象。
相较于我之前建立的概率1.6%的模型,采用二测数据构造的概率高于1.6%的模型能够更好的吻合实测数据(虽然实际数据中76抽出最多,而理论值应该是77抽出的最多,这我没法解释,只能说是数据量还不够,不过不影响实际概率高于公示值的结论)
正式服中的武器池概率已经相较二测进行了调整。于是沿用二测时的设计风格,取基础概率的十倍为概率提升段每抽提高的概率,将从第63发开始概率提升,每次提升7%概率的模型和实测值进行对比如下:
虽然武器池数据量比较小,但是分布曲线也比较吻合(武器池在理论最高值前出现的尖峰也让我不理解,不过这也不影响实际概率更高的结论)
对于标准池和角色池的四星,二测数据中的13/26的保底开始抽数让我疑惑,但抛开这一点,仅看四星的概率提升为基础概率乘十,结合正式服数据即是第9抽出四星的概率为56.1%,与我之前建立的综合概率高于公示值的四星经验模型中取的值56.3%差距极小。实际画出的分布图和我之前的模型几乎一致。
为什么抽卡系统实际的概率更高?
我有几种假说
1.为了保持抽卡系统设计的简洁性易于设计,概率提升值为基础概率十倍时,给出确定的保底所需抽数、目标综合概率可以自动生成模型。
2.使得像我一样统计数据的玩家不至于因为收集到的数据有偏/数量少,拿着1.598%的综合概率称实际概率不足1.6%。
3.我根据公布的1.600%,13.00%等有多位有效数字的概率进行建模,实际概率并不是公示值可以防止逆向。
4.策划只是太懒了。
更新
关于初始号等带来的bias。
这些一直有考虑,若计算概率时会采用使用抽卡数量比较高的数据及去除每个池前几个五星的方法,这些我在GitHub项目中提示过。
由于本文主要关注74-90的分布,不主要考虑概率,认为基本不会受初始号等影响所以之前没有去除。(虽然加上筛选后符合曲线符合得更好了说明我之前确实是欠考虑)
关于假设检验:
楼下有很多人要求给数据检验,检验采用我之前的贴子中的方法进行,不过也和该贴楼下Enaxis说的一样,这个方法不是特别严格,只能做一下参考。其实现在的数据量采用这样比较通用的检验方法是不够的,得不出来有参考价值的结论,需要用更好的检验方法或更多的数据。如果你有好的方法请使用我放在GitHub上的数据进行检验,务必让我知道结果。
使用排除前5个五星,仅使用抽了大于2000抽的样本,得到的效果如下图: