如何在样本不足时研究和分析彩装(彩船)的实际掉率
阅读
2022-04-26更新
最新编辑:負けん気な瞳
阅读:
更新日期:2022-04-26
最新编辑:負けん気な瞳
文章思路无误,但所讲述方法已于科研统计中使用过,无创新性。至少要从统计学角度的给出金、彩比例的定量化判定依据方可单独成文。此外文中的部分细节表述在数学上不够严谨。
其实1万样本来分析科研项目都是不够的,分解到每个项目上大约只有300来个样本。而彩装的掉率特别低,这本身就需要更大规模的样本才能进行分析,否则可能会存在较大的误差。 如何在样本不足时研究和分析彩装(彩船)的实际掉率?或者说如何分析样本掉率是否存在较大的偏差?如何分析样本量是否充足?亦或者在样本量相对较少时,修正观测到的掉率。
1.什么是样本偏差,样本观测值和实际能相差多少?
假设G4系列的彩装掉率在游戏中的设定值为0.1。(参考目前观测值)
假设彩装的掉落量范围是0,1,2。(参考目前观测值)
我们获取了100个样本,假设其中97样本的掉率和游戏设定一致。另外3个样本掉率偏高(欧皇),假设彩装多掉了3个。
此时我们根据此样本情况观测到的彩装总掉落量是12.7,观测到的彩装掉率为0.127,和游戏设定偏差有27%。
即当100次中出现3次欧皇事件时,观测值和游戏设定值偏差为27%。
当这个偏差较大时,我们认为这个样本偏差较大。
真正的问题在于我们永远也不会知道所获得的样本是欧皇偏多或者非酋偏多,所以这个问题很难直接进行修正。
通常的思路是多次采样,扩大样本量。
那我们再看看如果金装在100次中同样出现3次欧皇事件会有什么影响。
假设G4系列的金装掉率在游戏中的设定值为1.1。(参考目前观测值)
假设金装的掉落范围是0,1,2,3,4。(参考目前观测值)
我们获取了100个样本,假设其中97样本的掉率和游戏设定一致。另外3个样本掉率偏高(欧皇),假设这三个欧皇获得了2个金装。
这时,我们观测到的这100个样本,金装总掉落量为97*1.1+3*2=112.7。根据此样本观测到的掉率为1.127,和游戏中的设定值相差仅为2.45%。
即当100个样本中,同样出现3次欧皇事件时,观测到的彩装掉率可能受到27%的影响,而金装掉率受到的影响为2.45%,相差10倍。
造成这种差距的原因是,彩装掉率太低,仅为0.1这个数量级,而一次掉落体现出来的结果为1甚至2,相差10~20倍,少数欧皇(非酋)事件都能造成巨大的影响。而金装的掉率和实际体现在一个数量级上,受影响较小。
再举个例子,假设G1.5的彩装掉率在游戏中的设定是0.024(参考目前观测值),实际掉率量是0,1,2。同样假设100个样本中出现了3次欧皇事件,这三次事件都掉落了1个彩装,则实际总掉落量为97*0.024+3=5.328。则根据此样本观测到的掉率为0.05328,为游戏值的2.22倍!
此处可以得到的结论:
A对于掉率更低的彩装,只有获取更大的样本量,才能将误差范围减少到同等水平。
B同样规模的样本量下,掉率越低的项目观测到的掉率误差越大。
假设欧皇非酋出没次数相同的情景下的比较,事实上也可能是1000次中出现了几十次欧皇,而另一个100的样本恰好就是无偏估计
2.如何解决样本偏差,如何修正目前样本偏差
通常的思路是多次采样,扩大样本量。
3.多大的样本才够用
我们不知道获取的样本是否存在欧皇(非酋)数量异常,也不知道欧皇的数量是多少。
这里还是按照出现3次欧皇做一个参考。
假设G1.5的样本量扩充到1000个,其中仍然只有3次欧皇事件,则观测到的彩装掉率为。0.0269,和游戏设定值的误差缩小到12.2%。
这里只是举个例子,也许1000个样本中欧皇不止3个也不好说…
想说明的是一个原理,当样本量在100增长到1000时,如果存在同样数量的极端值,误差范围缩减幅度如何。
同时给大家一个概念,小掉率更大样本的误差与更高掉率更小样本之间的比较。
即1000个G1.5样本的彩装掉率的误差范围,可能仍然是100样本G4的金装掉率误差范围的四到五倍。
甚至仍然比不上二十个G4样本统计金装时的准确度(误差9.58%)。
后面会用到这个知识点。
4.如果不能获取数以千计甚至万计的样本量,有没有其他途径可以分析彩装掉率,或者修正现有样本统计的掉率情况
一个G1.5就获取几千条样本,才能把误差降到10%以下,这个要求本身就不现实,总样本量太大了。那么如果不能获取数以千计甚至万计的样本量,有没有其他途径可以分析彩装掉率,或者修正现有样本统计的掉率情况?
其实前面讲到了,当统计一个掉率较高,实际掉落离散分布较小的项目时,如果希望将误差范围缩减到同等级别,所需的样本量更小。
假如说,金装和彩装掉落存在某种替代关系或者是相关关系,则可以根据较少的样本量的金装掉落情况来推测彩装掉落情况,或者是修正彩装掉落率。
这个假设成立吗?
5.彩船和金船的掉落关系
这里先分析一下彩船和金船的掉落关系,一是因为这个掉率更高,更容易获得足够的样本量进行分析。二是可以先验证一下游戏是否采用了笔者心目中的掉落模型假设。
很多游戏都采用了类似的掉落模型,
第一步,生成随机因子A,确定掉落的船只(装备)数量总数
第二步,生成随机因子B,将其中某一个或多个,“进化”为彩船(彩装)。
在这样的的模型中彩船和金船的掉落不是相互独立的,而会体现出一种替代关系,即当彩船掉落多时,金船数量会出现下降。
1万样本数据,可以说是验证了这个猜想。
如下表所示,在所有同时可能掉落金船和彩船的项目,每当彩船掉落数量增加时,金船掉落的均值出现显著的下降。除了极少数样本量为1的“特例”,所有项目均符合这个规律。总体来看,彩船掉落数量增加1时,金船掉落量下降0.54。
例如,H0.5心智补全,当彩船掉落量为0时,金船掉落均值为5.6;当彩船掉落为1时,金船掉落均值为4.71;当彩船掉落为2时,金船掉落均值为4.2。当彩船掉落为3时,金船掉落均值为3.67(只有3样本),当彩船掉落量为4时,金船掉落量为4(仅1样本)。
上述数据显示,彩船对金船存在替代关系,但又不是完全的替代,其实在出现更多的彩船时,金船+彩船的总量是上升的。这就产生了一个新的推论,在碧蓝中,随机因子A和随机因子B存在正相关性。即,当金船掉落量更多时,彩船掉落量也会更多。
<当然,单纯从数据看也可能是相反的因果关系,当彩船掉落更多时,金船掉落量更大。而笔者认为前一种推测成立的另一个原因是,正常来说,程序员也是讲逻辑的。不太可能先进行彩船掉落随机性运算,然后新增一个参数,当掉落彩船时会掉落更多的金船>
拿样本量比较多的H1举例,当彩船掉落为0时,金船+彩船掉落合计为2.32,而当彩船掉落为3时,掉落合计为3.35(33样本量)。
另外,要说明的一点是同一项目系列中,有很高概率采用了相同的随机参数(偷懒的程序员的正常逻辑)。而不同的项目系列之间,既可能存在相同的随机参数(偷懒的程序员),也可能存在不同的随机参数,如果设定不同的参数,大概率也会存在一定的逻辑关系(随便拍脑袋,“通常来说”上司一定会让他重新来过)。感兴趣可以进一步分析。
6.彩装掉落是否和金装掉落有关?
先放一张图,不同项目的彩装掉落和金装掉落确实存在线性关系。波动有点大,这也很好理解,因为不同项目可能设定了不同的参数。
接下来再看看可比项目之间,是否具有更稳定的关系。
如上述四图所示,在Q系列G系列,D系列内部,都呈现出显著的线性关系。
彩D系列异常的原因应该是样本偏差,该样本的彩D5的彩装掉率为0.66(严重偏高),彩D8的彩装掉率为0.7(偏低),相当接近,而后来wiki后来一版的统计中彩D5和彩D8掉率分别为0.52和0.88。
正如前面所预料的,掌握这个方法以后可以发现统计出现问题时的异常情况并进行修正。另外Q1、Q2、Q4如果采用更大样本进行分析时,拟合度更高。
由此,我们得到了一个惊人的结论:彩装掉落率和金装掉率在同类型项目内部呈现高度的线性关系。甚至跨类型的项目进行比较时,彩装掉率和金装掉率也存在着明显的线性关系。
由此可以推论,当我们无法获得足够的样本分析彩装掉率时(误差范围较大时),我们可以先看看这个项目的金装掉落情况,然后找到他是哪一类型的科研项目,进而推测他的掉率如何,甚至可以分析目前样本的掉率是否可能存在较大的样本偏差。
7.彩装掉落和金装掉落的替代关系验证
如前所述,因为彩装掉落量其实对应的样本太少,很多时候掉落彩装的样本量仅仅为1个或两个。
即便如此,在不进行数据修正的情况下,从整体上来看,当彩装掉落量增加1时,金船掉落量会出现显著的下降,下降幅度的均值为0.24,中位数为0.28。
拿样本量相对较大的G系列举例,比如G1.5,当出现彩装掉落时,金装不掉落,样本量为23。
8.应用举例:B4金掉率
发现以上规律后,除了帮助排查异常值之外。最最重要的作用就是在样本量较少时,看看目前观测到的彩装掉率是不是靠谱。
比如B4金。这个项目其实是由三个项目构成,条件分别为打11图3次,12图3次和13章图2次,其中12图和13图共享397-RF项目编号,11图的项目编号为351-RF。
因此我们有理由认为,其实351和397项目的掉落是存在差异的。甚至对两种397的掉落是否存在差异都保持怀疑。
如果专注于做13图的397-RF,可能获得更高的收益。
目前我自己的B4金样本材装备图纸掉率为0.18,金图纸掉落为4.91。彩装备掉率还挺高的。按照上述方法分析一下这个掉率靠不靠谱。
首先我的金图纸掉落最小值为3最大为7,均值为4.91,掉落范围和均值非常接近,即使出现欧皇事件,影响也很小,即用很小的样本就可以测出较准确的金图纸掉率。
说明一下这个金图纸掉落量是包含非4期图纸的。
首先用LmeSzinc的397-RF数据验证一下,相当于是多次采样验证。15样本量仍然不大,彩装备掉率为0.13比我低不少,而金图纸掉率为5.13,几乎一致。
现在不好说彩装掉率谁更接近于实际设定。有一个问题是策划设定B4金的掉率时会参考哪些项目,我的第一反应就是G4,同样是彩船金船,彩装金装混合掉落,同样4小时。
然而问题来了,为什么要把B4金的金图纸掉率设定为5?要知道这是G4的1.6倍啊,那彩装的掉率设定又该如何?
9.延伸话题
延伸话题:其实我们看到的某些项目每小时掉率存在的细微差异,既可能是人为设定的随机参数导致的结果,也很可能仅仅是统计误差放大了。毕竟程序员也是普通人,他在设定掉率时不能毫无逻辑的设定参数。正常情况下从整体来看,不同项目的掉率内在逻辑应当是自洽的。
在获得越来越多的样本时,可以更好的推测当初设定的概率。同时也可以通过寻找内在逻辑关系的方式,通过项目类比等方式,修正从样本观测到异常掉率,从而得到误差更小的数据。