|
本帖最后由 cherrypepsi 于 2021-7-28 20:01 编辑
只是从纯统计学的角度说一下,还真没见过论坛里面有人懂统计及怎样下结论的。
ABX测试是因为要减少瞎蒙蒙对(随机发生)的概率。通常来说如果这个随机的几率(p-value)要小于5%(95%置信区间confidence interval),我们就可以推翻“零假设”(楼主的电源线没有可闻的音频区别),来证明楼主的电源线的录音有可闻的音频区别。如果要p-value小于5%,如果是10组试验中是要答对8次以上,才能证明电源线的录音有可闻区别(10组对8次的p-value值是5.5%)。如果是楼主的6组实验,是需要6组全部答对的(6组答对5组p-value是10.9%,这个数值比较高严格上还不能推翻零假设)。目前来看如果像楼主说的准确率只有一半的话,那就跟完全瞎蒙差不多,目前结论就是根本听不出不同电源线的录音的任何区别。
当然这些实验只能证明当时测试的A电源线和B电源线的录音没有可闻的音频区别,并不能代表整体全部电源线。毕竟电源线品牌种类那么多,不能一概而论。
这个可以在二项式表(重复n次独立的伯努利试验)中找到对应p-value:http://djcarlst.provide.net/abx_bino.htm
如果有兴趣可以研究一下具体算法,可以看下百度百科:https://baike.baidu.com/item/%E4%BA%8C%E9%A1%B9%E5%88%86%E5%B8%83/1442377?fr=aladdin
国外关于这类ABX测试的科学解释已经相当多了,应用范围也很广。比如盲测百事可乐和可口可乐的区别,320k音频和无损音频的区别,包括国外一些音频厂商开发新产品的时候也会用到。测试和统计方法都是一样的。文献参考楼主有兴趣可以看看(英文的):https://www.madronadigital.com/statistics-of-abx-testing
|
|