本帖最后由 wudanao 于 2018-9-8 21:03 编辑
第一种:H0 = 检测两条线没有差别
还是
第二种:H0 = 金耳朵不存在
这是两种完全不同的思路。
------------------------------------------------------------------------------------------
第一种,如果你假设所有人的听音能力都一样,并且听六次没有听力疲劳的影响的话,那只需要把对100个人(假设实验100个人参加) x 6 共600次的实验结果的正确率和50%比较一下就好。
如果考虑到每个人的听力可能不一样的话,那没有一个control group,比如给同样的这批人听六组一样的线材(在他们不知情的情况下)看看他们的正确率的话,什么结论都得不出。
第二种,需要先对金耳朵下定义。
(1)如果定义金耳朵为正确率>80%,由于一个人的答案并不影响另一个人的答案(除非实验过程是每个人把自己的答案公开报出),那可以把整个实验超过80%的人数量和如果靠蒙能产生80%数量的人binomial test一下,看看p值是否大于5%(1%,10%什么的随你定)就好。(2) 如果定义金耳朵为”超于平均水平的人类“,那这个情况复杂些可能有多种检测方法。我能想到的是你可以用maximum likelihood 对每个人的正确率,100个data point fit一个mixed bernoulli distribution,即假设这100个人中存在两个group,一个金耳朵一个一般耳朵;然后看看金耳朵的group里的人的平均正确率相对于整体的平均正确率是否有statistically significant的提高。在这种情况下samplesize是否后意义?肯定会有。但是如何影响并不是很明确,绝不是”sample size越大实验越没用“
其实对于第二种(1)的情况,具体怎么做真的还是具体取决于你想干什么。如果你的问题是”100个人每个人六次实验产生了两个全满贯这个事件牛不牛逼“的话,那我觉得我所述这种做法没有错。但是如果你的问题是”100个人每个人六次实验产生了两个全满贯,这两个全满贯该不该给他们颁奖“,那我觉得你算下他们两个的正确率是否统计学上明显大于80%就好,和具体的sample size没有关系。
|