banner

大数据告诉你:“三短一长选最长”是有道理的!

作者: afenxi来源: afenxi时间:2017-05-19 14:03:210

摘要:如果完全按照随机逻辑,正确答案在四个选项的分布应该都在25%左右,至少也该是相差不大、错落有致的。可是这个整齐的阶梯降是怎么回事?”

大数据告诉你:“三短一长选最长”是有道理的!-数据分析网

作者:团支书    来源:城市数据团    数据和技术支持:BDP个人版

学姐又来找我了。

她说:“小团啊,6月份就要高考了,你帮我看看选择题怎么做最好?”

我愣了一下:“学姐你都研究生毕业考上公务员了,还关心高考?……该不会!!!你对高中生也下手了???”

学姐有点尴尬,又有点扭捏地说:“那个……他英语不太好。”

好吧,为了帮助学姐的小男朋友,我只好勉为其难地搜集了一下最近三年的高考英语真题,清理出其中完形填空选择题的部分,然后麻溜地做出了下面这个统计。

大数据告诉你:“三短一长选最长”是有道理的!-数据分析网

看着图,我陷入了思考:“A的怎么比例这么高?如果完全按照随机逻辑,正确答案在四个选项的分布应该都在25%左右,至少也该是相差不大、错落有致的。可是这个整齐的阶梯降是怎么回事?”

学姐说:“是有点奇怪,难道答案里真的有文章?”

我想了想说:“可能是这样的。就拿我来说吧,我喜欢选C和D,因为笔画最少。但是出题老师可能故意把答案设置在笔画多的A和B,造成了分布的不均衡。”

学姐点头说:“有可能,老师故意设置陷阱。哎呀小团你赶紧看看,现在比较流行的那个口诀,‘三短一长选最长,三长一短选最短,长短不一就选B,参差不齐就选D’,会不会也是陷阱啊?”

我翻了个白眼说:“这哪用分析,肯定是啊。‘长短不一’和‘参差不齐’有区别吗?”

但学姐却突然紧张和认真了起来:“不行不行,你一定要仔细分析一下。我请你吃饭,不,吃火锅!”

既然学姐都强烈要求了,我就继续勉为其难地分析一下吧。

首先,要把题目分为四类:三短一长、三长一短、参差不齐、长度一致。这个分类看上去很容易,但对于机器的批量识别却需要进行少许的人为规则设定(这套规则在这里就不赘述了,感兴趣的可以看文末的注释)。

根据分类结果,题型分布是这样的:

大数据告诉你:“三短一长选最长”是有道理的!-数据分析网

如图所示,接近半数题目都属于参差不齐类,三短一长、三长一短各有分布,而可能是英语这个学科的特殊性,长度一致的题目少到可以忽略。

那么,按照口诀做题,到底对不对呢?

这个判断看似简单,其实涉及到按长度判断和按ABCD判断两种不同的逻辑。我不禁再次感叹,有些对于人很简单的事情,对机器真的很麻烦啊。

忙活一阵过后,我总算得出了下面的结论:

大数据告诉你:“三短一长选最长”是有道理的!-数据分析网

众所周知,如果纯粹瞎蒙,正确率应该在25%左右。

而按照该口诀做题,正确率还不如瞎蒙(参差不齐的题目计算的是选B和D的平均正确率,非B和D的概率之和,下同)。而如果把每类题目的题型分布与正确率结合起来看,该口诀的综合正确率只有20%。

我说:“学姐你看,出题老师早就看穿了学生的心思,还是让你的小男朋友好好复习吧,少搞投机取巧。”

学姐却说:“小团你还是太天真了。既然我们已经知道口诀是错的,就可以反其道而行之。比如说,三长一短,就在三个长的里面选。”

说完,学姐满意地离开了,一路留下打电话时银铃般的笑声。

而我却突然想到,学姐考上公务员,该不会也是靠蒙选择题吧?

为了解答心中的疑惑,我又搜集了近三年公务员行政能力测试的题目。顺便吐槽一下,看到题目的时候,我差点以为在考“文综+理综”。

闲话少说,我们直接来看结论吧。

与高考英语形成鲜明对比的是,公务员行测中有多达54%的长度一致的题目,按照口诀还真是没法处理呢。

大数据告诉你:“三短一长选最长”是有道理的!-数据分析网 而从口诀的正确率来看,却呈现出有趣的现象:三短一长选最长的正确率达到28%,参差不齐选BD的正确率也到达了随机的25%水平。四句口诀居然对了三句!

大数据告诉你:“三短一长选最长”是有道理的!-数据分析网 看上去,这个口诀似乎在公务员行测考试上非常实用啊。

然而事实上,由于三长一短拖了后腿,该口诀的综合正确率仅为21%(长度一致的不计入题目总数,下同),比高考英语高出1个百分点。

看起来,公务员考试的出题老师似乎比高考出题老师还是要善良一些。

那么,有没有更加善良的、故意按照套路出题的老师呢?

我想到了前段时间刚刚通过的驾考科目一,据说该考试的一次通过率高达95%以上。

于是,我又翻出前段时间用过的题库,进行了同样的统计。

与上两类考试相比,驾考的题型分布是比较均匀的。

大数据告诉你:“三短一长选最长”是有道理的!-数据分析网 再来对比口诀,三短一长选最长的正确率高达46%!天了噜!

大数据告诉你:“三短一长选最长”是有道理的!-数据分析网 虽然只有三短一长这一句适用,但由于该类题目数量占比也较多,总体而言,该口诀应用于驾考科目一的综合正确率为28%。超过随机水平的25%了有木有!

看着下面这张图,我陷入了深深的思考。

大数据告诉你:“三短一长选最长”是有道理的!-数据分析网

我想对即将参加高考的孩子们说:

出题这件事,无关老师的“善良”程度,真金在哪里都会发光。

尽管高考一直受到各种质疑,它仍然可能是你们人生中最最公开公正、最最考验真正实力、最最值得你们认真对待的竞赛。

而成长,就是一个套路越来越多、真诚越来越少的过程。

注:

1.本文不对任何人的任何考试结果负责。

2.本文由“城市数据团”原创且首发,由“BDP商业数据平台”提供数据和技术支持,转载请注明出处。觉得图图很漂亮?BDP仪表盘地址:https://me.bdp.cn/share/index.html?shareId=sdo_23066450577c720c8f4d921c1272f410#/rd。

3.题目分类说明

a.计算每个选项的字符数并进行排序,最长的选项记为len1,最短的记为len4,使得len1>=len2>=len3>=len4

b.计算相邻选项之间的字符数之差,记为gap。例如,gap12=len1-len2

c.题目分类

长度一致:len1=len4

三短一长:gap12=max(gap12,gap23,gap34)&gap12<>0

三长一短:gap34=max(gap12, gap23,gap34) &gap34<>0

参差不齐:其他

banner
看过还想看
可能还想看
热点推荐

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限