关于大数据预测高考作文题的分析
关于大数据预测高考作文题的分析随着大数据时代的到来,用大数据预测今年的高考作文 题成为不少信息供应商的噱头之一,其中以预测最为引 人关注,尤其是其押中了今年高考作文上海卷的自由主题, 让不少网友喜出望外,表示妈妈再也不用担心我的高考作文 了!到底大数据压题靠不靠谱呢?高考作文押中题一直是不少考生的梦想。进入云计算时 代,用大数据来预测高考作文题成为今年不少信息技术公司 的主攻对象,甚至有大数据库号称押中今年高考 12 道作文 题。今年高考前夕,预测推出了高考作文预测项目,记 者登录预测网站,就可以打开高考作文预测页面,页面 上出现一个类似蜂巢般的图表,分成六大色块,每一个色块 都代表今年高考作文最有可能的命题方向,每个色块均有一 个主题,并配有命中百分比数据的分析,包括时间的馈赠 %、生命的多彩%、民族的变迁%、教育的思辨%、心 灵的坚守%和发展的困惑%。根据这六大方向分别配有 8~9 个不同的关键词,点击这些关键词就会出现 3 篇例文, 再次点击例文,就会和搜索联系在一起,直接查看例文 和相关素材。根据这一预测,宣布这一预测项目成功押中今年全国 18 道高考作文题中的 12 道,如时间的馈赠,关键词为依 旧和记忆,对应今年高考作文题中,江苏卷和广东卷的作文 题目分别为什么是不朽、胶片与数码时代。而生命的多彩中, 直接给出了关键词自由,几乎完全和今年上海作文题穿越沙 漠的自由和不自由契合,而青春一词也在江苏卷中提到。预测方面认为,这次预测充分展示了大数据的神奇 之处,命中率之高令人难以想象。据大数据专家介绍,此次预测高考作文题是挖 掘了近八年各个省市的高考真题和模拟题,并且结合了近些 年的搜索风云热点和热点数据,根据当年社会思想的关 注与潮流,现有数据和实时数据相结合组成作文预测的 大数据库,并在它们与高考命题之间建立关联;而后, 大脑将前面提到的大数据进行智能分析,通过概率主题模型 算法模拟人脑思维,反向推导出作文主题及关联词汇,从而 进行主题预测,提供关键词、几率以及范题和素材。专家称,这种海量数据的分析对于一个每天需要响应几 百亿次搜索的门户搜索网站来说,技术上并不算什么,主要 是如何通过数据进行分析,所以表面上看,命题者的思路千 变万化,毫无头绪,但是一旦放到海量数据下面进行分析, 命题的个人意志一定会受到社会各种因素和信息的影响,大 数据预测者就是要找到这个可能影响命题者思路的变量因 素,而这中间的规律和轨迹又不是个体命题者能够体会和察觉的。 今年参加高考的考生小利也告诉记者,实际上,所谓押题只能是把所有的希望押在几道题上,然后通过背诵文章、 背诵结构和材料,确保写出高分作文,如果像大数据库这样 提供了四五十个关键词,每个关键词又有 3 篇例文和大量素 材,这样算下来就是 100 多道作文题,如果给你 100 多道作 文题就不叫押题,直接叫复习而已,因为给出的可能性太多, 其实可以忽略不计了,因为实际高三也会复习到大量作文 题。陈庆雯老师坦言自己从不会让学生押题,以不变应万变 才是最重要的,而且真正好的作文题并不怕人家押中。华南师范大学文学院教授柯汉琳也表示,用大数据押题 不但能让考生看到,也会让命题者看到,不排除命题者为了 避免和大数据分析碰车特意另辟蹊径,而且就算是沾边押中 了部分关键词,能不能得到高分仍是未知数,这些年作文题 思辨性越来越强,几乎难有标准结论和答案,即便是范文可 能也会因为缺乏新意而无法得到高分。陈庆雯老师表示,押中完全一样的作文题的几率并不 高,如果学生自己没有理解、分析能力,似是而非的去生搬 硬套材料和范文,阅卷老师一般都能看出来,不但不会得到 高分,甚至可能因为没有写出自己的真情实感而获得低分, 不如扩大阅读面,储备更多的知识,这才是写好高考作文的制胜法宝。