时间:2023-01-19 | 标签: | 作者:Q8 | 来源:网络
小提示:您能找到这篇{通过文本挖掘,我们发现了国家公务员考试的这}绝对不是偶然,我们能帮您找到潜在客户,解决您的困扰。如果您对本页介绍的通过文本挖掘,我们发现了国家公务员考试的这内容感兴趣,有相关需求意向欢迎拨打我们的服务热线,或留言咨询,我们将第一时间联系您! |
据中国新闻网报道,2020年网络宣传方式度中央机关及其直属机构公务员招考笔试有超143万人报名,涉及中央和国家机关86个单位、23个直属机构,而计划招录2.4万人,通过资格审查人数与录用计划数之比约为60:1,在报名期间出现多个竞争超“千里挑一”的职位也就不足为奇了。 虽然笔者没参加过国家公务员考试(以下简称“国考”),但本着“内行看门道,外行看热闹”的心态,笔者想一个旁观者的视角,通过一些语义分析技术去发现近八年(2011~2018)国考行政职业能力测验(以下简称“行测”)考了哪些内容,看能否有一些规律性的发现。 数据来源为保证分析的时效性,笔者仅搜集了2011-2018这八年的国考行测试题(将地市级和副省级试题进行合并),仅提取文本中的题干部分,不包含选项。 为了能直观的了解这8年的考题讲了啥,笔者首先从整体上提取其中的关键词。 “行程计算”湖北电视剧广告招商费用类考题是重轴戏以下是经过关键词提取得到的TOP150关键词的词云分布图,其中词汇大小反映的是词汇的重要性程度。 从上图中可以直观的看到,“速度”一词在近8年的国考试题中出现频率较高,说明“行程问题”在国考的试题类型中占较高比重,从如下示例中可以看出:
权重较高的还有“数量”、“里程”、“价格”等关键词,也都反映出国考行测中的计算类型考题较多,国考行测中的数学运算部分,整体难度不大,通常用普通方法都是可以得到答案的。但相对而言,速度比较慢,而借用一些良好的技巧,则可以快速的得到答案。 此外,近些年公务员考试中计算问题考侧重考查考生对常见方法技巧的理解、掌握与灵活运用。常用的方法有凑整法、尾数法、分组或消去法公式法和估算法。 小贴士:
尽管上面的关键词云图能抓住主要词汇,但是各词汇之间的关联性被忽略了,孤立的对某些关键词进行解读有时很难发现一些有意义的洞察。 那么,有没有一种方法能够既捕捉到关键信息(即发掘关键词),又能直观的反映出词汇之间的关联性? 答案是有的。 通过词汇关联图挖掘试题侧重点词汇关联图是上述关键词云图的拓展和延伸 ,增加了语境这一维度,也就是将经常出现在同一个上下文的词汇的关联性表达出来。 基于自动聚类形成的词汇关联图,能自然的反映试题题干文本中的语义特征和潜在结构,由此能准确且清晰的知晓近八年国考行测的出题侧重点。 对于生成的可视化结果,可以这样解读:字体大小表示词汇的权重值大小,原理同上,能反映词汇在评论中的重要性,不同的颜色代表不同的话题。 词汇之间距离越近,说明它们在同一语境中出现的频率较高,越具有语义相关性,比如“速度”、“执法船”、“行驶”、“小时”和“骑车”等词汇挨得很近,我们能迅速联想这些关键词跟试题中的“行程问题”有关,而不是跟政治、物理或者汽车有关。 下图是自动聚类出来的结果,自动聚为8个主题(点击下方图片可查看高清大图): 上图中,按照词汇及其簇群的重要性程度(字体大小、主题词数量)甄选出有意义的主题,根据其中的关键词可以推测这八年国考行测的4个热门考点,依次是:
以上4类是笔者能够直观看出来的,其他的类别可能有过国考经历的小伙伴能识别出来,欢迎大家在留言区发言告诉我~ 小贴士:
最后,笔者还想看看历年的国考行测考题是否存在较大变动,可以将其抽象为一个文本挖掘任务——度量历年国考行测试题之间的相似度,这可以通过对应分析实现。 近八年各年份试题的相似度度量按照上述提取关键词的方法,分别提取近八年的国考行测试题题干中的TOP200关键词,这些关键信息足以代表该年份国考行测试题了,有了这些数据就可以进行对应分析。 最终得到下图(点击下方图片可查看高清大图): 对于上图的可视化结果,可以这样解读:夹角越小的国考试题,代表试题内容相似度越高;其次,每个年份考题附近的关键词汇,离得越近,说明关键词在该年份试题中的重要性程度越高,也就越能代表试题的特征。 由此,我们可以得到两个分析角度:
以上就是作为国考“外行”的笔者做的一些分析,由于仅提取出题干文本,文本数据量较少,难免会出现一些纰漏,而且对于有过国考经历的小伙伴来说,分析的结果可能还显得粗轮廓。 在这里,笔者想要对参加“中华第一考”、努力奋斗的中国考生们表达一下敬佩之情,特以“金榜题名”为主题(不是藏头诗)让机器赋诗4首,聊表敬意: #专栏作家苏格兰折耳喵(微信公众号:Social Listening与文本挖掘),专栏作家,数据PM一只,擅长数据分析和可视化表达,热衷于用数据发现洞察,指导实践。 本德阳市商铺除螨方案文于。,。 ,基于CC0协议 ![]() |
上一篇:大数据BI系统实操总结:如何做数据采集?
下一篇:用便利店的故事,解析怎么学数据分析?(1)
小提示:您应该对本页介绍的“通过文本挖掘,我们发现了国家公务员考试的这”相关内容感兴趣,若您有相关需求欢迎拨打我们的服务热线或留言咨询,我们尽快与您联系沟通通过文本挖掘,我们发现了国家公务员考试的这的相关事宜。
关键词:3年, 中级, 文本挖掘,