不满意ldquo中华台北队rdqu http://www.taibeizx.com/tbszy/484837.html前言
00
最近参加了DataWhale组织的寒假组队学习,学习的内容是使用公开的arXiv论文完成对应的数据分析操作。因此也将最近我学到的一些知识分享给大家。
今天要介绍的内容主要包括以下几个部分:
论文数据统计--统计全年各个方向计算机论文数量
论文作者统计--统计所有论文作者出现频率top10的姓名
论文代码统计--统计所有论文类别下包含源代码的比例
以上这三块内容包含了数据分析,数据可视化,正则表达式,爬虫等多方面的内容,请大家搬好小板凳,坐在前排好好学习哦。
论文数据统计
01
首先介绍一下本次数据分析使用的数据集。
数据集来源: