Skip to content

数据采集(行业、学科、行政区划、中图分类代码,30+W条科技报告数据)

Notifications You must be signed in to change notification settings

SAH01/data-collection

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Mar 31, 2023
e974c86 · Mar 31, 2023

History

5 Commits
Mar 31, 2023
Mar 31, 2023
Sep 26, 2022
Sep 26, 2022
Sep 26, 2022
Sep 26, 2022
Sep 26, 2022
Mar 31, 2023
Sep 26, 2022
Sep 26, 2022
Mar 24, 2023
Sep 26, 2022
Mar 31, 2023
Mar 31, 2023
Mar 31, 2023
Mar 31, 2023
Sep 26, 2022
Mar 31, 2023

Repository files navigation

目录


1)data_cleaning文件夹

主要完成了对国民经济行业分类与代码(GB/4754-2017、2002、2011)三年的国标整理并存入MySQL数据库。 image


2)std_area文件夹

完成了对统计用区划和城乡划分代码的数据爬取和标准化整理(2009-2021)并存入MySQL数据库。

网址:http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/

image image

3)std_subject文件夹

主要完成了中华人民共和国国家标准·学科分类与代码(2009、1992)的标准化整理并存入MySQL数据库。

image

4)report_data文件夹

完成对国家科技报告服务系统【https://www.nstrs.cn/index】30+W条科技报告数据的爬取和整理入库(mysql)

具体可以查看我的随笔:https://www.cnblogs.com/rainbow-1/p/16725576.html

About

数据采集(行业、学科、行政区划、中图分类代码,30+W条科技报告数据)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages