章汕123 发表于 2022-10-14 10:33:00

工业企业数据+海关/专利/土地出让数据及匹配结果(2000-201...

本帖最后由 章汕123 于 2022-10-14 15:46 编辑

2984829931
工业企业数据、海关数据库、专利数据、土地出让及匹配数据数据量大,处理难度也较高,费时费力,在网络上售价大几百甚至上千。

内容包括:
1.中国海关数据库11.9G(2000-2016年)
2.工业企业数据库5.5G(1998-2014年)
3.工业企业与海关匹配结果160M(2000-2014年)
4.工业企业与专利数据匹配结果50.4G(1998-2014)
5.工业企业与土地出让匹配数据 6.7G
6.数据说明和匹配情况说明

一、工业企业数据库(1998-2014年):来自于国家统计局,共计四百多万个观测值,包含企业所有的财务指标,近200个变量,是非常详细的企业层面的数据。
https://bbs-pic.datacourse.cn/forum/202210/14/101352w9wjq88nxne3wqkk.png

二、海关数据库(2000-2016年):来自海关总署,包含海关有记录的所有通关资料,包括企业名称,时间,货物,重量,价值,通关地点,目的地,进口国/出口国等诸多信息。
https://bbs-pic.datacourse.cn/forum/202210/14/101447vqbs5ftq9rqzuq7r.png

三、工业企业与海关数据匹配结果(2000-2014年)
https://bbs-pic.datacourse.cn/forum/202210/14/1015330hvnhph4syevohb1.png

四、工业企业与海关数据匹配方法说明:
首先使用企业名称和年份对两个数据库进行匹配,鉴于企业名称存在缺失的情形,进一步利用两个数据库都存在的企业的邮编信息、联系电话信息进行匹配,具体是使用企业所在地邮政编码、后七位电话号码与年份进行匹配。具体匹配方法参考文献:
Yu M , Tian W . China's Processing Trade: A Firm-Level Analysis. 2012.


五、工业企业与专利数据匹配结果
第一步,参照Brandt(2012)的方法处理工企数据和专利数据;
第二步,根据企业名称和年份与专利数据进行匹配;
第三步,根据组织代码和年份与专利数据进行匹配;
第四步,合并第二、三步的匹配数据,并去重;
最终,我们得到任意满足第二步或第三步匹配的企业。
https://bbs-pic.datacourse.cn/forum/202210/14/101631mgv6z8gaxnzm2iv8.png

六、工企土地出让匹配数据
基于土地出让数据库,计算各地级市每年的土地出让面积及金额,后根据工业企业所在地,匹配当年地级市的土地出让数据。
https://bbs-pic.datacourse.cn/forum/202210/14/101701qogxgo76ehtrt73q.png


页: [1]
查看完整版本: 工业企业数据+海关/专利/土地出让数据及匹配结果(2000-201...