返回首页
您的位置:首页 > 新闻 > CCF聚焦

CCF继续开放200T互联网网页历史数据

阅读量:192 2023-12-27 收藏本文

2016年7月14日,中国计算机学会(CCF)获得北京大学网络实验室捐赠的近200T中国互联网网页历史数据(CWP200T)。为了更好地发挥这批数据的潜在研究价值,CCF决定继续开放该数据集,向有兴趣的研究机构和个人提供免费拷贝。


CWP200T包含在2002-2015年间公开存放在于中国互联网上的70多亿网页文本数据,涵盖上百万个网站,是开展网络大数据技术研究的极好素材。在当下大数据带来无限憧憬、社会呼唤数据开放共享之际,CCF希望借助此举彰显数据开放精神,以实际行动推动数据共享。


CCF欢迎对CWP200T有兴趣的会员提出数据拷贝申请,使用者需与CCF签署非商业、无侵害使用承诺书,因拷贝工作将产生劳务成本,故使用者同时还需缴纳服务费。


附:CWP200T申请拷贝流程:

提交电子版承诺书——审核(4个工作日内答复)——审核通过——申请单位自行准备存储设备(快递前先将存储设备照片发送至CCF)——CCF确认设备可使用——提交纸质版承诺书并支付服务费——CCF开具增值税普通发票(预约拷贝时间)——快递存储设备——拷贝后寄回(也可以自行送/取)

详情请联系:宋广大,gdsong@ccf.org.cn


CWP200T数据使用承诺书