查看原文
其他

WeChat ID qtbigdata Intro 国内首家工业大数据交易中心,全国现有八所大数据交易中心之一! 导读:全球编辑网数据新闻奖理事、通讯部主任Marianne Bouchart为我们分享了她挖掘数据的工具与技巧,特别是这份线上数据资源清单,让我们一睹为快! 以下就是她推荐的数据资源列表: 1 Dataportals.org 来自世界各地的开放数据门户的综合列表,是寻找各种不同数据很好的起点。 2 FindTheData.com 和Dataportals.org相似,它包含了很多不同主题和行业的数据。 3 EU Data Portal:欧盟数据库 于上周刚刚推出,现在仍处于测试阶段。它由欧洲委员会资助,可用于浏览官方数据。 4 European Union Open Data Portal 很像EU Data Portal,这个网站也提供欧洲不同主题的综合性数据。 5 Data.gov.uk 英国政府的数据网站,公开公共数据以帮助人们了解数据如何工作、政策是如何制定的。 6 Data.gov 和Data.gov.uk对应,这是美国的政府数据网。还有许多来自其他国家的类似网站,可以作为数据来源。 7 Open Corporates 世界上最大的开放式数据库公司。其主要目标是为每个已建立的公司创建一个URL,现在这里已经汇集了大量商业性数据。 8 WikiLeaks 人们总以为维基解密是过时的,但Bouchart强调,这仍然是一个特殊的资源,也是个会定期更新的网站。 9 The World Bank 它拥有一个数据门户,提供关于世界各地发展问题的免费、开放的数据。 10 The UN Data Portal 这里按照国家和主题,提供综合性数据列表。 11 The UNHCR Data Portal 这里提供针对难民危机的数据,有着非常视觉化的资源,并且提供原始数据信息。 12 The World Health Organisation Data 这里的大型数据库包含地图和报告,以及各种国家统计数据。 13 Google Public Data Explorer 输入关键词,它就会搜索到与此相关的数据信息,无论是什么数据来源。 14 GetTheData.org 在这个论坛,用户可以询问他人如何找到特定数据。 15 Crowdsourcing using Google Forms 曾被英国《卫报》等机构广泛使用,用来收集他们的读者购买了多少奥运门票等数据。 16 WhatDoTheyKnow.com 当你没法找到你想要的数据时,这里就是个好去处。该网站汇集了所有已提交的信息公开申请,并告知你这些请求是否成功。 17 Quora:知乎英文版 可以用来浏览信息,就像GetTheData.org一样,也可以询问他人哪里可以搜索到特定数据。 18 Google 除了上面提到的,你也可以直接在谷歌上找到数据,以下操作符会大大帮助到你: ★搜索文件类型中,填写CSV或XLS可以用来搜索excel表单 ★SHP可以用来搜索地质数据 ★MDB、SQL和DB用来做数据库提取 ★你还可以输入PDF,比如site:Adidas-group.com,filetype:pdf(在指定网址Adidas-group.com中,搜索类型为pdf的文件) ★inurl:downloads,filetype:xls:这个指令不仅能让你找到公司或组织公开的文件,也能帮你找到他们内部共享的信息 要做更好的数据新闻,就尝试从谷歌那里搜刮更多的数据。 19 Bouchart ★Bouchart可以运用谷歌来搜索网页,一条魔法指令就是: =importHTML(“”,”table”,N) ★伯克利的电子表单教程,以及新闻调查中心的数据新闻手册,后者可以指导你在使用表格查询数据时获取更多的信息。 20 Open Refine 别忘了清洗你的数据!Bouchart提醒道,数据中的各种漏洞,意味着信息有可能是错误或不可靠的。她建议使用Open Refine,一个免费的源代码开放工具,下载到本地之后,不需联网即可使用。 往期PPT、报告下载: 全球人工智能发展报告(2016)【PPT】2016智能硬件行业洞察报告 【PPT】中国互联网发展趋势报告2016 【干货】全套大数据工程师必备技能图谱 《2016中国大数据市场年度综合报告》 钱塘干货 | 大数据标准化白皮书(2016版) H5干货 | 智能制造之传感器数据分析报告 往期干货: 钱塘干货 | 数据收集和处理工具一览 五个技巧教你用编程实现数据可视化 【干货】全套大数据工程师必备技能图谱 干货 | 28页PPT详解腾讯数据挖掘体系及应用 全球大数据领域顶级开源工具汇总【推荐收藏】 钱塘干货 | 你要的“大数据”学习资料介绍这里都有 往期可视化阅读: 两化融合  | 3D打印  |  大数据投资  |  大数据应用  VR/AR  | 工业机器人  | 物流   |  智能硬件 往期热文: 大数据  |  工业4.0  |  云计算  |  人工智能  AR   | 物联网  |  可视化  |  报告 钱塘数据坚持“激活工业数据资产,完善工业发展生态”的核心理念,以“产业+金融+大数据”协同发展为主攻方向,积极打造工业领域最全面、最强大垂直搜索平台和用户工具平台,并逐步演化为国内最大的“工业大数据中央厨房”,成为推动企业大数据应用和产业金融应用加快发展的“核心动能”,从而真正实现企业大数据资产化,激活企业传统要素资产和新型数据资产。 阅读原文,咱静下心来一起聊聊大数据。 Author requires users to follow Official Account before leaving a comment Write a comment Write a comment Loading Most upvoted comments above Learn about writing a valuable comment Scan QR Code via WeChat to follow Official Account

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存