开放数据源

1、政治和政府数据

http://data.gov网站

http://data.gov
该网站数据多与政府有关

Socrata网站

http://www.socrata.com/resources
Socrata网站是探索政府相关数据的好去处。它提供了几种可视化工具,可帮助用户探索数据。

美国人口调查局

http://www.census.gov/data.html

UN3ta

https://data.un.org
UNdata是基于互联网的数据服务,提供UN统计数据库。

欧盟开放数据平台

http://open-data.europa.eu/en/data
欧盟数据开放平台提供欧盟各机构的大量数据。

http://data.gov.uk

http://data.gov.uk
英国政府网站, 收录英国国家书目(British National Bibliography):自1950年以来,英国出
版的所有图书和其他出版物的元数据。

中情局世界概况

https://www.cia.gov/library/publications/the-world-factbook/
中情局世界概况网站隶属美国中央情报局,提供了267个国家的历史、人口、经济、政府、
基础设施和军事信息。

2、健康数据

http://healthdata.gov网站

http://www.healthdata.gov/
该网站统计流行病学、人口数据数据等医学相关的数据。

英国国民医疗服务体系和社会福利信息中心

http://www.hscic.gov.uk/home
该网站收录英国国民医疗服务体系 (National Health Service)所提供的健康数据。

3、社会数据

Facebook Graph

https://developers.facebook.com/docs/graph-api
Facebook官方提供的API,用于查询该网站用户公开的海量信息。

Topsy网站

http://topsy.com/
Topsy网站维护了一个数据库,收录了Twitte用户发表的消息(推文),并开放检索功能,其中所存储的最早的消息可追溯至2006年。它还提供了几种对话分析工具。

谷歌趋势

http://www.google.com/trends/explore
谷歌趋势提供自2004年以来任意词语的搜索量(与全部搜索的占比)。

Likebutton网站

http://likebutton.com/
挖掘Facebook公开的数据——来自全球用户或你自己的朋友圈——了解当前人们喜欢(“Like”)什么。

4、其他开放数据集

亚马逊网络服务开放数据集

http://aws.amazon.com/datasets
平吕逊网络服务提供了一个开放数据集中心仓库,它包含多个数据集。其中一个非常有趣的数据集是1000 Genome Project(全球千人基因组计划),该计划尝试建立最全面的人类基因信息数据库。该仓库还存储了NASA的地球卫星图像。

DBPedia项目

http://wiki.dbpedia.org
维基百科提供了上千万条数据,主题多种多样,既有结构化数据,也有非结构化数据。DBPedia项目雄心勃勃,意在为维基数据编制目录,并创建开放和可自由发布的数据库,便于每个人分析维基数据。

Fressbase网站

http://ww.freebase.com/
该社区数据库提供四千五百多万条涵盖多个主题的信息。

Gapminder网站

http://www.gapminder.org/data
该网站数据来自世界卫生组织和世界银行,包括全球经济、医疗和社会统计数据。

5、金融数据

谷歌金融

https://www.google.com/finance
收录40年以来的股票数据,实时更新。

6、气候数据

美国国家气候数据中心

http://www.ncdc.noaa.gov/data-access/quick-links#loc-clim
美国国家气候数据中心提供了大量环境、气象和气候数据集,是世界最大的气象数据档案。

WeatherBase网站

http://www.weatherbase.com/
该网站提供全球四万多个城市的气候平均值、天气预报和当前天气状况数据。

Wunderground网站

http://www.wunderground.com/
该网站提供由卫星和气象观测站收集的温度、风力和其他气候测量数据。

7、体育数据

Pro-Football-Reference网站

http://www.pro-football-reference.com/
该网站提供足球及其他几种体育活动的数据。

8、报纸、图书及其他出版物

《纽约时报》

http://developer.nytimes.com/docs
该网站提供《纽约时报》自1851年以来的新闻文章,并为其编制了索引,开放查询服务。

Google Books Ngrams项目

http://storage.googleapis.com/books/ngrams/books/datasetsv2.html
该项目为谷歌图书项目的一部分, 可对几千万本电子书的全文进行查询和分析。

9、音乐数据

百万歌曲数据集
http://aws.amazon.com/datasets/6468931156960467
百万歌曲数据集(Million Song Data Set)为亚马逊网络服务的一部分,收录了超过一百万首歌曲和乐曲的元数据。

参考资料:

    原文作者:晒月亮的孩子
    原文地址: https://zhuanlan.zhihu.com/p/37409289
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞