1、政治和政府数据
http://data.gov
该网站数据多与政府有关
Socrata网站
http://www.socrata.com/resources
Socrata网站是探索政府相关数据的好去处。它提供了几种可视化工具,可帮助用户探索数据。
美国人口调查局
http://www.census.gov/data.html
UN3ta
https://data.un.org
UNdata是基于互联网的数据服务,提供UN统计数据库。
欧盟开放数据平台
http://open-data.europa.eu/en/data
欧盟数据开放平台提供欧盟各机构的大量数据。
http://data.gov.uk
英国政府网站, 收录英国国家书目(British National Bibliography):自1950年以来,英国出
版的所有图书和其他出版物的元数据。
中情局世界概况
https://www.cia.gov/library/publications/the-world-factbook/
中情局世界概况网站隶属美国中央情报局,提供了267个国家的历史、人口、经济、政府、
基础设施和军事信息。
2、健康数据
http://www.healthdata.gov/
该网站统计流行病学、人口数据数据等医学相关的数据。
英国国民医疗服务体系和社会福利信息中心
http://www.hscic.gov.uk/home
该网站收录英国国民医疗服务体系 (National Health Service)所提供的健康数据。
3、社会数据
Facebook Graph
https://developers.facebook.com/docs/graph-api
Facebook官方提供的API,用于查询该网站用户公开的海量信息。
Topsy网站
http://topsy.com/
Topsy网站维护了一个数据库,收录了Twitte用户发表的消息(推文),并开放检索功能,其中所存储的最早的消息可追溯至2006年。它还提供了几种对话分析工具。
谷歌趋势
http://www.google.com/trends/explore
谷歌趋势提供自2004年以来任意词语的搜索量(与全部搜索的占比)。
Likebutton网站
http://likebutton.com/
挖掘Facebook公开的数据——来自全球用户或你自己的朋友圈——了解当前人们喜欢(“Like”)什么。
4、其他开放数据集
亚马逊网络服务开放数据集
http://aws.amazon.com/datasets
平吕逊网络服务提供了一个开放数据集中心仓库,它包含多个数据集。其中一个非常有趣的数据集是1000 Genome Project(全球千人基因组计划),该计划尝试建立最全面的人类基因信息数据库。该仓库还存储了NASA的地球卫星图像。
DBPedia项目
http://wiki.dbpedia.org
维基百科提供了上千万条数据,主题多种多样,既有结构化数据,也有非结构化数据。DBPedia项目雄心勃勃,意在为维基数据编制目录,并创建开放和可自由发布的数据库,便于每个人分析维基数据。
Fressbase网站
http://ww.freebase.com/
该社区数据库提供四千五百多万条涵盖多个主题的信息。
Gapminder网站
http://www.gapminder.org/data
该网站数据来自世界卫生组织和世界银行,包括全球经济、医疗和社会统计数据。
5、金融数据
谷歌金融
https://www.google.com/finance
收录40年以来的股票数据,实时更新。
6、气候数据
美国国家气候数据中心
http://www.ncdc.noaa.gov/data-access/quick-links#loc-clim
美国国家气候数据中心提供了大量环境、气象和气候数据集,是世界最大的气象数据档案。
WeatherBase网站
http://www.weatherbase.com/
该网站提供全球四万多个城市的气候平均值、天气预报和当前天气状况数据。
Wunderground网站
http://www.wunderground.com/
该网站提供由卫星和气象观测站收集的温度、风力和其他气候测量数据。
7、体育数据
Pro-Football-Reference网站
http://www.pro-football-reference.com/
该网站提供足球及其他几种体育活动的数据。
8、报纸、图书及其他出版物
《纽约时报》
http://developer.nytimes.com/docs
该网站提供《纽约时报》自1851年以来的新闻文章,并为其编制了索引,开放查询服务。
Google Books Ngrams项目
http://storage.googleapis.com/books/ngrams/books/datasetsv2.html
该项目为谷歌图书项目的一部分, 可对几千万本电子书的全文进行查询和分析。
9、音乐数据
百万歌曲数据集
http://aws.amazon.com/datasets/6468931156960467
百万歌曲数据集(Million Song Data Set)为亚马逊网络服务的一部分,收录了超过一百万首歌曲和乐曲的元数据。
参考资料: