我想知道一个名字在美国有多受欢迎,最好是通过排名,但是有这个名字的人数也会很好.
The Social Security Administration keeps records of baby names going back to 1879.可能有一种方法可以确定人口中姓名的总体频率,但我决定在某一年获得一个名字的等级,并将其用作一个(有缺陷的)人气代理.
这可以通过their site,所以我想只需解析正确的POST请求的结果就可以了.
目前我正在运行:
curl -d "year=2010&top=1000&number=p" http://www.ssa.gov/cgi-bin/popularnames.cgi > 2010_top_1000.html
然后解析html,并在生成的文件中进行查找.
有一个更好的方法吗?
更新:
使用上述方法可以获得的最多名称是1000.您可以在此处获取频率超过5个名称的婴儿名称的全部列表:http://www.ssa.gov/oact/babynames/limits.html.
最佳答案 美国人口普查局在1990年想到了完全相同的事情,然后他们发表了这个:
http://www.census.gov/genealogy/names/names_files.html
不幸的是,我不认为他们对2000年或2010年的数据做了同样的事情.