更新时间:2018-3-28
更新内容:优化部分代码,添加mongodb部分的内容
本文章通过讲解如何在百度地图API申请密钥,然后在python中调用API接口将自有数据中的地名转换为经纬度坐标。
运行环境: python3
一、注册密钥
在百度地图API上相关位置的展现是以经纬度为基础的。要使用百度地图接口需要注册百度地图API以获取免费的密钥,才能完全使用该API。登录网址:http://lbsyun.baidu.com/,
首页点击申请密钥按钮,经过填写个人信息、邮箱注册等,成功之后在开放平台上点击“创建应用”,填写相关信息,应用名称可随意填写,应用类型根据自己需要进行设置,若是做安卓开发则选择Android SDK,本应用中因为是通过浏览器端进行调用,所以选择浏览器端。在这里特别说明的是,在IP白名单框里,如果不清楚自己的IP地址,最好设置为:0.0.0.0/0,虽然百度提醒它会有泄露使用的风险,但是有时候你把你自己的IP地址输进去可能也不行。提交后,在你创建应用的访问应用(AK)那一栏就是你的密钥。
二、利用申请好的密钥获取经纬度坐标
注册好密钥后就可以使用百度Web服务API下的Geocoding API接口来获取你所需要地址的经纬度坐标并转化为json结构的数据,开发文档链接为Geocoding API,该文档中有一些参数的说明,如果需求和本文不太一致,可前往该页面了解每个参数的作用并进行修改以获取需要的效果。
下面是根据地址获取经纬度的函数。传入地名,返回纬度,经度
import json
from urllib.request import urlopen, quote
import requests
def getlnglat(address):
url = 'http://api.map.baidu.com/geocoder/v2/'
output = 'json'
ak = '申请好的密钥' # 浏览器端密钥
address = quote(address) # 由于本文地址变量为中文,为防止乱码,先用quote进行编码
uri = url + '?' + 'address=' + address + '&output=' + output + '&ak=' + ak
req = urlopen(uri)
res = req.read().decode()
temp = json.loads(res)
lat = temp['result']['location']['lat']
lng = temp['result']['location']['lng']
return lat, lng
三、读取数据批量获取经纬度
{"种类": "火锅", "商家名称": "沸炉火锅·地道的川味火锅(怀柔...", "电话": " 010-60686895", "营业时间": "10:00-21:00 周一至周日", "评分": 9.2, "地址": "北京市怀柔区府前西街2号新悦百货四楼", "链接": "http://www.dianping.com/shop/70861885", "人均消费": 96, "评论数量": "261"}
{"种类": "北京菜", "商家名称": "青龙山庄", "电话": " 13141427145", "营业时间": "全天 周一至周日", "评分": 7.8, "地址": "北京市怀柔区怀北镇河防口村青龙峡道口公交站东800米", "链接": "http://www.dianping.com/shop/68040161", "人均消费": 92, "评论数量": "15"}
本文中读取的数据为上述类型的json数据,读取每一行数据到一个字典中,将字典中的地址数据传给上文中的参数,获取返回的经纬度,并写入字典中,存储为新的数据。
完整代码为:
#-*-coding:utf-8-*-
# getlonlat.py
# from: mamq
# run: python3 getlonlat.py
from urllib.request import urlopen, quote
from pymongo import MongoClient
import json
import codecs
import sys
import os
path = sys.path[0] + os.sep
def getlnglat(address):
"""根据传入地名参数获取经纬度"""
url = 'http://api.map.baidu.com/geocoder/v2/'
output = 'json'
ak = '申请好的密钥' # 浏览器端密钥
address = quote(address)
uri = url + '?' + 'address=' + address + '&output=' + output + '&ak=' + ak
req = urlopen(uri)
res = req.read().decode()
temp = json.loads(res)
lat = temp['result']['location']['lat']
lng = temp['result']['location']['lng']
return lat, lng
def jsondump(outfilename, dic):
"""传入保存路径和字典参数,保存数据到对应的文件中"""
with codecs.open(path + outfilename + '.json', 'a', 'utf-8') as outfile:
json.dump(dic, outfile, ensure_ascii=False)
outfile.write('\n')
def convertfile(filename):
file = codecs.open(path + filename, 'r', encoding='utf-8')
outfilename = 'loc' + filename
for line in file:
dic = json.loads(line.strip())
address = dic['地址']
dic['lat'], dic['lng'] = getlnglat(address)
jsondump(outfilename, dic)
def convertmongodb(host, dbname, collname):
'''连接mongodb, 并根据其位置字段得到其坐标信息,进而更新数据库'''
client = MongoClient(host, 27017)
db = client[dbname]
collection = db[collname]
for dic in collection.find():
dic['lat'], dic['lng'] = getlnglat(dic['地址'])
collection.save(dic) # 更新数据,并覆盖相同_id的记录
print (dic)
if __name__ == '__main__':
filename = '/home/mamq/test.json'
# convertfile(filename)
host = '192.168.1.101' # 需要连接的数据库所在ip
dbname = 'landPlan'
collname = 'xian'
convertmongodb(host, dbname, collname)
参考资料:
[1]:Geocoding API:Web服务API