python利用百度API进行地理编码(将地名转换为经纬度信息)

更新时间:2018-3-28
更新内容:优化部分代码,添加mongodb部分的内容

本文章通过讲解如何在百度地图API申请密钥,然后在python中调用API接口将自有数据中的地名转换为经纬度坐标。

运行环境: python3

一、注册密钥

在百度地图API上相关位置的展现是以经纬度为基础的。要使用百度地图接口需要注册百度地图API以获取免费的密钥,才能完全使用该API。登录网址:http://lbsyun.baidu.com/
首页点击申请密钥按钮,经过填写个人信息、邮箱注册等,成功之后在开放平台上点击“创建应用”,填写相关信息,应用名称可随意填写,应用类型根据自己需要进行设置,若是做安卓开发则选择Android SDK,本应用中因为是通过浏览器端进行调用,所以选择浏览器端。在这里特别说明的是,在IP白名单框里,如果不清楚自己的IP地址,最好设置为:0.0.0.0/0,虽然百度提醒它会有泄露使用的风险,但是有时候你把你自己的IP地址输进去可能也不行。提交后,在你创建应用的访问应用(AK)那一栏就是你的密钥。

二、利用申请好的密钥获取经纬度坐标

注册好密钥后就可以使用百度Web服务API下的Geocoding API接口来获取你所需要地址的经纬度坐标并转化为json结构的数据,开发文档链接为Geocoding API,该文档中有一些参数的说明,如果需求和本文不太一致,可前往该页面了解每个参数的作用并进行修改以获取需要的效果。
下面是根据地址获取经纬度的函数。传入地名,返回纬度,经度

import json
from urllib.request import urlopen, quote
import requests
def getlnglat(address):
    url = 'http://api.map.baidu.com/geocoder/v2/'
    output = 'json'
    ak = '申请好的密钥' # 浏览器端密钥
    address = quote(address) # 由于本文地址变量为中文,为防止乱码,先用quote进行编码
    uri = url + '?' + 'address=' + address  + '&output=' + output + '&ak=' + ak 
    req = urlopen(uri)
    res = req.read().decode() 
    temp = json.loads(res)
    lat = temp['result']['location']['lat']
    lng = temp['result']['location']['lng']
    return lat, lng

三、读取数据批量获取经纬度

{"种类": "火锅", "商家名称": "沸炉火锅·地道的川味火锅(怀柔...", "电话": " 010-60686895", "营业时间": "10:00-21:00 周一至周日", "评分": 9.2, "地址": "北京市怀柔区府前西街2号新悦百货四楼", "链接": "http://www.dianping.com/shop/70861885", "人均消费": 96, "评论数量": "261"}
{"种类": "北京菜", "商家名称": "青龙山庄", "电话": " 13141427145", "营业时间": "全天 周一至周日", "评分": 7.8, "地址": "北京市怀柔区怀北镇河防口村青龙峡道口公交站东800米", "链接": "http://www.dianping.com/shop/68040161", "人均消费": 92, "评论数量": "15"}

本文中读取的数据为上述类型的json数据,读取每一行数据到一个字典中,将字典中的地址数据传给上文中的参数,获取返回的经纬度,并写入字典中,存储为新的数据。
完整代码为:

#-*-coding:utf-8-*-
# getlonlat.py
# from: mamq
# run: python3 getlonlat.py
from urllib.request import urlopen, quote
from pymongo import MongoClient
import json
import codecs
import sys
import os

path = sys.path[0] + os.sep

def getlnglat(address):
    """根据传入地名参数获取经纬度"""
    url = 'http://api.map.baidu.com/geocoder/v2/'
    output = 'json'
    ak = '申请好的密钥' # 浏览器端密钥
    address = quote(address) 
    uri = url + '?' + 'address=' + address  + '&output=' + output + '&ak=' + ak 
    req = urlopen(uri)
    res = req.read().decode() 
    temp = json.loads(res)
    lat = temp['result']['location']['lat']
    lng = temp['result']['location']['lng']
    return lat, lng

def jsondump(outfilename, dic):
    """传入保存路径和字典参数,保存数据到对应的文件中"""
    with codecs.open(path + outfilename + '.json', 'a', 'utf-8') as outfile:
        json.dump(dic, outfile, ensure_ascii=False)
        outfile.write('\n')

def convertfile(filename):
    file = codecs.open(path + filename, 'r', encoding='utf-8')
    outfilename = 'loc' + filename
    for line in file:
        dic = json.loads(line.strip())
        address = dic['地址']
        dic['lat'], dic['lng'] = getlnglat(address)
        jsondump(outfilename, dic)

def convertmongodb(host, dbname, collname):
    '''连接mongodb, 并根据其位置字段得到其坐标信息,进而更新数据库'''
    client = MongoClient(host, 27017)   
    db = client[dbname]
    collection = db[collname]
    for dic in collection.find():
        dic['lat'], dic['lng'] = getlnglat(dic['地址'])
        collection.save(dic) # 更新数据,并覆盖相同_id的记录
    print (dic)

if __name__ == '__main__':
    filename = '/home/mamq/test.json'
    # convertfile(filename)
    host = '192.168.1.101' # 需要连接的数据库所在ip
    dbname = 'landPlan'
    collname = 'xian'
    convertmongodb(host, dbname, collname)

参考资料:
[1]:Geocoding API:Web服务API

    原文作者:MoonBreeze_Ma
    原文地址: https://blog.csdn.net/qq_23926575/article/details/72569995
    本文转自网络文章,转载此文章仅为分享知识,如有侵权,请联系博主进行删除。
点赞