从 Web 响应中解析 Xml

2024-01-06

我正在尝试获得对数千个城市进行地理编码的提名的回复。

import os
import requests
import xml.etree.ElementTree as ET

txt = open('input.txt', 'r').readlines()
for line in txt:
 lp, region, district, municipality, city = line.split('\t')
 baseUrl = 'http://nominatim.openstreetmap.org/search/gb/'+region+'/'+district+'/'+municipality+'/'+city+'/?format=xml' 
 # eg. http://nominatim.openstreetmap.org/search/pl/podkarpackie/stalowowolski/Bojan%C3%B3w/Zapu%C5%9Bcie/?format=xml
 resp = requests.get(baseUrl)
 resp.encoding = 'UTF-8' # special diacritics
 msg = resp.text
 # parse response to get lat & long
 tree = ET.parse(msg)
 root = tree.getroot()
 print tree

但结果是：

Traceback (most recent call last):
File "geo_miasta.py", line 17, in <module>
    tree = ET.parse(msg)
File "/usr/lib/python2.7/xml/etree/ElementTree.py", line 1182, in parse
    tree.parse(source, parser)
File "/usr/lib/python2.7/xml/etree/ElementTree.py", line 647, in parse
    source = open(source, "rb")    
IOError: [Errno 2] No such file or directory: u'<?xml version="1.0" encoding="UTF-8" ?>\n<searchresults timestamp=\'Tue, 11 Feb 14 21:13:50 +0000\' attribution=\'Data \xa9 OpenStreetMap contributors, ODbL 1.0. http://www.openstreetmap.org/copyright\' querystring=\'\u015awierczyna, Drzewica, opoczy\u0144ski, \u0142\xf3dzkie, gb\' polygon=\'false\' more_url=\'http://nominatim.openstreetmap.org/search?format=xml&amp;exclude_place_ids=&amp;q=%C5%9Awierczyna%2C+Drzewica%2C+opoczy%C5%84ski%2C+%C5%82%C3%B3dzkie%2C+gb\'>\n</searchresults>'

这有什么问题吗？

编辑：感谢@rob，我的解决方案是：

#! /usr/bin/env python2.7
# -*- coding: utf-8 -*-

import os
import requests
import xml.etree.ElementTree as ET

txt = open('input.txt', 'r').read().split('\n')

for line in txt:
    lp, region, district, municipality, city = line.split('\t')
    baseUrl = 'http://nominatim.openstreetmap.org/search/pl/'+region+'/'+district+'/'+municipality+'/'+city+'/?format=xml'
    resp = requests.get(baseUrl)
    msg = resp.content
    tree = ET.fromstring(msg)
    for place in tree.findall('place'):
    location = '{:5f}\t{:5f}'.format(
        float(place.get('lat')),
        float(place.get('lon')))

    f = open('result.txt', 'a')
    f.write(location+'\t'+region+'\t'+district+'\t'+municipality+'\t'+city)
    f.close()

您正在使用xml.etree.ElementTree.parse() http://docs.python.org/2/library/xml.etree.elementtree.html#xml.etree.ElementTree.parse，它接受文件名或文件对象作为参数。但是，您传递的不是文件或文件对象，而是 unicode 字符串。

Try xml.etree.ElementTree.fromstring(text) http://docs.python.org/2/library/xml.etree.elementtree.html#xml.etree.ElementTree.fromstring.

像这样：

 tree = ET.fromstring(msg)

这是一个完整的示例程序：

import os
import requests
import xml.etree.ElementTree as ET

baseUrl = 'http://nominatim.openstreetmap.org/search/pl/podkarpackie/stalowowolski/Bojan%C3%B3w/Zapu%C5%9Bcie\n/?format=xml'
resp = requests.get(baseUrl)
msg = resp.content
tree = ET.fromstring(msg)
for place in tree.findall('place'):
  print u'{:s}: {:+.2f}, {:+.2f}'.format(
    place.get('display_name'),
    float(place.get('lon')),
    float(place.get('lat'))).encode('utf-8')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

xml

WebServices

nominatim

从 Web 响应中解析 Xml 的相关文章

如何正确地将 MIDI 刻度转换为毫秒？

我正在尝试将 MIDI 刻度增量时间转换为毫秒并且已经找到了一些有用的资源 MIDI Delta 时间刻度到秒 http www lastrayofhope co uk 2009 12 23 midi delta time ticks
在 Tensorflow tf.nn.nce_loss 中出现 TypeError：'Mul' Op 的输入 'y' 的类型为 float32，与参数 'x' 的 int32 类型不匹配

我正在研究 Tensor Flow 中的 Bag of Words 实现并得到了类型错误 Mul Op 的输入 y 的类型为 float32 与参数 x 的 int32 类型不匹配在 tf nn nce loss 中我尝试查看 tf
从基本表单加上 XML 生成自定义表单文档？

这是我的第一次堆栈溢出而且很复杂对不起我的任务是从基本模板和一些 XML 生成自定义文档without每种情况都有一个自定义表单设计元素 Here s 整个画面我们正在构建一个 Lotus Notes 客户端而不是 Web 应用程
通过列表理解压平列表列表

我正在尝试使用 python 中的列表理解来展平列表我的清单有点像 1 2 3 4 5 6 7 8 只是为了打印这个列表列表中的单个项目我编写了这个函数 def flat listoflist for item in listoflis
ASMX Web 服务 - 返回带有属性的用户定义的类

嘿我正在尝试从 Web 方法返回用户定义的类该类具有属性和或方法给出以下网络方法 WebMethod public List
如何创建一个语句来打印以特定单词开头的单词？ [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案如何在 python 中打印从特定字母开始的单词而不使用函数而是使用方法或循环 1 我有一个字符串想要打印以 m 开头的单词 S
以同步方式使用 FastAPI，如何获取 POST 请求的原始正文？

在中使用 FastAPIsync not async模式我希望能够接收 POST 请求的原始未更改的正文我能找到的所有例子都显示async代码当我以正常同步方式尝试时 request body 显示为协程对象当我通过发布一些内容来
在Python中调整图像大小

我有一张尺寸为 288 352 的图像我想将其大小调整为 160 240 我尝试了以下代码 im imread abc png img im resize 160 240 Image ANTIALIAS 但它给出了一个错误TypeErro
Python urllib.request.urlopen：AttributeError：'bytes'对象没有属性'data'

我正在使用 Python 3 并尝试连接到dstk 我收到错误urllib包裹我对SO进行了很多研究但找不到与这个问题类似的东西 api url self api base street2coordinates api body jso
如何解决使用 Spark 从 S3 重新分区大量数据时从内存中逐出缓存的表分区元数据的问题？

在尝试从 S3 重新分区数据帧时我收到一个一般错误 Caused by org apache spark SparkException Job aborted due to stage failure Task 33 in stage 1
将 JSON 对象传递给带有请求的 url

所以我想利用 Kenneth 的优秀请求模块 https github com kennethreitz requests 在尝试使用时偶然发现了这个问题自由库API http wiki freebase com wiki API 基本上
在 pytube3 中获取 youtube 视频的标题？

我正在尝试构建一个应用程序来使用 python 下载 YouTube 视频pytube3 但我无法检索视频的标题这是我的代码 from pytube import YouTube yt YouTube link print yt titl
如何从 C# 控制器重定向到外部 url

我使用 C 控制器作为网络服务在其中我想将用户重定向到外部网址我该怎么做 Tried System Web HttpContext Current Response Redirect 但没有成功使用控制器的重定向 http msdn
无法在 osx-arm64 上安装 Python 3.7

我正在尝试使用 Conda 创建一个带有 Python 3 7 的新环境例如 conda create n qnn python 3 7 我收到以下错误 Collecting package metadata current repoda
使用 Firefox 绕过弹出窗口下载文件：Selenium Python

我正在使用 selenium 和 python 来从中下载某些文件web page http www oceanenergyireland com testfacility corkharbour observations 我之前一直使用设
mac osx 10.8 上的初学者 python

我正在学习编程并且一直在使用 Ruby 和 ROR 但我觉得我更喜欢 Python 语言来学习编程虽然我看到了 Ruby 和 Rails 的优点但我觉得我需要一种更容易学习编程概念的语言因此是 Python 但是我似乎找不到适用于
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im
Tkinter - 浮动窗口 - 调整大小

灵感来自this https stackoverflow com a 22424245 13629335问题我想为我的根窗口编写自己的调整大小函数但我刚刚注意到我的代码显示了一些性能问题如果你快速调整它的大小你会发现窗口没有像我希望
当鼠标悬停在上面时，intellisense vscode 不显示参数或文档

我正在尝试将整个工作流程从 Eclipse 和 Jupyter Notebook 迁移到 VS Code 我安装了 python 扩展它应该带有 Intellisense 但它只是部分更糟糕我在输入句点后收到建议但当将鼠标悬停在其上方
在Python中按属性获取对象列表中的索引

我有具有属性 id 的对象列表我想找到具有特定 id 的对象的索引我写了这样的东西 index 1 for i in range len my list if my list i id specific id index i break

随机推荐

集合的延迟加载 - 如何获取项目？

我有一个简单的类旨在成为一个简单的 POCO 它只保存数据但有一个例外它包含一组笔记我想延迟加载这个集合这样我就不必获取不需要它们的页面上的注释其存根是这样的 public class MyDTOClass private IC
多元回归模型的过滤估计值的点须图

我正在尝试绘制 4 个不同回归模型的置信区间点须图数据可用here https figshare com s ace5b44bc12394a7c46d first importing data Q1 lt read table Q1 tx
为什么 == 在 System.Double 中被重写，但在 System.Int32 中没有被重写，这会产生什么后果？

在 C 中为什么Double覆盖 but Int32不可以效果又如何呢我查看msdn库我看到这个关于 double 的链接它没有说太多here http msdn microsoft com en us library 678hzk
错误：增加 persp {fields} 中预期的“x”和“y”值

我有 500 点空间lat lng as lng runif 100 1 4 lat runif 100 40 40 1 假设我们有密度 z rnorm 1000 我尝试使用绘制 3d 表面persp persp lng lat z 但我
WCF、安全性和证书

我有一个客户端服务器 WCF 应用程序需要针对数据库进行某种用户身份验证该应用程序客户端和服务器一起正在开发中将出售给数十个客户以便在他们的内部网上使用我们不太担心对通过网络传输的大部分数据进行加密当然在身份验证期间除外
模拟事件大小调整

嗨我正在使用 DOM2 并添加了一些事件侦听器调整大小 window对象使用addEventListener 现在我需要模拟此操作 window resize 来调用附加到的事件侦听器window目的我该怎么做以下应该有效 var
两个类型不相等，应该是

我正在尝试调试一些使用反射加载插件的代码这是调试代码 Type a methodInfo GetParameters 0 ParameterType BaseType Type b typeof MessageContext Debug
如何从远程计算机的驱动器获取可用的 FreeSpace？

我正在尝试从远程计算机的 D 驱动器获取 FreeSpace 最后我收到一个 ManagementException was unhandled by user code Not Found 这是给我错误的行 fs m FreeSpace
EF4 POCO WCF 序列化问题（无延迟加载、代理/无代理、循环引用等）

好的我想确保我涵盖了我的情况以及我彻底尝试过的一切我很确定我需要想要什么可以完成但我还没有找到成功的完美组合我正在利用实体框架4RTM及其POCO支持我正在寻找包含以下内容的实体配置多对多关系与另一个实体应用程序我转身关
javascript for 循环变量和递归

我有一个问题我在 for 循环内有递归 function func node for var i 0 i lt node children length i func node children i 显然由于 JavaScript 没有
无法在扩展中创建具有重复上下文菜单 ID 的项目

我正在创建一个新的扩展我通过网页中的扩展添加了上下文菜单选项但是chrome开发者模式抛出一个错误即 unchecked runtime lastError 无法创建具有重复id的项目my id 但我给了它唯一的ID 如何解决这个问题
WPF：尽管使用了 Dispatcher.BeginInvoke，但访问绑定的 ObservableCollection 仍失败

我有以下内容 public ICollectionView Children get Determining if the object has children may be time consuming because of netwo
Mac 催化剂的 UITextField 空 Bubble

在 mac Catalyst 应用程序中编辑 UITextField 时有时会出现空建议气泡尝试关闭更正和拼写检查但没有任何效果附截图我该如何摆脱它 textField autocorrectionType no 这是专门针对非
Jasmine的beforeEach是同步的吗？

如果您有多个beforeEach的他们会一直一个接一个地跑吗 beforeEach function beforeEach function beforeEach function beforeEach function beforeEa
用于安装多个第 3 方商业库的 Maven POM 文件

我有很多项目依赖于一组商业第三方库我们目前没有公司存储库因此我必须在我自己的本地存储库中安装这些库 Running mvn install installFile Dpackaging jar Dfile
如何从 Pool.starmap_async() 获取结果？

我有一个程序可以计算 array value 的索引并返回一个字符串我用 starmap async 因为我必须将两个参数传递给我的异步函数该程序如下所示 import multiprocessing as mp from multip
Rails Web 控制台未显示在运行时错误页面上

在开发环境中当我放置时 Web 控制台工作正常在任何页面中但是不要显示在运行时错误页面上没有网络控制台的错误页面带有 Web 控制台的页面我在用着轨道 5 1 6 红宝石2 5 1 网络控制台 3 6 1 我的宝石文件 sou
React-Native：推送通知+解析

我目前正在开发一个小型应用程序项目以学习和尝试 iOS 上的 React Native 我对解析 parse com 有一些经验并且希望将解析集成到新应用程序中目前我没有任何问题包括将js解析为react native 我可以使用
使用 python 和 Beautifulsoup4 从抓取数据中写入和保存 CSV 文件

我正在尝试从 PGA com 网站上抓取数据以获得美国所有高尔夫球场的表格在我的 CSV 表中我想包含高尔夫球场的名称地址所有权网站电话号码有了这些数据我想对其进行地理编码并放入地图中并在我的计算机上有一个本地副本我使
从 Web 响应中解析 Xml

我正在尝试获得对数千个城市进行地理编码的提名的回复 import os import requests import xml etree ElementTree as ET txt open input txt r readlines fo

从 Web 响应中解析 Xml

从 Web 响应中解析 Xml 的相关文章

随机推荐

热门标签