在python中使用bing或google API获取位置坐标

2023-12-13

这是我的问题。我有一个示例文本文件,我在其中通过抓取各种 html 页面来存储文本数据。该文本包含有关各种事件及其时间和地点的信息。我想获取这些位置的坐标。我不知道如何在 python 中做到这一点。我正在使用 nltk 来识别此示例文本中的命名实体。这是代码:

import nltk

with open('sample.txt', 'r') as f:
    sample = f.read()

sentences = nltk.sent_tokenize(sample)
tokenized_sentences = [nltk.word_tokenize(sentence) for sentence in sentences]
tagged_sentences = [nltk.pos_tag(sentence) for sentence in tokenized_sentences]
chunked_sentences = nltk.batch_ne_chunk(tagged_sentences, binary=True)

#print chunked_sentences
#print tokenized_sentences
#print tagged_sentences

def extract_entity_names(t):
    entity_names = []

    if hasattr(t, 'node') and t.node:
        if t.node == 'NE':
            entity_names.append(' '.join([child[0] for child in t]))
        else:
            for child in t:
                entity_names.extend(extract_entity_names(child))

    return entity_names

entity_names = []
for tree in chunked_sentences:
    # Print results per sentence
    # print extract_entity_names(tree)

    entity_names.extend(extract_entity_names(tree))

# Print all entity names
#print entity_names

# Print unique entity names
print set(entity_names)

示例文件是这样的:

考文特花园的波希米亚人

时间:2013 年 1 月 18 日(不同日期),晚上 7 点 30 分地点:考文特花园 (Covent Garden) 伦敦,约翰·科普利 (John Copley) 皇家歌剧院长期流行的作品 普契尼的《艺术家生涯》在本季两场演出中首次上演, 正好在圣诞节期间。马克·埃尔德爵士指挥罗兰多 Villazón 饰演 Rodolfo,Maija Kovalevska 饰演 Mimì。咪咪遇见诗人 鲁道夫(德米特罗·波波夫于 1 月 5 日至 18 日演唱该角色)感冒了 巴黎拉丁区的圣诞夜。在黑暗中摸索 她的蜡烛熄灭后,他们坠入爱河。鲁道夫与 另外三个小伙子:哲学家科林(Nahuel di Pierro/Jihoon Kim) 1 月 18 日),音乐家 Schaunard(David Bizic)和画家 Marcello (奥敦·伊弗森饰),爱上了穆塞塔(斯特凡妮娅·多夫汉饰)。夫妻俩 分手,歌剧以悲剧结束,鲁道夫发现咪咪死于 在冰冷的阁楼里消费。

我想从此文本中获取伦敦考文特花园的坐标。我该怎么做 ?


自 2013 年 9 月起,Google 地图 API v2不再有效。这是很棒的 @jimhark 代码的更新版本,适用于 API v3(我省略了__main__ part):

import urllib
import simplejson

googleGeocodeUrl = 'http://maps.googleapis.com/maps/api/geocode/json?'

def get_coordinates(query, from_sensor=False):
    query = query.encode('utf-8')
    params = {
        'address': query,
        'sensor': "true" if from_sensor else "false"
    }
    url = googleGeocodeUrl + urllib.urlencode(params)
    json_response = urllib.urlopen(url)
    response = simplejson.loads(json_response.read())
    if response['results']:
        location = response['results'][0]['geometry']['location']
        latitude, longitude = location['lat'], location['lng']
        print query, latitude, longitude
    else:
        latitude, longitude = None, None
        print query, "<no results>"
    return latitude, longitude

See 官方文档获取完整的参数列表和附加信息。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

在python中使用bing或google API获取位置坐标 的相关文章

  • 根据另一个数据框中找到的范围填充数据框中的列

    我试图根据该记录的索引值是否落在另一个数据框中的两列定义的范围内来填充数据框中的列 df1 看起来像 a 0 4 1 45 2 7 3 5 4 48 5 44 6 22 7 89 8 45 9 44 10 23 df2 是 START ST
  • 在Python中不断寻找用户输入

    我将如何编写一个始终寻找用户输入的 Python 程序 我想我希望有一个等于输入的变量 然后根据该变量的等于值会发生不同的情况 因此 如果变量是 w 那么它将执行某个命令并继续执行 直到收到另一个输入 例如 d 然后会发生不同的情况 但直到
  • 如何将 Google Cloud Storage 中的许多文件设为私有?

    我进行了很多研究 但无法为此提出解决方案 以下是我用来在 GCP 中公开所有文件的代码 def make blob public bucket name blob name Makes a blob publicly accessible
  • 如何在python中确定过去的时区特定日期是否是夏令时?

    有没有办法检查特定时区在我指定的日期是否处于夏令时 test dt datetime year 2015 month 2 day 1 pst pytz timezone America Los Angeles test dt pst loc
  • Seaborn regplot 中点和线的不同颜色

    中列出的所有示例西伯恩的regplot文档 https seaborn pydata org generated seaborn regplot html点和回归线显示相同的颜色 改变color争论改变了两者 如何为点设置与线不同的颜色 你
  • 更改 numpy 数组的结构强制给定值

    如何缩小栅格数据的比例4 X 6大小成2 X 3如果 2 2 像素内的任何元素包含 1 则大小强制选择 1 否则选择 0 import numpy as np data np array 0 0 1 1 0 0 1 0 0 1 0 0 1
  • 类型错误:translate() 只接受一个参数(给定 2 个参数)[重复]

    这个问题在这里已经有答案了 我的代码在 python 2 x 版本上运行良好 但是当我尝试在 python 3 x 版本上运行它时 出现错误 主题 需要缩写短信编码中的任何消息 Code def sms encoding data star
  • 从 Spark 数据帧中过滤大量 ID

    我有一个大型数据框 其格式类似于 ID Cat date 12 A 201602 14 B 201601 19 A 201608 12 F 201605 11 G 201603 我需要根据大约 500 万个 Is 的列表来过滤行 最直接的方
  • 如何使用 numpy 从一维数组创建对角矩阵?

    我正在使用 Python 和 numpy 来做线性代数 我表演了numpy对矩阵进行 SVD 以获得矩阵 U i 和 V 然而 i 矩阵表示为 1 行的 1x4 矩阵 IE 12 22151125 4 92815942 2 06380839
  • python lxml 使用iterparse编辑并输出xml

    我已经在 lxml 库上摆弄了一段时间了 也许我没有正确理解它 或者我错过了一些东西 但我似乎无法弄清楚在捕获某个 xpath 后如何编辑文件并且然后能够在逐个元素解析时将其写回到 xml 中 假设我们有这个 xml 作为示例
  • TypeError:“NoneType”对象不可下标[重复]

    这个问题在这里已经有答案了 错误 names curfetchone 0 TypeError NoneType object is not subscriptable 我尝试检查缩进 但仍然有错误 我读到 如果数据库中没有文件名记录 变量名
  • Python Tkinter 网格复选框

    我想知道是否有一种简单的方法可以使用 Tkinter 创建复选框网格 我正在尝试制作一个由 10 行和 10 列 即 100 个复选框 组成的网格 以便每行只能选择两个复选框 编辑 我正在使用带有spyder的python 2 7 到目前为
  • 如何在python中访问矩阵每个元素的相邻单元格?

    这里 如果两个单元共享边界 则它们被认为是相邻的 例如 A 5 6 4 2 1 3 7 9 8 这里 索引 0 0 的相邻元素位于索引 0 1 和 1 0 处 索引 1 1 的相邻元素位于索引 0 1 1 0 2 1 处 和 1 2 假设你
  • 使用 conda 安装额外功能

    With pip我们可以使用方括号安装子包 例如与阿帕奇气流 https pythonhosted org airflow installation html pip install airflow all 有类似的东西吗conda或者我必
  • 列表中的“u”是什么意思?

    这是我第一次遇到这种情况 刚刚打印了一个列表 每个元素似乎都有一个u在它前面 即 u hello u hi u hey 它是什么意思 为什么列表的每个元素前面都会有这个 由于我不知道这种情况有多常见 如果您想了解我是如何遇到它的 我会很乐意
  • 如何输入可变的默认参数

    Python 中处理可变默认参数的方法是将它们设置为无 https stackoverflow com a 366430 5049813 例如 def foo bar None bar if bar is None else bar ret
  • 跟踪白色背景中的白球(Python/OpenCV)

    我在 Python 3 中使用 OpenCV 来检测白场上的白 黑球 并给出它的精确 x y 半径 和颜色 我使用函数 cv2 Canny 和 cv2 findContours 来找到它 但问题是 cv2 Canny 并不总是检测到圆的完整
  • 如何通过 Selenium 内部的文本查找按钮(Python)?

    我有以下三个按钮 我不知道如何获取其中的文本 例如异常值 我试过browser find element by link text Outliers click 但出现 无法找到元素 错误 我该怎么做 See find element by
  • gnuplot:第 1 行:无效命令

    stackoverflow 上可爱的人们大家好 我正在尝试使用 gnuplot 绘制数据 我首先阅读表格并提取我想要的数据 我将此数据写入 dat 文件 截至目前 我只是尝试通过命令行绘制它 但会添加必要的代码以在 python 脚本工作后
  • AES 在 cryptojs 中加密并在 python Crypto.Cipher 中解密

    使用 js CryptoJS 加密并使用 python crypto Cipher 解密时出现问题 这是我在js中的实现 附加 iv 与加密消息并使用 base64 进行编码

随机推荐

  • 我有 DEVINST,我需要设备路径

    我正在尝试打开属于复合设备一部分的 WinUSB 设备 我已使用 cfgmgr32 找到了正确的子设备 并有其 DEVINST 编号 为了使用 WinUSB 打开它 我需要首先调用 CreateFile 为此我需要设备路径 设备路径如下所示
  • 如何使用 Web 服务访问 Sharepoint 中的子站点列表?

    在尝试使用 Web 服务 在 powershell 上 访问我的共享点网站时 我遇到了以下配置的问题 我的网站位于https sharepoint company tld sites siteid WSDL 是从以下位置获取的https s
  • 如何在 yii 中安装 bootstrap 扩展

    我是 yii 的新手 一直在尝试向 yii 添加 bootstrap 和 giiplus 扩展 但是 在将提取的文件添加到扩展文件夹并在 main php 中进行更改后 我似乎无法在显示主页时出现错误 我按照这个教程 http www cn
  • 拆分值对并使用 UDF 创建表

    我一直在尝试编写一个表值函数 它将值对作为参数并返回一个包含两列的表 下面是我想要做的函数签名 FUNCTION dbo ValuePairParser DelimitedValuePairs VARCHAR MAX Delimiter C
  • 将onclick添加到UI材质按钮

    我正在尝试将 onClick 事件处理程序添加到材质 ui 中 有时会调用它 有时不会 但是 它与常规按钮一起工作正常 handleClick event gt const value event target value console
  • 使用 Symfony2 将 xml 反序列化为对象

    我通过 API 收集一些 xml 格式的数据 并希望将其反序列化到对象列表中 我正在使用 Symfony2 并找到 JMSSerializerBundle 但我真的不知道如何使用它 我知道 Sf2 允许将对象序列化到数组 从数组反序列化 但
  • 按钮 OnClick 事件在 ASP.NET Web 表单应用程序中不起作用

    我跟着本教程创建以下 ASP NET Web 表单以将参数发送到存储过程并使用 Microsoft Report 显示结果 this is 不完整 产品 aspx file
  • 读者单子的目的是什么?

    reader monad 太复杂了 而且似乎没什么用处 如果我没记错的话 在 Java 或 C 这样的命令式语言中 读者 monad 没有等效的概念 你能给我一个简单的例子并稍微澄清一下吗 别害怕 reader monad 实际上并没有那么
  • MySQL以不同的排序顺序对多列进行排序

    我有一个表 其中包含三个数据类型字段date int and bigint 我想使用所有这三列对我的选择查询进行排序 我想将它们全部按降序排列 例如 Select From mytbl order by date desc intnum d
  • 通道功能 V1_3 是必需的,但不支持:在 Hyperledger Fabric 中制作我的第一个网络

    在 OSX 上启动我的第一个 Hyperledger 网络 我使用脚本安装了示例文件 curl sSL http bitlyURLThatStackoverflow won t let me us bash s 1 2 1 The ran
  • Python 打包:pyproject.toml 中的构建需求 VS setup_requires

    在有点复杂的Python中setup py配置 通常需要已经存在的其他库才能执行setuptools setup 就我而言 这将是setuptools gt 45 0 and cython gt 0 29 现在 我有两个选项来声明这些构建时
  • Java 2d 鼠标点方向旋转

    到目前为止 我有一个java应用程序 我在其中画一个圆圈 玩家 然后在顶部画一个绿色矩形 枪管 我有它 所以当玩家移动时 桶会随之移动 我希望它找到鼠标指向的位置 然后相应地旋转桶 有关我的意思的示例 请观看我发现的这个视频http www
  • UWP 的 BroadFileSystemAccess 不起作用

    我正在编写一个应用程序 它需要访问文本文件的权限 因为未经许可它会抛出异常 访问被拒绝 我添加到 Package appxmanifest 特定行 xmlns rescap http schemas microsoft com appx m
  • pandas dataframe 选择多索引中的列[重复]

    这个问题在这里已经有答案了 我有以下 pd DataFrame Name 0 1 Col A B A B 0 0 409511 0 537108 0 355529 0 212134 1 0 332276 1 087013 0 083684
  • 正则表达式将 img 标签与特定属性类匹配

    我很长时间都在与这个正则表达式作斗争 但我找不到任何解决办法 我使用基于 javascript 的工具来测试和编写表达式 当放入php页面并与preg匹配时 结果是不同的
  • openssl - 通过 Java 解密

    全部 我正在努力解决这个问题 我有包含命令的bat文件 openssl smime decrypt binary inform DER recip path to certificate inkey path to private key
  • 重新安装 Visual Studio 2017 本地主机证书

    在安装 VS2017 的过程中 或者稍后 程序会安装一个用于本地开发的证书 一切都工作正常 直到我安装了 Fiddler 从那一刻起 VS2017 证书停止工作 每当我导航到本地主机应用程序时 我都会收到 您的连接不是私有的 消息 有什么想
  • 有没有办法使用最新的 Facebook 应用程序评论来获得 Facebook read_stream 权限?

    我正在开发社交网络 iPhone 应用程序 其中我们有 facebook 作为选项之一 我们必须显示用户的提要 但为此我需要read stream允许 不幸的是 我们的应用程序尚未经过验证 这是我们从 Facebook 审核团队收到的消息
  • 如何从因重新启动而离开的位置继续安装?

    在安装某些软件包期间重新启动后如何继续安装程序 实际上 我已经使用构建了一个项目的安装程序包WiX 捆绑包 有不同的包要安装在链中 但是当它安装微软时Windows安装程序4 5 msi 它将重新启动电脑 重新启动后 我希望安装继续 我怎样
  • 在python中使用bing或google API获取位置坐标

    这是我的问题 我有一个示例文本文件 我在其中通过抓取各种 html 页面来存储文本数据 该文本包含有关各种事件及其时间和地点的信息 我想获取这些位置的坐标 我不知道如何在 python 中做到这一点 我正在使用 nltk 来识别此示例文本中