如何使用 Data Science Toolbox 对简单地址进行地理编码

2024-02-27

我厌倦了谷歌的地理编码，并决定尝试替代方案。数据科学工具包（http://www.datasciencetoolkit.org http://www.datasciencetoolkit.org）允许您对无限数量的地址进行地理编码。 R 有一个优秀的包，可以作为其函数的包装器（CRAN：RDSTK）。该包有一个函数叫做street2coordinates()与数据科学工具包的地理编码实用程序接口。

然而，RDSTK 函数street2coordinates()如果您尝试对简单的东西进行地理编码，例如城市，国家。在下面的示例中，我将尝试使用该函数来获取凤凰城的纬度和经度：

> require("RDSTK")
> street2coordinates("Phoenix+Arizona+United+States")
[1] full.address
<0 rows> (or 0-length row.names)

数据科学工具包中的实用程序运行良好。这是给出答案的 URL 请求：

我对多个地址进行地理编码（完整的地址和城市名称）感兴趣。我知道数据科学工具包 URL 会很好用。

如何与 URL 交互并将多个纬度和经度放入包含地址的数据框中？

这是一个示例数据集：

dff <- data.frame(address=c(
  "Birmingham, Alabama, United States",
  "Mobile, Alabama, United States",
  "Phoenix, Arizona, United States",
  "Tucson, Arizona, United States",
  "Little Rock, Arkansas, United States",
  "Berkeley, California, United States",
  "Duarte, California, United States",
  "Encinitas, California, United States",
  "La Jolla, California, United States",
  "Los Angeles, California, United States",
  "Orange, California, United States",
  "Redwood City, California, United States",
  "Sacramento, California, United States",
  "San Francisco, California, United States",
  "Stanford, California, United States",
  "Hartford, Connecticut, United States",
  "New Haven, Connecticut, United States"
  ))

像这样：

library(httr)
library(rjson)

data <- paste0("[",paste(paste0("\"",dff$address,"\""),collapse=","),"]")
url  <- "http://www.datasciencetoolkit.org/street2coordinates"
response <- POST(url,body=data)
json     <- fromJSON(content(response,type="text"))
geocode  <- do.call(rbind,sapply(json,
                                 function(x) c(long=x$longitude,lat=x$latitude)))
geocode
#                                                long      lat
# San Francisco, California, United States -117.88536 35.18713
# Mobile, Alabama, United States            -88.10318 30.70114
# La Jolla, California, United States      -117.87645 33.85751
# Duarte, California, United States        -118.29866 33.78659
# Little Rock, Arkansas, United States      -91.20736 33.60892
# Tucson, Arizona, United States           -110.97087 32.21798
# Redwood City, California, United States  -117.88536 35.18713
# New Haven, Connecticut, United States     -72.92751 41.36571
# Berkeley, California, United States      -122.29673 37.86058
# Hartford, Connecticut, United States      -72.76356 41.78516
# Sacramento, California, United States    -121.55541 38.38046
# Encinitas, California, United States     -116.84605 33.01693
# Birmingham, Alabama, United States        -86.80190 33.45641
# Stanford, California, United States      -122.16750 37.42509
# Orange, California, United States        -117.85311 33.78780
# Los Angeles, California, United States   -117.88536 35.18713

这利用了 street2coordinates API 的 POST 接口（记录在这里 http://www.datasciencetoolkit.org/developerdocs#street2coordinates），它在 1 个请求中返回所有结果，而不是使用多个 GET 请求。

Phoenix 的缺失似乎是 street2coordinates API 中的一个错误。如果你去API演示页面 http://www.datasciencetoolkit.org/并尝试“美国亚利桑那州菲尼克斯”，您会得到空响应。但是，正如您的示例所示，使用他们的“Google-style Geocoder”does给凤凰城一个结果。因此，这里有一个使用重复 GET 请求的解决方案。请注意，这会运行慢得多.

geo.dsk <- function(addr){ # single address geocode with data sciences toolkit
  require(httr)
  require(rjson)
  url      <- "http://www.datasciencetoolkit.org/maps/api/geocode/json"
  response <- GET(url,query=list(sensor="FALSE",address=addr))
  json <- fromJSON(content(response,type="text"))
  loc  <- json['results'][[1]][[1]]$geometry$location
  return(c(address=addr,long=loc$lng, lat= loc$lat))
}
result <- do.call(rbind,lapply(as.character(dff$address),geo.dsk))
result <- data.frame(result)
result
#                                     address         long        lat
# 1        Birmingham, Alabama, United States   -86.801904  33.456412
# 2            Mobile, Alabama, United States   -88.103184  30.701142
# 3           Phoenix, Arizona, United States -112.0733333 33.4483333
# 4            Tucson, Arizona, United States  -110.970869  32.217975
# 5      Little Rock, Arkansas, United States   -91.207356  33.608922
# 6       Berkeley, California, United States   -122.29673  37.860576
# 7         Duarte, California, United States  -118.298662  33.786594
# 8      Encinitas, California, United States  -116.846046  33.016928
# 9       La Jolla, California, United States  -117.876447  33.857515
# 10   Los Angeles, California, United States  -117.885359  35.187133
# 11        Orange, California, United States  -117.853112  33.787795
# 12  Redwood City, California, United States  -117.885359  35.187133
# 13    Sacramento, California, United States  -121.555406  38.380456
# 14 San Francisco, California, United States  -117.885359  35.187133
# 15      Stanford, California, United States    -122.1675   37.42509
# 16     Hartford, Connecticut, United States   -72.763564   41.78516
# 17    New Haven, Connecticut, United States   -72.927507  41.365709

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 Data Science Toolbox 对简单地址进行地理编码的相关文章

R texreg：如何选择要显示的 gof 统计信息？

我正在使用 texreg 通过 plm 生成面板回归的输出表我想抑制所有 gof 统计数据的输出这不是显示 R2 adj R2 和 N 我只想显示 adj R2 有谁知道一个简单的方法来做到这一点好吧这实际上很简单只需在调用中包含
如何在 R 中为回归量创建“宏”？

对于长且重复的模型我想创建一个宏在 Stata 中称为宏并通过以下命令完成 global var1 var2 其中包含回归量的模型公式例如来自 library car lm income education prestige d
rpart是自动剪枝吗？

Is rpart自动修剪生成的决策树rpart比具有自动修剪功能的 Oracle Data Mining 生成的级别要多得多否但拟合函数的默认值可能会提前停止分割对于早期的某些定义 See rpart control对于您可
ggplot 图例标签内的希腊字母、符号和换行符

我在尝试着有换行符自动或强制对齐文本左对齐或左右对齐有希腊字母和百分号在 gglot 图例标签内我尝试了几种方法但我似乎无法将我读到的所有技巧结合起来我可以通过插入来换行 n进入标签但这似乎不适用于希腊字母不适用于图例
在函数中使用 quit/q 会导致 RStudio 出现致命错误

更多的是好奇但当你使用时q or quit在 R studio 内的函数内部它会导致致命错误如下所示但 rgui 中的相同函数会导致 R 像往常一样停止并且仅使用q 在 RStudio 中按预期关闭 R 为什么q在函数中导致 RS
在`rmarkdown`中，如何在句子中添加图标？

In rmarkdown 如何在句子中添加图标例如如下如何添加markdown icon单词 Markdown 和 is 之间有一个很好的 R 包可以轻松下载 RMarkdown 文档并将图标添加到其中 icons https gi
R参考类问题

我正在尝试在 R 中创建一个简单的参考类这是我的代码 R 初学者 MyClass lt setRefClass MyClass fields list a numeric b numeric methods list initialize
函数“[<-”将_替换_一个元素，但不会追加_元素_

我在使用时注意到以下几点 lt 我成功于替换元素但不位于追加向量的一个元素例子 VarX lt integer VarX 1 lt 11 lt VarX 2 22 VarX 1 11 Expected the value of VarX
在 Lavaan 生长曲线模型中提取个体轨迹

我已经使用 R 的 Lavaan 包中的 Growth 函数成功地对一项研究的纵向数据进行了建模我找不到任何关于如何提取每个参与者的预测轨迹的记录我只能找到整个组的预测轨迹在摘要输出的拦截部分下给出使用 lavPredict m
按组计算连续行中的值之间的差异

这是我的一个df 数据框 group value 1 10 1 20 1 25 2 5 2 10 2 15 我需要按组计算连续行中的值之间的差异所以我需要一个结果 group value diff 1 10 NA because the
汇总表中各列的字符值比例

在这种数据框中 df lt data frame w1 c A A B C A w2 c C A A C C w3 c C A B C B 我需要计算所有列中字符值的列内比例有趣的是以下代码适用于大型实际数据集但对上述玩具数据会引发错
如何返回包含最大值标签的向量

我有一个 4 列数组我想获得一个向量其中每行包含包含该行最大值的列的标签我可以在循环中执行此操作但我想使用矩阵函数来提高速度我怎样才能在不编写自己的库函数的情况下做到这一点有一个函数可以做到这一点如果x是你的矩阵尝试max
如何从 R 数据框中提取关键字

我是 R 中文本挖掘的新手我想从数据框的列中删除停用词即提取关键字并将这些关键字放入新列中我尝试制作一个语料库但它对我没有帮助 df C3是我目前拥有的我想添加栏目df C4 但我无法让它工作 df lt structure l
如何将同一行中以逗号分隔的值拆分到R中的不同行

我有一些数据来自谷歌表格 https forms gle rGQQL3tvA1PrE4dD8我想拆分以逗号分隔的答案 and 复制参与者的 ID 数据如下 gt head data names Q2 Q3 Q4 1 PART 1 fruit
更快的 %in% 运算符

The 快速匹配 https cran r project org web packages fastmatch index html包实现了更快的版本match对于重复匹配例如在循环中 set seed 1 library fastma
手动设置scale_fill_distiller()的比例

我正在尝试制作一系列图表进行比较举例来说我想使用iris数据集来制作这样的图其中我已过滤以仅查看 setosa 物种 library ggplot2 library dplyr iris gt filter Species setos
如何定义“f_n-chi-square”函数并使用“uniroot”求置信区间？

I want to get a 95 confidence interval for the following question 我已经写了函数f n在我的 R 代码中我首先使用 Normal 随机采样 100 个样本然后定义函数h
合并数据框而不重复行

我想合并两个数据框但如果有多个匹配项则不想重复行相反我想总结一下那天的观察结果来自合并提取两个数据框中与指定列匹配的行并将其连接在一起如果有多个匹配项则所有可能的匹配项各贡献一行这是一些示例代码 days lt as d
计算互相关函数？

In R 我在用ccf or acf计算成对互相关函数以便我可以找出哪个移位给我带来最大值从它的外观来看 R给我一个标准化的值序列 Python 的 scipy 中是否有类似的东西或者我应该使用fft模块目前我正在这样做 xcor
通过使用 navbarPanel() 并隐藏导航栏构建多页闪亮应用程序用户端（在 ui.R 中）？

我想构建一个多页闪亮应用程序我可以在其中控制用户可以看到哪个页面迪安阿塔利确实这个演示应用程序中有类似的东西 https github com daattali advanced shiny tree master multiple

随机推荐

如何使用浅层测试酶 Reactjs 模拟 useLocation() 路径名？

我有如下标头组件 import useLocation from react router dom const Header gt let route useLocation pathname return route user
使用 Spring 本地化异常消息

我想使用 Spring 本地化从 POJO 类抛出的异常消息我有一个 Spring MVC 应用程序通过它我可以添加书籍如果添加的书的标题为 null 则实现类会抛出异常我想本地化这个我知道我可以在 JSP 页面中使用 local
Spark如何将分区分配给执行器

I have a performance issue and after analyzing Spark web UI i found what it seems to be data skewness 最初我认为分区分布不均匀所以我对每
Android - 尝试在空对象引用上调用虚拟方法“void android.support.v4.app.Fragment.setMenuVisibility(boolean)”

这是错误的完整堆栈跟踪 http pastebin com 5dQHkUw3 http pastebin com 5dQHkUw3 仅在我开始在项目中使用片段后错误才开始出现因为我想提供 JSON feed 之前我创建 Tabs Nav
摆脱插入触发器

尝试探索使用插入触发器的替代解决方案比如基于 API 的方法以及不同方法的优缺点在 API 方法中您将创建一个过程来执行这两种操作类似于 package body emp api is procedure insert emp is
为什么 Leiningen 不能总是正确使用我的 :gen-class ？

假设我创建了一个新的 Leiningen 项目 lein new app example 并添加一些代码example src example core clj这利用了 gen class ns example core gen class
依赖类型的 Church 编码：从 Coq 到 Haskell

在 Coq 中我可以为长度为 n 的列表定义 Church 编码 Definition listn A Type nat gt Type fun m gt forall X nat gt Type X 0 gt forall m A gt
如何在 Laravel 中注销后保持在同一页面

正如问题标题所示我想知道如何设置我的网站以便用户在注销后留在同一页面上特别是我想知道 Laravel 是否提供了执行此操作的语法我希望使用最佳实践在 Laravel 内例如登录链接显示在每个页面的顶部 Bob 已登录并查看关
在 C 程序中链接 SDL

在学习了一些 C 基础知识后我最近对使用 SDL 产生了兴趣我安装了 SDL image 和 SDL mixer 它们位于 usr local include SDL2 中我意识到您必须链接到头文件但我不知道该怎么做我收到 SDL
Asp.Net Mvc ajax 文件上传与partialViews？

是否可以使用部分视图上传ajax文件我尝试通过以下方式做到这一点 Upload cshtml 部分视图
删除类中的这个对象

private class Node Item name Node next public void deleteObject this null 是否可以删除类内的对象我试图执行上面的操作但它给出了一个错误左侧应该是一个变量 Nod
Google饼图：删除饼图切片之间的白色间隙

如同这个问题 https stackoverflow com questions 18784246 removing the white line between slices in flot pie chart 22227464 但对于
在新标签页上显示 chrome://favicon/

我正在开发一个谷歌浏览器扩展程序书签显示在newtab页到目前为止除了图标之外一切都运行良好在 Chrome 中输入此 URL 将显示页面的图标铬 favicon https stackoverflow com https sta
如何在 tkinter Canvas 上创建按钮？

我创建了一个框架然后创建了一个画布接下来我要做的是在画布上添加一个按钮但是当我打包按钮时我看不到画布这是我尝试过的 from Tkinter import Tk Canvas Frame Button from Tkinter
如何一步步检查 Coq 中更复杂的策略的作用？

我试图经历那些著名的和精彩的软件基础书籍 https softwarefoundations cis upenn edu lf current Basics html lab30但我举了一个例子simpl and reflexivity 只
net.sf.jasperreports.engine.JRException：找不到资源

我尝试使用子报表贾斯帕软件工作室但我得到下面的例外尽管子报表文件存在但它找不到它 net sf jasperreports engine JRException Resource not found at D JASPERREPORTS
TypeError：在 Kubuntu 14.04 上通过 Selenium 和 Python 执行测试时，urlopen() 获得了关键字参数“body”的多个值

我试图在 Kubuntu 14 04 上用 python 运行 selenium 我尝试使用 chromedriver 或 geckodriver 时收到此错误消息两者都是相同的错误 Traceback most recent call
如何在 bash 中使用“readarray”将文件中的行读入二维数组

假设我有一个文本文件 demo txt 其中有一个如下表 1 2 3 4 5 6 7 8 9 现在我想使用 bash 中的 readarray 命令单独读取每一行所以我写 readarray myarray lt demo txt 问题
xdebug 未加载。 apache重启后在phpinfo()中找不到

我一直在搜寻我能找到的所有资源但一无所获当我启动调试会话时我在 NetBeans 6 9 中收到可怕的等待连接消息经过大量阅读后大多数人都能够让 phpinfo 显示它加载了 xdebug 模块我的情况并非如此我使用此调用
如何使用 Data Science Toolbox 对简单地址进行地理编码

我厌倦了谷歌的地理编码并决定尝试替代方案数据科学工具包 http www datasciencetoolkit org http www datasciencetoolkit org 允许您对无限数量的地址进行地理编码 R 有一个优秀的

如何使用 Data Science Toolbox 对简单地址进行地理编码

如何使用 Data Science Toolbox 对简单地址进行地理编码 的相关文章

随机推荐

热门标签

如何使用 Data Science Toolbox 对简单地址进行地理编码的相关文章