如何使用 R 中的加权（调查）数据制作漂亮的无边界地理专题/热图，可能对点观测使用空间平滑

2024-01-09

自从约书亚·卡茨发表这些方言地图 http://spark.rstudio.com/jkatz/SurveyMaps/你可以找到 using 哈佛大学方言调查 http://www4.uwm.edu/FLL/linguistics/dialect/maps.html，我一直在尝试复制和推广他的方法..但其中大部分都超出了我的能力范围。乔什透露了他的一些方法在这张海报中 http://www4.ncsu.edu/~jakatz2/files/dialectposter.png，但（据我所知）尚未公开他的任何代码。

我的目标是推广这些方法，以便任何主要美国政府调查数据集的用户都可以轻松地将其加权数据放入函数中并获得合理的地理地图。地理位置各不相同：一些调查数据集有 ZCTA，一些有县，一些有州，一些有都会区等。从在质心处绘制每个点开始可能是明智的 - 讨论了质心here http://www.census.gov/geo/reference/zctafaq.html并且适用于大多数地区人口普查局 2010 年地名词典档案 http://www.census.gov/geo/maps-data/data/gazetteer2010.html。因此，对于每个调查数据点，您在地图上都有一个点。但有些调查回复的权重为 10，其他调查回复的权重为 100,000！显然，无论最终出现在地图上的“热量”或平滑或着色都需要考虑不同的权重。

我擅长调查数据，但我对空间平滑或核估计一无所知。乔什在他的海报中使用的方法是k-nearest neighbor kernel smoothing with gaussian kernel这对我来说很陌生。我是绘图方面的新手，但如果我知道目标应该是什么，我通常可以让事情顺利进行。

注意：这个问题非常类似于十个月前提出的问题不再包含可用数据 https://stackoverflow.com/questions/17025273/create-heatmap-with-distribution-of-attribute-values-in-r-not-density-heatmap。还有一些花絮信息在这个线程上 https://stackoverflow.com/questions/14461954/heatmap-based-on-average-weights-and-not-on-the-number-of-data-points，但如果有人有一个聪明的方法来回答我的确切问题，我显然更愿意看到这一点。

r 调查包有一个svyplot函数，如果运行这些代码行，您可以看到笛卡尔坐标上的加权数据。但实际上，对于我想做的事情，绘图需要覆盖在地图上。

library(survey)
data(api)
dstrat<-svydesign(id=~1,strata=~stype, weights=~pw, data=apistrat, fpc=~fpc)
svyplot(api00~api99, design=dstrat, style="bubble")

如果有任何用处，我已经发布了一些示例代码，这些代码将为任何愿意帮助我的人提供一种快速方法，以在基于核心的统计区域（另一种地理类型）开始使用一些调查数据。

任何想法、建议、指导将不胜感激（如果我能得到正式的教程/指南/操作方法，我将不胜感激）http://asdfree.com/ http://asdfree.com/)

谢谢！！！！！！！！！！

# load a few mapping libraries
library(rgdal)
library(maptools)
library(PBSmapping)


# specify some population data to download
mydata <- "http://www.census.gov/popest/data/metro/totals/2012/tables/CBSA-EST2012-01.csv"

# load mydata
x <- read.csv( mydata , skip = 9 , h = F )

# keep only the GEOID and the 2010 population estimate
x <- x[ , c( 'V1' , 'V6' ) ]

# name the GEOID column to match the CBSA shapefile
# and name the weight column the weight column!
names( x ) <- c( 'GEOID10' , "weight" )

# throw out the bottom few rows
x <- x[ 1:950 , ]

# convert the weight column to numeric
x$weight <- as.numeric( gsub( ',' , '' , as.character( x$weight ) ) )

# now just make some fake trinary data
x$trinary <- c( rep( 0:2 , 316 ) , 0:1 )

# simple tabulation
table( x$trinary )

# so now the `x` data file looks like this:
head( x )

# and say we just wanted to map
# something easy like
# 0=red, 1=green, 2=blue,
# weighted simply by the population of the cbsa

# # # end of data read-in # # #


# # # shapefile read-in? # # #

# specify the tiger file to download
tiger <- "ftp://ftp2.census.gov/geo/tiger/TIGER2010/CBSA/2010/tl_2010_us_cbsa10.zip"

# create a temporary file and a temporary directory
tf <- tempfile() ; td <- tempdir()

# download the tiger file to the local disk
download.file( tiger , tf , mode = 'wb' )

# unzip the tiger file into the temporary directory
z <- unzip( tf , exdir = td )

# isolate the file that ends with ".shp"
shapefile <- z[ grep( 'shp$' , z ) ]

# read the shapefile into working memory
cbsa.map <- readShapeSpatial( shapefile )

# remove CBSAs ending with alaska, hawaii, and puerto rico
cbsa.map <- cbsa.map[ !grepl( "AK$|HI$|PR$" , cbsa.map$NAME10 ) , ]

# cbsa.map$NAME10 now has a length of 933
length( cbsa.map$NAME10 )

# convert the cbsa.map shapefile into polygons..
cbsa.ps <- SpatialPolygons2PolySet( cbsa.map )

# but for some reason, cbsa.ps has 966 shapes??
nrow( unique( cbsa.ps[ , 1:2 ] ) )
# that seems wrong, but i'm not sure how to fix it?

# calculate the centroids of each CBSA
cbsa.centroids <- calcCentroid(cbsa.ps)
# (ignoring the fact that i'm doing something else wrong..because there's 966 shapes for 933 CBSAs?)

# # # # # # as far as i can get w/ mapping # # # #


# so now you've got
# the weighted data file `x` with the `GEOID10` field
# the shapefile with the matching `GEOID10` field
# the centroids of each location on the map


# can this be mapped nicely?

我不确定我可以在空间平滑方面提供多少帮助，因为这是一项我几乎没有经验的任务，但我花了一些时间在 R 中制作地图，所以我希望我下面添加的内容将对这部分有所帮助你的问题。

我已经开始编辑你的代码# # # shapefile read-in # # #;你会注意到我把地图放在SpatialPolygonsDataFrame类和我依靠raster and gstat用于构建网格并运行空间平滑的软件包。空间平滑模型是我最不熟悉的部分，但这个过程使我能够制作栅格并演示如何对其进行遮罩、投影和绘制。

library(rgdal)
library(raster)
library(gstat)

# read in a base map
m <- getData("GADM", country="United States", level=1)
m <- m[!m$NAME_1 %in% c("Alaska","Hawaii"),]

# specify the tiger file to download
tiger <- "ftp://ftp2.census.gov/geo/tiger/TIGER2010/CBSA/2010/tl_2010_us_cbsa10.zip"

# create a temporary file and a temporary directory
tf <- tempfile() ; td <- tempdir()

# download the tiger file to the local disk
download.file( tiger , tf , mode = 'wb' )

# unzip the tiger file into the temporary directory
z <- unzip( tf , exdir = td )

# isolate the file that ends with ".shp"
shapefile <- z[ grep( 'shp$' , z ) ]

# read the shapefile into working memory
cbsa.map <- readOGR( shapefile, layer="tl_2010_us_cbsa10" )

# remove CBSAs ending with alaska, hawaii, and puerto rico
cbsa.map <- cbsa.map[ !grepl( "AK$|HI$|PR$" , cbsa.map$NAME10 ) , ]

# cbsa.map$NAME10 now has a length of 933
length( cbsa.map$NAME10 )

# extract centroid for each CBSA
cbsa.centroids <- data.frame(coordinates(cbsa.map), cbsa.map$GEOID10)
names(cbsa.centroids) <- c("lon","lat","GEOID10")

# add lat lon to popualtion data
nrow(x)
x <- merge(x, cbsa.centroids, by="GEOID10")
nrow(x) # centroids could not be assigned to all records for some reason

# create a raster object
r <- raster(nrow=500, ncol=500, 
            xmn=bbox(m)["x","min"], xmx=bbox(m)["x","max"],
            ymn=bbox(m)["y","min"], ymx=bbox(m)["y","max"],
            crs=proj4string(m))

# run inverse distance weighted model - modified code from ?interpolate...needs more research
model <- gstat(id = "trinary", formula = trinary~1, weights = "weight", locations = ~lon+lat, data = x,
               nmax = 7, set=list(idp = 0.5))
r <- interpolate(r, model, xyNames=c("lon","lat"))
r <- mask(r, m) # discard interpolated values outside the states

# project map for plotting (optional)
# North America Lambert Conformal Conic
nalcc <- CRS("+proj=lcc +lat_1=20 +lat_2=60 +lat_0=40 +lon_0=-96 +x_0=0 +y_0=0 +ellps=GRS80 +datum=NAD83 +units=m +no_defs")
m <- spTransform(m, nalcc)
r <- projectRaster(r, crs=nalcc)

# plot map
par(mar=c(0,0,0,0), bty="n")
cols <- c(rgb(0.9,0.8,0.8), rgb(0.9,0.4,0.3),
          rgb(0.8,0.8,0.9), rgb(0.4,0.6,0.9),
          rgb(0.8,0.9,0.8), rgb(0.4,0.9,0.6))
col.ramp <- colorRampPalette(cols) # custom colour ramp
plot(r, axes=FALSE, legend=FALSE, col=col.ramp(100))
plot(m, add=TRUE) # overlay base map
legend("right", pch=22, pt.bg=cols[c(2,4,6)], legend=c(0,1,2), bty="n")

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 R 中的加权（调查）数据制作漂亮的无边界地理专题/热图，可能对点观测使用空间平滑的相关文章

使用 lpSolve 优化 R 团队名单

我是 R 新手有一个想要解决的特定幻想运动队优化问题我见过其他帖子使用 lpSolve 来解决类似的问题但我似乎无法理解代码下面的示例数据表每个球员都在一个球队中扮演着特定的角色有薪水并且每场比赛都有平均得分我需要的限制是
R：计算自上次出现某个值以来的累积总和和计数

给定简化数据 set seed 13 user id rep 1 2 each 10 order id sample 1 20 replace FALSE cost round runif 20 1 5 75 1 category samp
R 未获取用户库

我有一个带 R 3 6 0 的 Fedora 30 系统用户库设置在Renviron就像这个 R LIBS USER R LIBS USER R x86 64 redhat linux gnu library 3 6 事实上它出现在交互
R 中的输出，避免写“[1]”

I use print从 R 中的函数输出例如 print blah blah blah 这输出 1 blah blah blah 到控制台我怎样才能避免 1 和引号 Use cat Your string type cat查看帮助页面
RPostgreSQL 无法关闭连接

我有一个闪亮的应用程序使用它连接到数据库RPostgreSQL 在应用程序结束时连接关闭驱动程序应该被卸载但我收到错误警告我连接未关闭代码看起来像这样 in the app R file but not in the serve
通过 rpy 将 SPSS 文件（.sav）导入 pandas 时如何保留标签？

我正在寻找使用 SPSS 文件 sav pandas 在没有 SPSS 程序的情况下典型文件转换为 csv 后的样子如下在调查前两行的含义时我不知道 SPSS 似乎第一行包含Labels 而第二行包含VarNames 当我将文件带入
使用开源闪亮服务器时，我的图标不会显示在我的应用程序的浏览器选项卡上

我一直在尝试找到一种方法将 ico 与托管在开源闪亮服务器上的闪亮应用程序的快捷方式关联起来最终我希望 ico 显示为我的应用程序快捷方式的图形而且我希望用户在创建应用程序的快捷方式时显示可用此图标听起来很简单但事实证明这是一
如何使用 R 或 PowerShell 从文本文件中提取数据？

我有一个包含如下数据的文本文件 This is just text Username SOMETHI C Text Account DFAG Finish time 1 JAN 2011 00 31 58 91 Process ID 202
根据条件计算平均值

下面是我的数据框 Row ID A B 1 0 0 2 0 0 3 0 0 4 0 1 5 0 1 6 0 1 7 62 75 0 8 100 0 9 100 0 10 100 1 11 100 1 12 100 1 13 100 1 14
CSV、Python：正确使用 DictWriter（ValueError：dict 包含不在字段名中的字段）

我在掌握 csv 模块 Python 2 7 中的 DictWriter 时遇到困难我有这个哦我正在使用 unicodecsv 库因为我读到存在问题 f object instance return a dictionary key
在 R 中索引数据帧

再会我不明白这里的主题就像它有效但我不明白为什么我有这个数据库 planets df is pre loaded in your workspace Use order to create positions positions lt
如何导入 .tsv 文件

我需要读取一个表 tsvR 中的文件 test lt read table file drug info tsv Error in scan file what nmax sep dec quote skip nlines na strin
R CMD 检查警告：在文档对象中使用的函数/方法...但不在代码中

我正在写一个包但一个持久的R CMD check警告阻止我完成包裹并将其发布到 CRAN 我用roxygen2对于内联文档尽管这可能不是错误的根本原因如果您知道如何删除此警告我很可能可以找到一种方法来使用roxygen2 如何删除警
Python 添加/更新任意深度的 dict 元素

有一个像这样的字典 my pets Rudolf animal cat legs 4 达到低于同等水平的更清洁的方法是什么 my pets Rudolf legs front right injured True my pets Rudol
如何在environment.yml中安装CRAN包

我正在使用 miniconda 来管理数据科学包的安装这是我现在已经建立的工作流程所以我希望它也能在这种情况下工作我也认为它可以工作因为它应该在这样的情况下有所帮助比纯 python 需要更多的依赖项我想安装pythonCDT工
R.scale() 和 sklearn.preprocessing.scale() 之间的区别

我目前正在将数据分析从 R 转移到 Python 当在 R 中缩放数据集时我将使用 R scale 根据我的理解它将执行以下操作 x mean x sd x 为了替换该函数我尝试使用 sklearn preprocessing sca
在闪亮的应用程序中使用传单地图作为过滤器

是否可以使用传单地图来过滤闪亮应用程序中的数据就像在 Tableau 或 Power BI 中一样方法是单击地图上的某个状态然后根据条件过滤另一个图表或表格选择 None
rowSums 全部 NA [重复]

这个问题在这里已经有答案了 df lt data frame a c 1 1 NA 0 1 0 b c 0 1 NA NA 0 1 c c NA 0 NA 0 1 NA d c 1 NA NA 1 1 0 rowSums df 1 NA N
ggplot() 使用scale::percent_format() 缩放产生奇怪的结果

library tidyverse mtcars gt count cyl gt mutate prop n sum n gt ggplot aes x cyl y prop geom point scale y continuous la
Pandas 数据框可对多列和要列出的值进行字典

我有一个数据框 id key a1 1 a2 1 a3 1 a4 2 a5 2 a6 3 我想创建一本字典key作为机器号并且id列作为列表 like 1 a1 a2 a3 2 a4 a5 3 a6 我可以先使用 groupby 然后再使

随机推荐

带块的 File.open 与不带块的 File.open

我有一个关于 Block 的问题这两个代码的含义相同吗 code 1 File open yozloy txt w do f f lt lt Some contains end code 2 newFile File open yozlo
添加标签覆盖谷歌地图

我成功添加信息窗口
响应式 HTML 电子邮件可以使用手风琴吗？

我的客户想要一封响应式电子邮件其中文本未完全显示但已嵌入电子邮件正文中当用户单击单击更多时文本会展开并且所有文本都变得可见那可能吗据我所知伪类在电子邮件客户端上是不可能的并且使用内联编码构建手风琴在技术上非常困难有任何
AS3敌人双倍速度？

我使用 AS3 和 Air 3 2 for Android 在 Flash CS6 中制作了一个游戏现在这个游戏你会进入不同的菜单当你死后它会返回主菜单并显示你的分数现在当你选择一个新角色并玩时再次穿越怪物速度翻倍知道为什么吗
如何使用 proc http 和 http_tokenauth 在后台调用 SAS STP

我正在尝试使用选项后台通过 proc http 从 SAS 调用存储进程 STP 以确保我的主进程不会等待 STP 完成我确实使用以下代码 filename resp
Idris：函数使用 Nat 参数，但使用 Integer 参数时类型检查失败

我是伊德里斯的新手我正在尝试类型我的任务是制作一个洋葱一个带有两个参数的函数一个数字和任何东西并将任何东西放入List嵌套了这么多次例如结果为mkOnion 3 Hello World 应该 Hello World 我做了这
在向后传递中调试 nan

我正在尝试调试一个有点复杂且非规范的神经网络架构计算前向传递很好并且给了我预期的结果但是当我尝试使用 Adam 或任何标准优化器进行优化时即使在学习率非常小的一次迭代之后我到处都得到 nan 我正在尝试对它们进行本地化并且想知道
使用 ffmpeg 垂直或水平堆叠（马赛克）多个视频？ [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我有两个长度完全相同的视频我想使用 ffmpeg 将它们堆叠到一个视频文件中我怎样才能做到这一点 Use the vstack htt
告诉 jQuery 在动画序列期间忽略点击

我正在为 jQuery 编写一个幻灯片放映应用程序单击一个按钮然后滑动浏览图像列表但是我遇到了一个小错误它将响应click 即使在动画发生时也发出请求我正在使用animate 功能已经存在因此这不会避免额外的动画请求有什么办法
Winforms TextBox 可以设置背景图片吗？

是否可以更改 Windows 窗体的背景图像TextBox在 C 中没有BackgroundImage财产我应该覆盖Paint方法不知何故这是不可能的如果您尝试在构造函数中重写 TextBox 并调用 SetStyle Contro
$().ready() 和 $(document).ready() 之间有区别吗

我见过一些代码他们只是这样做 ready function 这比执行文档选择器要短但它是同一件事吗轻微变化 document ready function 等于 function 从 jQuery 1 4 开始 ready funct
我可以在远程/本地接口中使用继承吗？（EJB3）

一个例子 Remote public interface SomeComponentRemote public Something processStuff Local public interface SomeComponentLocal
C# .NET 中的 FLV/F4V 对话库？

是否有任何库可以在 c NET 中以编程方式将输入视频某些特定视频文件转换为 f4v 或 flv 提前致谢 http ffmpegdotnet codeplex com http ffmpegdotnet codeplex com
如何在绘图的 y 轴上显示 % 值？

在任何 Mathematica 图表或绘图中如何在 y 轴上显示值我可能有这样的数据 data 2010 8 3 0 2010 8 31 0 052208 2010 9 30 0 008221 2010 10 29 0 133203
雪花存储过程 While 函数

我如何在雪花示例中重新创建 while 函数 WHILE counter lt LastRow BEGIN SELECT DateLoad CONVERT date SUNDAY FROM Staging Stg EC WeeksLoad
如何在 Django 视图中显示 PDF 文件？

是否可以显示 PDF 文件inDjango 视图而不是让用户必须下载它才能看到它如果可能的话会怎样做这就是我到目前为止所拥有的 login required def resume request applicant id Get t
将图像 ID 添加到 dropzone .js 中预览模板中的每个图像

我只想为使用 dropzone js 上传的每个图像添加图像 ID 目前预览模板是这样的 div class dz preview dz image preview div class dz details div class dz fil
Django + AWS S3 Bucket：对 S3 Bucket 进行身份验证访问

我有一个带有特殊目录的 S3 存储桶我正在转储用户上传的图像我希望将这些图像限制为经过身份验证的用户它不应仅限于上传图像的用户我真的试图避免为此设置数据库模型有没有办法阻止匿名会员上传图片所以我有两个问题如何设置匿名用户阻止
返回数字的总和（正数或负数）

我需要创建一个函数它接受一个数字并返回其数字之和如果该数字为负数则在添加数字时第一个数字应被视为负数这就是我所拥有的 var arrx var oper var others 0 function sumDigits num you
如何使用 R 中的加权（调查）数据制作漂亮的无边界地理专题/热图，可能对点观测使用空间平滑

自从约书亚卡茨发表这些方言地图 http spark rstudio com jkatz SurveyMaps 你可以找到 using 哈佛大学方言调查 http www4 uwm edu FLL linguistics dialect

如何使用 R 中的加权（调查）数据制作漂亮的无边界地理专题/热图，可能对点观测使用空间平滑

如何使用 R 中的加权（调查）数据制作漂亮的无边界地理专题/热图，可能对点观测使用空间平滑 的相关文章

随机推荐

热门标签

如何使用 R 中的加权（调查）数据制作漂亮的无边界地理专题/热图，可能对点观测使用空间平滑的相关文章