使用 jq 处理巨大的 GEOJson 文件

2023-12-01

给定一个 GEOJson 文件如下：-

{
  "type": "FeatureCollection",
  "features": [
   {
     "type": "Feature",
     "properties": {
     "FEATCODE": 15014
  },
  "geometry": {
    "type": "Polygon",
    "coordinates": [
     .....

我想结束以下内容：-

{
  "type": "FeatureCollection",
  "features": [
   {
     "tippecanoe" : {"minzoom" : 13},
     "type": "Feature",
     "properties": {
     "FEATCODE": 15014
  },
  "geometry": {
    "type": "Polygon",
    "coordinates": [
     .....

IE。我已将 Tippecanoe 对象添加到数组中的每个功能中features

我可以通过以下方式完成这项工作：-

 jq '.features[].tippecanoe.minzoom = 13' <GEOJSON FILE> > <OUTPUT FILE>

这对于小文件来说很好。但是，处理 414Mb 的大文件似乎要花很长时间，因为处理器已达到极限并且没有任何内容写入输出文件

进一步阅读 jq 似乎--stream命令行参数可能会有所帮助，但我完全不知道如何使用它来达到我的目的。

我将不胜感激有一个示例命令行可以满足我的目的，并解释 --stream 正在做什么。

仅使用 jq 的一次性方法可能需要比可用内存更多的 RAM。如果是这种情况，那么下面显示了一个简单的全 jq 方法，以及基于使用 jq 和 awk 的更经济的方法。

除了将对象流重构为单个 JSON 文档之外，这两种方法是相同的。使用 awk 可以非常经济地完成此步骤。

在这两种情况下，假定具有所需形式的对象的大型 JSON 输入文件被命名为 input.json。

jq-only

jq -c  '.features[]' input.json |
    jq -c '.tippecanoe.minzoom = 13' |
    jq -c -s '{type: "FeatureCollection", features: .}'

jq 和 awk

jq -c '.features[]' input.json |
   jq -c '.tippecanoe.minzoom = 13' | awk '
     BEGIN {print "{\"type\": \"FeatureCollection\", \"features\": ["; }
     NR==1 { print; next }
           {print ","; print}
     END   {print "] }";}'

性能对比

为了进行比较，使用了 .features[] 中包含 10,000,000 个对象的输入文件。其大小约为1GB。

u+s:

jq-only:              15m 15s
jq-awk:                7m 40s
jq one-pass using map: 6m 53s

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

json

Stream

GeoJson

jq

Bigdata

使用 jq 处理巨大的 GEOJson 文件的相关文章

Web API 复杂参数属性均为 null

我有一个 Web API 服务调用可以更新用户的首选项不幸的是当我从 jQuery ajax 调用中调用此 POST 方法时请求参数对象的属性始终为 null 或默认值而不是传入的值如果我使用 REST 客户端调用相同的方法我使
使用 JSON 传递 HTML

我正在使用 JSON 将数据传递到 iPhone 和 iPad 数据的一个字段是 HTML 问题是编码这是我得到的回复 gt GadgetHTML strong Hello strong gt from Catworld br n img
将Json字符串映射到java中的map或hashmap字段

假设我从服务器返回了以下 JSON 字符串 response imageInstances one id 1 url ONE two id 2 url TWO 杰克逊代码大厦 JsonProperty 我怎样才能得到HashMap对象出来了
Ruby on Rails：如何使用 JSONPath 访问（并保存到数据库）JSON 数组中的嵌套对象/属性？

我正在尝试将 JSON 对象数组中的数据播种到我的数据库中我有两个单独的数据库表属性和单位一个属性有许多单位我已经能够通过 API 请求 JSON 数据然后将其播种到数据库成功地对属性信息属性模型执行此操作但是 Valua
使用最新 Ember Data 版本中的 RESTSerializer 格式化 JSON

我正在努力将我的 JSON munge 成正确的格式为了说明这一点我做了一个快速的 JSfiddle http jsfiddle net chrismasters NQKvy 638 http jsfiddle net chrismas
当我运行反应脚本“yarn start”时，我到index.html中的manifest.json的链接有效，但当我运行“python3 manage.py runserver”时则无效

当我运行 yarn start 时我的index html 文件中的manifest json 链接工作正常但是当我运行时 python3 manage py runserver 我在终端得到的只是 Not Found manifest
MongoDB GeoJSON“无法从对象、格式错误的几何图形中提取地理密钥？”插入类型 Polygon 时

我收到错误无法从对象中提取地理密钥几何图形格式错误多边形已闭合格式看起来不错因为它已正确插入到 Mongo 中我使用的是 Mongo 版本 2 6 3 在 Centos 6 5 x64 上运行下面的多边形有什么问题我非常仔细
如何在 JSONKit 中 JSON 序列化 NSDate 字典

我尝试使用 Jsonkit 和 Apple 的 JSON 序列化器但没有成功它不断破坏 geo 属性该属性是 NSNumbers 的 nsarray Post p Post alloc init p uname mike p like
如何在 laravel 中查询 json 列？

我用的是 Laravel 5 6 我有一块田地字段的数据类型为json 字段 desc 字段的值如下所示 code 1 club CHE country ENGLAND code 2 club BAY country GERMANY c
IE8 上 json 解析失败

json gt 返回的响应 msg div p Unfortunately we were unable to process your application p br Please upload a CV br div status e
在动态选项卡中网格时 JSON 数据不显示？

我的网格在放入选项卡时不显示数据该网格存储模型 JSON 在渲染到 body 或 div 或作为视口的一部分时起作用只是放入选项卡时不显示这也是使用 JSON 和 Tree 创建的这是一个有时有效的示例我不明白也许范围错
如何从 mysql 数据库中提取数据并使用 D3.JS 进行可视化？

我有一个数据库MySQL我想在其中可视化D3 JS 为了做到这一点首先我想parse中的数据JSON格式然后编写一个基本代码从数据库中提取数据并使用D3 JS 我环顾四周但找不到我想要的东西因为我是新手D3 JS 我怎样才能做到这
postgresql to_json() 函数转义所有双引号字符

我编写了一个 plpgsql 脚本它在字符串中生成一个 json 对象数组但是在我使用 to json 方法将带有该字符串的变量传递给它之后它返回一个带双引号的结果并且每个双引号字符都被转义但我需要原样的字符串 jsonResul
Express 不断将 request.body 获取为未定义的 JSON 对象

我正在发出一个 Ajax 请求如下所示 ajax url gen type POST data JSON stringify one 1 two 2 success function data console log this 我的快递部
如何将模型绑定到动态创建的类 nancyfx

首先感谢任何愿意查看我的问题的人我对 Nancyfx 还很陌生在尝试将 JSON 有效负载绑定到动态创建的类时遇到问题我按照这篇文章中的代码动态创建了该类在C 中动态创建一个类 https stackoverflow com que
反序列化没有 jsonpickle 元数据/类型信息的 json 时，如何告诉 jsonpickle 创建哪个类

我是Python新手但在其他语言中我已经能够告诉序列化器我想要创建什么类型并让它根据反射内省反序列化或绑定属性如果您使用 jsonpickle 序列化它 jsonpickle 会将类型信息添加到 json 但是在这种情况下我得到
JSONP 回调失败，需要 javascript/jquery 帮助

我是 json 的菜鸟了解一点 jquery 并尝试让一个小脚本工作我想检索某个纬度经度的时间并根据我在网上阅读的内容编写了这个脚本 getJSON http ws geonames org timezoneJSON lat 47
HttpResponseMessage 的内容为 JSON

我有一个 ASP NET MVC WEB API 由于多种原因由于没有授权而重定向我不能只使用一个简单的对象并在我的控制器方法中返回它因此我需要 HttpResponseMessage 类来允许我重定向目前我正在这样做 var re
如何更改JMeter HTTP请求中Post Body的内容

请原谅我的无知因为我是一个jmeter菜鸟我的 web 服务接受 JSON 对象因此我能够编写一个基本测试在该测试中我在 http 请求的 Post Body 部分中使用 JSON 对象创建一个 HTTP 请求不管怎样我想要做的
如何使用自定义转换器访问 jOOQ 生成的例程字段作为值？

我在访问生成例程的字段时遇到问题PL pgSQL 用户定义函数返回JSON 数据类型结果已经提到this https stackoverflow com q 62535195 6805866问题这是我的结果get all orders

随机推荐

如果存在多行，则排除列包含值的行

表有 User Value john 284 john 200 john 5 sally 245 sally 180 sally 10 bill 90 bill 1000 bill 284 greg 10 greg 90 greg 2000
逻辑及其在 Collections.Generic 和继承中的应用

一切都继承自对象这是继承的基础一切都可以隐式地构建继承树即 object me new Person 因此遵循这一逻辑结论一群人也将是一组对象 List
Windows 上的本机 Docker

最近我读到一些新闻文章说微软正在与 Docker 合作让 docker 在 Windows Server 上原生运行我想问的是这是否允许 Windows 应用程序在 docker 容器内运行或者这只是运行已经可用的 docker
为什么 SQL Server 2005 动态管理视图报告缺少索引，而事实并非如此？

我正在使用 SQL Server 2005 和动态管理视图sys dm db missing index details 它继续告诉我 Table1 确实需要 Column 和 Column 上的索引但该索引已经存在我什至多次删除并重新
如何可视化 chrome DevTool 协议消息日志？

我使用 Selenium 和 Chrome 驱动程序还启用了性能日志记录以便更好地了解测试期间的问题性能日志似乎是一个 json 数组其中包含 chrome 的 DevTool 协议消息是否有任何工具可以让我像 Chrome 的开
Swift 中的单例用法

我仍然对使用 Swift 感到有点困惑希望有人能帮助澄清我何时以及为何使用它们根据我对 Singleton 的理解它们是单类实体这意味着如果我有 A 类并且在 B 类中创建 A 类的共享实例那么它只是 B 中对 A 类的引用所
如何根据日期值将列表的元素插入另一个列表？

我有一份房屋清单 list1 home1 home2 home3 home4 我还有另一份具体房屋清单 list2 home6 home7 home8 home10 每个家都有一块田地date 我想插入List2 into list1根据h
UIViewController诞生的过程是怎样的（哪个方法遵循哪个）？

有很多方法可以覆盖例如initWithNibname awakeFromNib loadView viewDidLoad viewDidAppear layoutSubviews 我只是无法决定调用这些方法的顺序我只是用心重写其中一
Linq orderby 对多列进行排序，其中一列可能为 null

我有一个表其中有 2 个字段名称和订单订单可以为空使用 LINQ 我希望能够按 Order 排序或者如果 Order 为 null 则按 Name 排序这是我的非工作代码 from ft in FacetTypes ord
关于@symbol对JSON key的影响

我的 JSON 结构如下 var myJSON userTypes type Array type Administrator Customer Guest 当我尝试访问时myJSON userType
在已经使用 bootstrap 库的情况下，如何添加 jquery ui 日期选择器？

我正在使用 bootstrap 我打算使用它向页面添加一个日期选择器但没有成功所以我使用查询 ui 找到了日期选择器的代码日期选择器并在新的 html 页面中尝试了此操作效果非常好但是我现在想在我正在处理的页面中使用它但不同
如何在用户关闭应用程序 JFrame 之后、程序退出之前直接保存一些对象？

再会我正在使用扩展 JFrame 的 NetBeans IDE 开发一个小型 Java 应用程序我实现了几种关闭应用程序的方法例如按Ctrl Q并按 JFrame 的 X 但在实际关闭之前我希望程序为我执行一些额外的代码以保存应用
ANTLR - 输入错误不匹配

我有一个语法如下所示由特定语言的注释和控制语句组成 Grammar grammar DD ddlist ddstmt jclcomment ddstmt dd1 dd2 dd3 dd4 dd1 JCLBEGIN ddname DDWOR
如何将半圆蒙版应用于 ImageView

我有一个图像一个半圆形框架图像我需要将该图像放入该框架内但我需要对图像应用蒙版以便它仅显示在框架内例如这是我的图像而我想要的结果应该是这样的红框也是内部透明的图像视图我怎样才能在Android中实现这一点有一个很棒的教程
YouTube 可以直接上传到所有用户的通用帐户吗？

是否可以配置 YouTube Direct 以便将视频上传到一个中央帐户而不是单个用户的帐户我们已经有了自己的身份验证流程不希望客户登录我们的系统然后登录 Google 上传视频我们可以拥有自己的视频捕获系统将视频录制到我们的服务
将结果存入变量

我有以下示例代码我可以通过打印功能在控制台中看到正确的结果 Define a model for linear regression const model tf sequential model add tf layers dense
谷歌日历 API 令牌将在 7 天后过期

I used 本指南创建 Google 日历OAuth2客户端 ID 和客户端密钥然后我使用 gcalcli 命令创建 API 访问令牌 gcalcli noauth local webserver client id clientid
Firebase：限制同一电话号码或同一设备的短信数量

我们正在尝试在我们的 Android 应用程序中实现 firebase 电话身份验证如此处所述link 它在我们的应用程序中运行良好服务器端验证也按预期工作现在我们想为同一电话号码或同一设备添加每日短信数量限制以防止滥用链接引用
使用 VADump 跟踪内存使用情况 - OpenProcess 失败 c0000034

读完一篇最新一期 MSDN 杂志中的文章我想尝试使用 VADump 来分解我编写的一些应用程序的内存使用情况我的电脑上唯一的可执行文件副本位于 c Program Files Microsoft Visual Studio 8 Comm
使用 jq 处理巨大的 GEOJson 文件

给定一个 GEOJson 文件如下 type FeatureCollection features type Feature properties FEATCODE 15014 geometry type Polygon coordinat

热门标签