我知道如何在 Open Fine 中解析 json 单元格,但这对我来说太棘手了。
我使用 API 提取了 4730 个 AirBNB 房间的日历,并通过其 ID 进行识别。
以下是一个 Json 文件的示例:
对于从现在到 2017 年 11 月的每个 ID 和一年中的每一天,我想提取当天该房间的可用性(真或假)及其价格。
我不知道如何解析这些信息。我猜想这意味着一系列嵌套的 forEach,但我找不到使用 Open Refine 执行此操作的正确方法。
当然我也尝试过
forEach(value.parseJson().calendar_months, e, e.days)
结果是一堆字典数组,这让我很困惑。
任何帮助将不胜感激。如果 Open Refine 中的操作太困难,使用 R(或 Python)的解决方案对我来说也可以。
而不是仅仅将项目创建为文本,然后使用 GREL 来解析......
最好的方法是使用我们的 JSON 文件和 XML 文件的可视化导入器向导选择您想要使用的 JSON 记录部分(您甚至可以使用指向 JSON 文件的 URL,如示例中所示)。 (视频教程展示了如何操作:https://www.youtube.com/watch?v=vUxdB-nl0Bw https://www.youtube.com/watch?v=vUxdB-nl0Bw )
Select the JSON part that contains your records that you want to parse and work with (this can be any repeating part, just select one of them and OpenRefine will extract all the rest)
Limit the amount of data rows that you want to load in during creation, or leave default of all rows.
单击“创建项目”,现在您处于“行”模式。但是,如果您认为记录模式可能更适合上下文,只需再次将项目导入为 JSON,然后选择内容的下一个外部区域,可能是包含关键字段的更大数组等。在示例中,关键是字段可能是日期,以及为什么我突出显示给定日期的整个记录。这样,OpenRefine 将为每个记录提供键,并且记录模式可以让您比行模式更好地使用它们。
请随意使用这个示例并使其变得更好,甚至对所有人更有帮助,将其添加到我们的 Wiki 部分如何使用 https://github.com/OpenRefine/OpenRefine/wiki/User-Guide
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)