在U-SQL中解析json文件

2024-04-08

我正在尝试使用 USQL 解析下面的 Json 文件，但不断收到错误。

Json file@

{"dimBetType_SKey":1,"BetType_BKey":1,"BetTypeName":"Test1"}
{"dimBetType_SKey":2,"BetType_BKey":2,"BetTypeName":"Test2"}
{"dimBetType_SKey":3,"BetType_BKey":3,"BetTypeName":"Test3"}

下面是 USQL 脚本，我试图从上面的文件中提取数据。

    REFERENCE ASSEMBLY [Newtonsoft.Json];
    REFERENCE ASSEMBLY [Microsoft.Analytics.Samples.Formats];

DECLARE @Full_Path string =
"adl://xxxx.azuredatalakestore.net/2017/03/28/00_0_66ffdd26541742fab57139e95080e704.json";

DECLARE @Output_Path = "adl://xxxx.azuredatalakestore.net/Output/Output.csv";

@logSchema =
EXTRACT dimBetType_SKey int
FROM @Full_Path
USING new Microsoft.Analytics.Samples.Formats.Json.JsonExtractor();

OUTPUT @logSchema
TO @Output_Path 
USING Outputters.Csv();

但 USQL 不断失败并出现 Vertex 错误

有什么帮助吗？

这可能是因为文件的每一新行上都有新的 JSON 块。这意味着您需要对其进行稍微不同的解析，而不是直接解析 JSON 文件。

首先尝试使用文本提取器来引入带有新行分隔符的每个 JSON 元素。像这样...

DECLARE @Full_Path string = "etc"

@RawExtract = 
    EXTRACT 
        [RawString] string, 
        [FileName] string //optional, see below
    FROM
        @Full_Path
    USING 
        Extractors.Text(delimiter:'\b', quoting : false);

然后使用您引用的程序集分解 JSON，但使用 JSON 元组方法。像这样...

REFERENCE ASSEMBLY [Newtonsoft.Json];
REFERENCE ASSEMBLY [Microsoft.Analytics.Samples.Formats];

@ParsedJSONLines = 
    SELECT 
        Microsoft.Analytics.Samples.Formats.Json.JsonFunctions.JsonTuple([RawString]) AS JSONLine,
        [FileName]
    FROM 
        @RawExtract

接下来，取出值。像这样...

@StagedData =
    SELECT 
        JSONLine["dimBetType_SKey"] AS dimBetType_SKey,
        JSONLine["BetType_BKey"] AS BetType_BKey,
        JSONLine["BetTypeName"] AS BetTypeName
        [FileName]
    FROM 
        @ParsedJSONLines;

最后，将输出导出为 CSV 或其他格式。

DECLARE @Output_Path string = "etc"

OUTPUT @StagedData
TO @Output_Path 
USING Outputters.Csv();

顺便说一句，您不需要引用完整的数据湖存储路径。分析引擎知道存储的根在哪里，因此您可以用这个替换变量......

DECLARE @Full_Path string = "/2017/03/28/{FileName}";

希望这有助于解决您的问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

json

Azure

azuredatafactory

azuredatalake

usql

在U-SQL中解析json文件的相关文章

如何在 JSON 中转义双引号

我试图显示双引号但它显示了反斜杠之一 maingame day1 text1 Tag 1 text2 Heute startet unsere Rundreise Example text Jeden Tag wird ein neues
在 swift 中将简单字符串转换为 JSON 字符串

我知道有一个同标题的问题here https stackoverflow com questions 30825755 convert string to json string in swift 但在那个问题中他试图将字典转换为 JSO
将 JSON 反序列化为表

我需要根据通过 API 接收的数据填充 ABAP 中的表我正在使用以下 ABAP 函数从 json 填充现有的 ABAP 表 JSON 是正确的表中包含相应的表 ui2 cl json gt deserialize EXPORTING
处理 fanart.tv Web 服务响应 JSON 和 C#

我正在尝试使用 fanart tv Webservice API 但有几个问题我正在使用 Json Net Newtonsoft Json 并通过其他 Web 服务将 JSON 响应直接反序列化为 C 对象这里的问题是元素名称正在更改
如何在 Azure 数据工厂 - Databricks 中使用 continuation_token 获取 ADF Pipeline 运行详细信息的下一页？

我在用 adf client pipeline runs query by factory resourceGroupName 工厂名称过滤器参数的方法azure mgmt datafactory DataFactoryManageme
JSON-LD 缺少“}”或对象成员名称。错误

我喜欢将 json ld 添加到我的网站然后我想将它添加到我的开发网站来测试它我收到错误消息指出缺少或对象成员名称这是什么错误我已正确关闭括号如何修复它
Azure 上的“phpcomposer.phar install”出现“无法终止进程”错误

我正在尝试将我的 Symfony 2 应用程序部署到 Microsoft Azure 网站云为此我按照本指南中的步骤操作http symfony com doc current cookbook deployment azure web
使用 Python 将对象列表转为 JSON

我在转换时遇到问题Object实例到 JSON ob Object list name scaping myObj base url u number page for ob in list name json string json du
Azure函数版本2.0-应用程序blobTrigger不工作

我有一个工作功能应用程序它有一个 blob 输入和一个事件中心输出在测试版中工作随着最新的更改我的功能不再起作用我尝试根据发行说明更新 host json 文件但它没有引用 blob 触发器 version 2 0 extens
Azure消息队列中的消息将直接进入Poison消息队列

希望这可以节省某人一些时间当移动到较新的版本时下面的代码停止工作QueueClient https learn microsoft com en us dotnet api azure storage queues queueclien
Postgres JSONB：数组数组的 where 子句

postgres 中有 v 9 5 如果有的话 create table json test id varchar NOT NULL data jsonb NOT NULL PRIMARY KEY id 其中 data 是 json 并且包
根据 .NET Core 2.1 中的更改重新加载 Serilog JSON 配置

我目前正在开发 ASP NET Core 2 1 应用程序并使用 Serilog 进行日志记录我想在运行时为我的 Serilog 实现重新加载应用程序设置文件我的目标是在运行时更改日志级别例如我写入minimumLevelDebug
如何将张量流模型部署到azure ml工作台

我在用Azure ML Workbench执行二元分类到目前为止一切正常我有很好的准确性我想将模型部署为用于推理的 Web 服务我真的不知道从哪里开始 azure 提供了这个doc https learn microsoft co
为什么 PyYAML 花费这么多时间来解析 YAML 文件？

我正在解析一个大约 6500 行的 YAML 文件格式如下 foo1 bar1 blah name john age 123 metadata whatever1 whatever whatever2 whatever stuff thi
如何返回 json 结果并将 unicode 字符转义为 \u1234

我正在实现一个返回 json 结果的方法例如 public JsonResult MethodName Guid key var result ApiHelper GetData key Data is stored in db as v
Cosmos DB Mongo API 如何管理“请求率很大”情况

我有以下代码 async function bulkInsert db collectionName documents try const cosmosResults await db collection collectionName
如何为 Gson 编写自定义 JSON 反序列化器？

我有一个 Java 类用户 public class User int id String name Timestamp updateDate 我收到一个包含来自 Web 服务的用户对象的 JSON 列表 id 1 name Jonas
将 JSON 参数从 java 发布到 sinatra 服务

我有一个 Android 应用程序发布到我的 sinatra 服务早些时候我无法读取 sinatra 服务上的参数但是在我将内容类型设置为 x www form urlencoded 之后我能够看到参数但不完全是我想要的我在
Azure 共享计划上的 SSL？

我有 1 个网站 1 个数据库和 1 个 SSL 托管在 azure 上我曾经拥有基本托管套餐但每个月要支付 70 美元才能获得基本设置并且所有内容都具有最小的缩放比例我意识到我的低流量站点不需要专用计算机因此我尝试转向共享计
在 Windows Phone silverlight 8.1 上接收 WNS 推送通知

我有 Windows Phone 8 1 silverlight 应用程序我想使用新框架 WNS 接收通知我在 package appxmanifest 中有

随机推荐

仅允许特定 IP 地址访问 JSP 文件/文件夹

我使用 JSP 和 servlet 制作了一个 CMS 应用程序我没有使用任何类型的框架 CMS 有 2 个部分前端管理员后端如果我把它托管在www example com 例如那么我的所有前端站点都会向所有用户显示 But w
从具有相同列的两个表中选择数据

我有两个具有相同结构的表一种包含永久数据另一种是清除并定期重置的我需要对两个表使用相同的 select 语句就好像它们只是一张表一样这是我尝试过的选择从a b哪里 1 Where a and b具有相同的结构您可能正在考虑在
HtmlAgilityPack 可以处理 xsl 文件附带的 xml 文件来渲染 html 吗？

我想知道 HtmlAgilityPack 读取包含 xsl 文件的 xml 文件以呈现 html 的最佳方式 HtmlDocument 类上是否有任何设置可以帮助实现此目的或者我是否必须找到一种方法来执行转换然后再使用 HtmlAgil
如何删除或排除 Ansible 模板列表中的项目？

我正在编写一个 Ansible 模板需要生成主机组中的 IP 列表排除当前主机IP 我在网上和文档中进行了搜索但找不到任何允许您删除列表中项目的过滤器我在下面创建了 hacky for循环来执行此操作但想知道是否有人知道这样的过滤
time.time_ns() 在 macOS 上未正确返回纳秒？

从 Python 3 7 开始我们有了支持纳秒分辨率的新时间函数但是我不确定如何time time ns 应该可以工作看下面的例子 gt gt gt for n in range 10 time sleep random rando
防止安装具有特定包名的 Android 应用程序

我正在使用 android studio 开发两个 Android 应用程序出于某种原因我希望其中一个应用程序可以安装在设备上我想我应该检查第二个应用程序的包名称并阻止它安装有什么办法可以做到这一点吗谢谢您无法阻止任何应用程序的
分段色彩图的自定义色彩图边界

我有下图其中包含具有某些量化特征的多个向量的可用数据 import matplotlib pyplot as plt import numpy as np import matplotlib colors as colors fig pl
版本控制 SOAP 主体与整个服务？

尝试了解 SOAP 和 Web 服务的版本控制根据我的发现使用 URL 执行类似的操作似乎是可以接受的 www company com service 01 12 10 和 www company com service 03 08 1
'.' 之前应有 '='、','、';'、'asm' 或 '__attribute__'代币

Could not able to solve this I am implementing a queue After writing the complete code I had the error listed below expe
为什么 JBoss 5.1 中类路径默认为 WEB-INF/classes/ 而不是 WEB-INF/？

我有一段代码可以使用 spring 上下文 context new ClassPathXmlApplicationContext application context xml 该文件位于 WAR 的 WEB INF application
使用 Django Rest Framework 在 Pre_Save 中引发验证错误

我在使用 Django Rest 框架提出验证错误时遇到困难我有一个所有者字段所有者字段需要访问请求对象文档建议使用以下方法 http www django rest framework org tutorial 4 authenti
如何在 keras 中存储每个周期的操作结果（如 TOPK）

我在keras中编写了一个自定义层在这个自定义层的一部分中可以说我有一个像这样的矩阵 c tf cast tf nn top k tf nn top k n tf shape n 1 1 1 tf shape n 1 1 1 dtype
如何将文本渲染为位图并绘制它

我是 android 新手我的小组目前正在使用 opengl es 2 0 使用 GlSurfaceView 创建图形应用程序我们最近在绘图上显示了网格和刻度线现在我被分配了实现数字刻度并将 x 和 y 轴标记为 X 和 Y 的任务
使用 SHGetSpecialFolderPath 检索非管理员用户也可以访问的应用程序文件夹，选择哪个 CSIDL？

在我的应用程序中我在每台计算机上的应用程序文件夹中存储一些文件真实案例的简化版本是这样的 Project1 LoginHistory login history file common for all users Project1 Tr
在 Android 中缓存数据的最佳方法

我有一个ArrayList定制化简单化Serializable我想缓存到磁盘并在重新启动时读取的对象我的数据非常小大约有 25 个对象最多 5 个列表所以我认为 SQLite 有点过大了在 iPhone 世界里我会使用NSKey
非公开 API 使用

我无法将应用程序上传到 iTunes Connect Xcode 上传器说我正在使用allocBatch withEntity count allocWithEntity IndexForKey fastIndexForKnownKey 我
跳过 PHP 结束标记 [重复]

这个问题在这里已经有答案了当我使用 Magento 进行开发时我发现如果我不在 PHP 代码下面使用 HTML 则不需要放置 php 结束标记 gt 它安全吗为什么我们不直接加上结束标签有用吗官方立场 http php net m
使用Spark，如何连接master或解决错误：“WARN TaskSchedulerImpl：初始作业尚未接受任何资源”

请告诉我如何解决以下问题首先我确认以下代码在 master 为本地时运行然后我启动了两个 EC2 实例 m1 large 但是当 master 为 spark MASTER PUBLIC DNS 7077 时会出现错误消息 T
AngularJS 中的 $http 上传文件进度

如何从上传图像的 AngularJS http POST 请求中获取进度事件是否可以在客户端执行此操作或者我是否需要服务器在接收数据时报告进度使用纯角度 function upload data var formData new
在U-SQL中解析json文件

我正在尝试使用 USQL 解析下面的 Json 文件但不断收到错误 Json file dimBetType SKey 1 BetType BKey 1 BetTypeName Test1 dimBetType SKey 2 BetTyp

在U-SQL中解析json文件

在U-SQL中解析json文件 的相关文章

随机推荐

热门标签

在U-SQL中解析json文件的相关文章