usql

Sql中的Partition By和Clustered and Distributed By - 需要知道它们的含义以及何时使用它们

我可以看到在 SQL 中创建表时我们可以使用 Partition By Clustered 和 Distributed By 子句根据我的理解分区会将相同键我们在其上有分区的数据存储在一起或更接近可能在后台相同的结构化流中这

usql

U-SQL 中的自动增量

我正在尝试形成一个新表其中包含现有表中唯一的 user id 是否可以添加自动递增U SQL 中的主键就像我们可以在 MySQL 中添加一样吗详细说明 David 的答案与 MySQL 不同 ADLA U SQL 是在横向扩展的无共享

usql azureservicebusqueues

数据湖分析 U-SQL 提取速度（本地与 Azure）

一直在研究使用 Azure Data Lake Analytics 功能来尝试操作我存储在 Azure Blob 存储中的一些 Gzip 处理的 xml 数据但我遇到了一个有趣的问题本质上当在本地使用 U SQL 处理 500 个 x

Azure azureblobstorage azuredatalake usql

从 U-SQL 表加载数据时优化器内部错误

有没有办法解决这个错误 CQO 内部错误优化器内部错误断言 a drgcidChild gt CLength UlSafeCLength popMS gt Pdrgcid 在 rlstreamset cpp 499 从分区 U SQL

azuredatalake usql

在U-SQL中解析json文件

我正在尝试使用 USQL 解析下面的 Json 文件但不断收到错误 Json file dimBetType SKey 1 BetType BKey 1 BetTypeName Test1 dimBetType SKey 2 BetTyp

json Azure azuredatafactory azuredatalake usql

如何在 U-SQL 中抛出错误或引发异常？

在 U Sql 脚本中引发错误或异常的机制是什么我有一个场景正在处理 CSV 文件如果在其中发现重复项那么我需要放弃处理在 SQL 中我可以做raiseerror 在 U Sql 中执行此操作的等效方法是什么创建一个 C 函数

azuredatalake usql

usql 应用程序和脚本的单元测试

我有一个自定义的 USql 应用程序它扩展了IApplier class SqlUserDefinedApplier public class CsvApplier IApplier public CsvApplier totalcoun

c azuredatalake usql

尝试转换列数据时值太长失败

Scenario 我有一个源文件其中每个新行都包含 JSON 块然后我有一个简单的 U SQL 摘录如下所示其中 RawString 表示文件中的每个新行 FileName 定义为 SourceFile 路径中的变量 BaseEx

json Azure azuredatalake usql

我们如何在azure数据湖中的u-sql中根据时间戳作业执行动态输出文件名

我们如何根据作业执行时的时间戳在azure数据湖的u sql中动态输出文件名谢谢您的帮助我的代码如下 OUTPUT telDataResult TO wasb email protected cdn cgi l email protec

azuredatalake usql

使用 Azure Data Lake Analytics 与传统 ETL 方法的原因

我正在考虑使用我最近几周一直在研究的数据湖技术与我多年来一直使用的传统 ETL SSIS 场景进行比较我认为数据湖与大数据密切相关但是使用数据湖技术与 SSIS 之间的界限在哪里使用 Data Lake 技术处理 25MB 100M

Azure azuredatalake usql

如何在 U-SQL 中实现循环

无需使用 C 即可在 U SQL 中实现循环 while for 如果没有任何人都可以共享 c 语法来在 u sql 中实现循环我正在提取从特定日期到某个日期的文件但现在我通过手动写入文件路径来提取该文件 DROP VIEW IF E

usql

调试 u-sql 作业

我想知道是否有任何提示和技巧来查找数据湖分析工作中的错误大多数时候错误消息似乎不是很详细当尝试从 CSV 文件中提取时我经常收到这样的错误顶点故障触发作业快速中止顶点失败 SV1 Extract 0 且 gt 错误顶点用户代码错

azuredatalake usql

Azure Data Lake Analytics：使用 U-SQL 合并重叠的持续时间

我想使用 U SQL 从放置在 Azure Data Lake Store 中的 CSV 数据中删除重叠的持续时间并合并这些行数据集包含每个记录的开始时间和结束时间以及几个其他属性这是一个例子 Start Time End Time

c Logic cortanaintelligence azuredatalake usql

将 Power BI 连接到 S3 存储桶

由于我是 Power BI 和 Redshift 的新手需要一些指导我的原始 JSON 数据以 gz 文件的形式存储在 Amazon S3 存储桶中每个 gz 文件有多行 JSON 数据我想将 Power BI 连接到 Amazon

amazonwebservices Azure amazons3 PowerBI usql

错误 MSB4057：使用 MSbuild for U-SQL 进行持续集成的项目中不存在目标“Build”

我正在使用 MSBuild for U SQL 将持续集成与 vsts 集成参考链接 https blogs msdn microsoft com azuredatalake 2017 10 24 continuous integrati

MSBuild azuredevops azuredatalake usql

如何仅使用 U-SQL 和文件中的某些字段将大文件分区为文件/目录？

我有一个非常大的 CSV 其中每一行都包含客户和商店 ID 以及交易信息当前的测试文件约为 40 GB 大约 2 天因此对于选择查询的任何合理返回时间来说分区是绝对必须的我的问题是当我们收到一个文件时它包含多个商店的数据我想使

azuredatalake usql

安装 Azure U-SQL 扩展以在本地运行 R/Python 脚本？

我们可以在 Azure Data Lake Analytics 中使用 R Python 代码扩展 U SQL 脚本但如何在本地进行呢在您的数据湖分析帐户中安装 U SQL 高级分析扩展1 1 启动 Azure 门户1 2 导航到您的数

azuredatalake usql

U-SQL 根据文件中的不同值将 CSV 文件拆分为多个文件

我在 Azure Data Lake Store 中有数据我正在使用 U SQL 使用 Azure 数据分析作业处理其中存在的数据我有几个包含空间数据的 CSV 文件类似于文件 20170301 csv longtitude lat

Azure output azuredatalake usql datapartitioning