SAS 中合并的工作（使用 IN=）

2023-12-02

我有两个dataset数据1和数据2

data data1; 
input sn id $;
datalines;
1 a
2 a
3 a
;
run;

data data2; 
input id $ sales x $;
datalines;
a 10 x
a 20 y 
a 30 z
a 40 q
;
run;

我从下面的代码合并它们：

data join;
merge data1(in=a) data2(in=b);
by id;
if a and b;
run;

结果：（我期待内部联接结果，但事实并非如此）

1   a   10  x
2   a   20  y
2   a   30  z
2   a   40  w

结果来自proc sql内部联接。

proc sql;
select data1.id,sn,sales,x from data2 inner join data1 on data1.hh_id;
quit;

结果：（正如内部联接所预期的那样）

a  1  10  x
a  1  20  y
a  1  30  z
a  1  40  w
a  2  10  x
a  2  20  y
a  2  30  z
a  2  40  w
b  3  10  x
b  3  20  y
b  3  30  z
b  3  40  w

我想知道concept and 一步步的工作mergeSAS 中的语句In=并证明上述结果。

PS：我读过this，它说

这些变量的一个明显用途是控制“合并”的类型使用 if 语句将会发生。例如，如果此记录来自您的数据和此记录来自其他数据；将使SAS 仅包含与两个输入数据中的 by 变量匹配的行集（如内连接）。

我想，（就像内部联接）并不总是如此。

基本上，这是由于 SAS 数据步骤和 SQL 处理各自的联接/合并的方式不同造成的。

SQL 为每个可能的键组合创建一个单独的记录。这是笛卡尔积（在关键级别）。

然而，SAS 数据步骤的合并过程却截然不同。MERGE其实无非是一个特例SET。它仍然迭代地处理行，一次处理一行 - 它永远不会返回，并且一次不会同时处理来自 PDV 中任何数据集的多于一行。因此，它无法在其正常过程中创建笛卡尔积 - 这将需要随机访问，而 SAS 数据步骤通常不会这样做。

它能做什么：

For each unique BY value
  Take the next record from the left side dataset, if one exists with that BY value
  Take the next record from the right side dataset, if one exists with that BY value
  Output a row
Continue until both datasets are exhausted for that BY value

对于在任一侧（或两侧）的每个值生成唯一记录的 BY 值，它实际上与 SQL 相同。但是，如果 BY 值在两侧都产生重复项，您将得到那里的结果：并排合并，如果一个在另一个之前用完，则来自较短数据集最后一行的值（对于该数据集）值）或多或少被复制下来。（它们实际上是保留的，因此如果您用更改覆盖它们，它们不会在较长数据集中的新记录上重置）。

So, if left有 3 条记录并且right键值有4条记录a，就像在您的示例中一样，然后您从以下记录中获取数据（假设您之后不更改数据）：

left  right
1     1
2     2
3     3
3     4

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

sql

sas

SAS 中合并的工作（使用 IN=）的相关文章

Pandas 在读取 SAS 文件时数据类型正确失败

我有一个SAS数据集 http www principlesofeconometrics com sas cars sas7bdat当我运行它时我在 SAS 上得到以下输出我还有以下 Python 代码它获取 sas7bdat 文件并
SQL Server 2008 R2 DMV - sys.dm_sql_referencing_entities - 查询用法

我正在尝试使用以下命令获取表列表的所有依赖项sys dm sql referencing entities DMV 这个查询给了我所有表的列表 SELECT TableName from FinalTableList 此查询给出 Table
ORACLE 在立即执行中批处理 DDL 语句

我正在尝试在一个 Execute Immediate 语句中运行多个 ddl 语句我认为这会很简单但看来我错了想法是这样的 declare v cnt number begin select count into v cnt from
如何防止用户生成的 Sql 查询上的 Sql 注入

我有一个项目私有的 ASP net 网站受 https 密码保护其中要求之一是用户能够输入直接查询数据库的 Sql 查询我需要能够允许这些查询同时防止它们对数据库本身造成损坏以及访问或更新它们不应该访问更新的数据我制定了以下
在旧版本的 MySQL (<5.5.0) 中模拟 TO_SECONDS()

出于性能和简单性的原因我想以秒的形式获取 MySQL 3 x 服务器中 DATETIME 列的内容或者实际上任何数字类型我只是想在使用 UNIX TIMESTAMP 时避免所有明显的时区问题 the我表中的日期确实来自不同的区域设置
如何在 SQL 中选择“上一条”和“下一条”记录？

I am building a blog post detail page on my site that will display display a previous and next link similar to how a typ
ADO.NET 池连接无法重用

我正在开发一个 ASP NET MVC 应用程序该应用程序使用 EF 6 x 来处理我的 Azure SDL 数据库最近随着负载的增加应用程序开始进入无法再与 SQL 服务器通信的状态我可以看到有 100 个到我的数据库的活动连接
删除或更改 ETL 中的记录

我有一个表我在上面构建了 ETL 服务货物记录到达离开进入表格我已经这样做了我的桌子将被删除当项目标识符第二次到达数据库时两条记录都被删除 label cost time x2 29 14 5 2020 01 00 00
SQL 中的代码重用和模块化

代码重用和模块化对于 SQL 存储过程编程来说是一个好主意吗如果是这样将这些功能添加到 SQL 存储过程代码库的最佳方法是什么我通常为常见且重复的任务创建标量值函数我发现它不仅可以简化与现有程序类似的新程序的开发而且还有助于错误跟
如何比较 Postgresql 中日期时间字段中的日期？

在比较 postgresql Windows 中的版本 9 2 4 中的日期时我遇到了一个奇怪的情况我的表中有一列说update date与类型timestamp without timezone 客户可以仅使用日期搜索此字段例如 2
如何使用 ALTER TABLE 添加新列并使其唯一？

我该如何使用ALTER TABLE添加新列并使其独一无二取决于 DBMS 但我认为以下内容相当可移植 ALTER TABLE table name ADD column name datatype ALTER TABLE table na
TSQL：无法对 COUNT(*) 执行聚合函数 AVG 来查找一天中最繁忙的时间

考虑一个保存日志数据的 SQL Server 表重要的部分是 CREATE TABLE dbo CustomerLog ID int IDENTITY 1 1 NOT NULL CustID int NOT NULL VisitDate
C# 查询两个数据库的数据

我目前有一个查询我正在从两个不同的数据库获取数据这些数据被附加到一个名为 accountbuys 的列表中我的第一个表有三个数据条目 3个想要购买股票的帐户下一张表有 17 个数据点购买 17 只股票 I am merging t
使用显式值进行 BigQuery 合并

据我所知 BigQuery 支持合并两个表目前 INSERT操作允许将显式值插入表中例如 INSERT dataset Inventory product quantity VALUES top load washer 10 front
常量值如何影响连接的 ON 子句？

我最近发现 LEFT JOIN 的 ON 子句可能包含 1 1 等值这让我感到不安因为它打破了我对连接功能的看法我遇到过以下情况的更详细版本 SELECT DISTINCT Person ID FROM Person LEFT JOI
从复选框列表中选择循环生成的复选框中的一个复选框

抱歉我的英语不好在我的 ASP NET 网站上我从 SQL 表导入软件列表看起来像这样但实际上要长得多 Microsoft Application Error Reporting br br Microsoft Applicatio
如何限制两个表之间一对多关系中的多个数量？

我有一个带有两个 MySql 表的 MySQL 数据库第一个是第一个表表 A 有一列具有唯一值从值从 1 到 n 在第二个表 2 表 B 中我有两列在第一个表中我有一个名称在第二个我的值从 1 到 n 如果我在中添加一个值
jDBI中如何进行内查询？

我怎样才能在 jDBI 中执行这样的事情 SqlQuery select id from foo where name in
SQL Server 标识列值从 0 而不是 1 开始

我遇到了一个奇怪的情况数据库中的某些表的 ID 从 0 开始即使 TABLE CREATE 的 IDENTITY 1 1 也是如此对于某些表来说是这样但对于其他表则不然它一直有效到今天我尝试过重置身份列 DBCC CHECKID
SQLite 中的累积求和值

我正在尝试在 SQLite 中执行值的累积和我最初只需要对一列求和并获得代码 SELECT t MyColumn SELECT Sum r KeyColumn1 FROM MyTable as r WHERE r Date lt t Da

随机推荐

为什么这个 LinQ 查询不喜欢字符？

我有一个 LINQ 查询它获取所需的所有数据并将其合并到数据传输对象中一切正常除了当我将 DTO 的成员之一这是一个 char 设置为 char 值时它会抛出查询异常 System ServiceModel FaultExcepti
如何捕获 monotouch/ios 中的所有崩溃异常？

我已将日志代码包装在 main cs 中以捕获异常但是由 monotouch 构建的应用程序通常在 iPad 中崩溃并且我找不到任何日志部分代码包含多线程操作和wcf服务如何捕获所有崩溃异常 public class Applica
如何在 Swift 中屏蔽最后一个数字？

如何使用 swift 屏蔽最后一个字符串我编写了如下代码但代码只显示最后一个数字我的期望是代码显示前 5 位数字这是我的代码 extension StringProtocol var masked String return Str
如何获取平台MBeanServer的JMXConnectorServer？

我有一个提供服务的 Java 程序可以通过 RMI 调用 JMX MBean 上的方法来调用这些服务该服务运行没有问题但我面临着如何关闭服务而不中断对该服务的潜在新并发请求的问题此问题的一种解决方案是等待所有 JMX 连接关闭然后
将带有 FQDN（TLD 后的点）的 URL 重定向为与 PQDN 等效的 URL

许多网站都可以通过FQDN 即在 TLD 后添加一个点 https www ebay com https www google com https www reddit com https stackoverflow com https e
使用字符串名称调用 JavaScript 函数

正确解释我的意思有点复杂所以请尝试理解我我希望能够在 javascript 中使用作为参数发送的文本来调用元素方法函数例如 function CallAFunction function name document getEleme
GetLastInputInfo() 始终为 0（零）

我想检测空闲时间例如用户按下按键或移动鼠标多久前据说 GetLastInputInfo 应该是我所需要的但是当我使用它时它总是打印 0 LASTINPUTINFO last input 0 GetLastInputInfo las
Solr - 具有许多子约束的块连接父查询

该问题适用于以下嵌套文档
计算 Eloquent 中两条记录之间的值差异

我想用雄辩的方式计算两条记录之间的差异例如我有下表 Id value type 1 100 FOO 2 500 FOO 3 800 FOO 4 200 BAR 5 600 BAR 6 1000 FOO
用 Swift 修改数组中的对象？

我有数组 var arrDicContact udContact valueForKey arrDicContact as NSDictionary 我想更改数组中的一个联系人 for let dicx NSDictionary in ar
SPRequestContext缓存SPSites导致的RPC_E_ATTEMPTED_MULTITHREAD错误的解决方案？

我正在为 SharePoint 2007 开发一个解决方案并且经常使用 SPSecurity RunWithElevatedPrivileges 并传入 SystemAccount 的 UserToken 看完之后http hristop
如何使用 WCF Ria 服务跟踪实体更改？

我需要将对客户端上发生的实体所做的更改记录到数据库表中但是当我进行更改并检查 ChangeTracker 属性时它声称没有发生任何更改服务 private static readonly ISomeDao someDao DataA
如何生成所需的 SQL 语句来更新、插入、删除 GridView 中的数据？

我在用着GridView随着SqlDataSource for 选择 updating and deleting and DetailsView for 插入问题是当我单击这些按钮之一时我收到此错误Delete订单和同样的错误Ins
如何根据第一个下拉列表的选择来过滤第二个下拉列表？ - 角

我有两个如下所示的下拉菜单所以我的计划是加载所有子类别但我想在下拉列表中仅显示与所选类别相关的子类别包含 ParentId 作为所选类别 ID 的子类别这是我的代码 div class form group div
如何使用 Web API 处理 JSON？ [复制]

这个问题在这里已经有答案了可能的重复 JSONP 与 MVC 4 WebApi 我的 WebAPI 有一个 get 方法如下所示 private T Get
LINQ 到 SQL 外部映射

我不知道如何为 LINQ to SQL 设置外部映射文件我读过 Ivan Latunov 的博客文章这引起了我对它的兴趣问题是我不明白事情应该如何发展主要问题是如果我只想修改 xml 映射文件操作方法是什么我是否首先创建 db
更新 EF4 实体上的单个属性，而无需隐藏字段

我正在使用 EF4 Db First 并且我有一个具有许多不可为空属性的实体在编辑表单 Razor MVC3 中我希望仅允许编辑其中一个属性而不允许编辑其他属性为了让它发挥作用我必须把 Html HiddenFor 我的每个其他属
使用 par 设置 png 绘图设备的绘图边距

我创建了巴西的分区统计图将绘图保存为 png 时绘图的上部和下部会丢失被覆盖这是保存情节的线条 plot new par omi c 0 0 0 0 mgp c 0 0 0 mar c 0 0 0 0 family D par mf
在滚动导航栏中显示动画

您好我正在尝试实现此导航栏效果 http kettlenyc com 这样当我向下滚动时导航栏就会跟随并动画到固定位置我已经开始在这里编写代码但无法让动画工作 http theturning co uk NOAH 我的 Jquery
SAS 中合并的工作（使用 IN=）

我有两个dataset数据1和数据2 data data1 input sn id datalines 1 a 2 a 3 a run data data2 input id sales x datalines a 10 x a 20 y

SAS 中合并的工作（使用 IN=）

SAS 中合并的工作（使用 IN=） 的相关文章

随机推荐

热门标签

SAS 中合并的工作（使用 IN=）的相关文章