如何在 Stata 中聚合关系数据?

2024-03-31

我无法解决以下 Stata 编程问题:

我有一个表格,列出了客户购买的所有汽车并进行:

Customer | Make | Price
-----------------------
      c1 |   m1 |     1
      c1 |   m1 |     2
      c1 |   m3 |     1
      c2 |   m2 |     2
      c3 |    . |     .

我想将其转换为每个客户一个观察/行的表格,列出每个品牌支付的最高价格:

Customer | m1 | m2 | m3
-----------------------
      c1 |  2 |  0 |  1
      c2 |  0 |  1 |  0
      c3 |  0 |  0 |  0

我该如何实现这一目标?我知道reshape wide,但这不起作用,因为加倍了c1 | m1排。此外,缺失值c3正在造成麻烦。


根据您想要做什么,我建议采取稍微不同的方法。例如,使用 -bysort- 您可以按客户查找每个品牌的最高价格。

bysort Customer Make : egen maxPrice = max( Price )

或者,您可以使用折叠来查找客户的最高价格并进行:

collapse (max) Price, by( Customer Make )

但是,如果您确实想要使用 -reshape- 发布的表格,您可以运行以下命令:

collapse (max) Price, by( Customer Make )
drop if Price == .
reshape wide Price, i( Customer ) j( Make ) string
renpfix Price 

请注意,如果在 Price 列中遇到缺失数据,则 reshape 将会失败。我在上面的代码中删除了这些观察结果,但您可以选择执行不同的操作,例如用零替换丢失的数据,如您在发布的目标表中所示。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 Stata 中聚合关系数据? 的相关文章

  • Linq to Objects - 从数字列表中返回数字对

    var nums new 1 2 3 4 5 6 7 var pairs some linq magic here gt 对 1 2 3 4 5 6 7 0 的要素pairs应该是二元素列表 或者是带有两个字段的匿名类的实例 比如new F
  • 使用聚合将多个函数应用于数据框中的每一列

    当我需要将多个函数按顺序应用于多个列并按多个列聚合并希望将结果绑定到我通常使用的数据框中时aggregate 通过以下方式 bogus functions foo1 lt function x mean x var x foo2 lt fu
  • 使用 Python、NumPy、SciPy 进行矩阵乘法的高效矩阵切片

    我想重塑 2dscipy sparse csr csr matrix 我们称其为A 到 2dnumpy ndarray 让我们称之为B A可能 gt shape A 90 10 then B应该 gt shape B 9 10 其中每 10
  • Django 中的aggregate() 与 annotate()

    姜戈的QuerySet有两种方法 annotate and aggregate 文档说 与aggregate 不同 annotate 不是终止子句 annotate 子句的输出是一个查询集 https docs djangoproject
  • Asp.net Web API 2.2 OData4 是否支持 group by 子句?

    Asp net Web API 2 2 OData v4 是否支持聚合和 group by 子句 我找不到任何决定性的答案 另一种方法是使用以下方式实现您的服务QueryByCube提供的linq扩展方法自适应LINQ http www a
  • Mysql中如何对json_arrayagg()返回的数组进行排序?

    我想对 json arrayagg 返回的数组进行排序 我的查询与此类似 select A json arrayagg json obj X value1 Y value2 AS RESULT FROM derived table GROU
  • R 中“data.frame 的标准公式接口”是什么意思?

    的文档aggregate states aggregate formula 是 aggregate data frame 的标准公式接口 我是R新手 不明白这是什么意思 请解释 Thanks Uri 跳转到示例部分的中间help aggre
  • MongoDB $lookup 值返回数组

    我有一个包含多个项目的文档 需要从另一个集合中查找更多信息来填写数据 主要文件 id ObjectID 5a30ff41af58f911946b122e SalesItems SalesItemID 1139 Quantity 2 Amou
  • 如何在 Stata 中查找并替换字符串变量的一部分?

    我正在使用一个基本上是 URL 的变量 所以观察结果包括像这样的值 www google com https www google com https yahoo movies com 我正在尝试创建一个 do 文件以将一堆这些文件导入到
  • 包含聚合的更新语句在 SQL Server 中不起作用

    我希望有人可以在这里帮助我的语法 我有两张桌子ansicache encounters and ansicache x refclaim Table The encounters表有一个encounter匹配的列patacctnumber栏
  • 在 Django ORM 中过滤聚合

    我有一个如下所示的函数 def post count self return self thread set aggregate num posts Count post num posts 我只想计算状态标记为 活动 的帖子 有没有一种简
  • 如何将数据帧行分组到pandas groupby列表中

    给定一个数据框 我想对第一列进行分组 并将第二列作为行中的列表获取 这样数据框如下 a b A 1 A 2 B 5 B 5 B 4 C 6 becomes A 1 2 B 5 5 4 C 6 我该怎么做呢 您可以使用以下方法执行此操作gro
  • 聚合返回空数组 - 猫鼬

    我有以下两个简单的查询 Comment aggregate match id req params id exec function err result result is empty Comment find id req params
  • 选择未聚合的变量,功能上依赖于 GROUPing 变量

    背景 我正在一个非常受限的 T SQL 环境中工作 其中只能定义一个对象的 主体 VIEW 大概是 in CREATE VIEW My View AS 在引擎盖下 这是我的 VERSION https learn microsoft com
  • 将外语从csv文件导入到Stata

    我正在使用Stata 12 我遇到了以下问题 我正在使用以下命令将一堆 csv 文件导入到 Statainsheet命令 数据集可能包括俄语 克罗地亚语 土耳其语等 我认为它们是用 UTF 8 编码的 在 csv 文件中 它们是正确的 我把
  • 在没有游标的情况下合并单个 SQL 表中的数据

    我有一个包含 ID 列的表和另一个包含数字的列 一个ID可以有多个号码 例如 ID Number 1 25 1 26 1 30 1 24 2 4 2 8 2 5 现在根据这些数据 在一个新表中 我想要这个 ID Low High 1 24
  • 如何让Stata在表格中报告零

    我正在尝试使用tabulateStata 中的命令创建频率时间序列 当我尝试合并输出时 问题就出现了tabulate运行完每个日期后 tabulate当相关变量的值不存在观察值时 不会将 0 作为条目包含在内 例如 如果我想在三年内统计一个
  • 多个函数聚合的结果不可用于进一步计算。为什么?

    我对 R 中聚合函数的结果有疑问 我的目标是从数据集中选择某些鸟类并计算密度 调查区域内观察到的个体的数量 为此 我获取了主数据文件的子集 然后在区域上进行聚合 计算 平均值和个体数量 由向量长度表示 然后我想用计算出的平均面积和个体数量来
  • Spark:Aggregator和UDAF有什么区别?

    在Spark的文档中 Aggregator 抽象类聚合器 IN BUF OUT 扩展可序列化 用户定义聚合的基类 可以是 在数据集操作中用于获取组中的所有元素并 将它们减少到单个值 用户定义的聚合函数是 抽象类 UserDefinedAgg
  • DDD:持久聚合

    让我们考虑一下典型的Order and 订单项目例子 假如说订单项目是的一部分Order聚合 只能通过订单添加 所以 要添加一个新的订单项目 to an Order 我们必须通过存储库加载整个聚合 将新项目添加到Order对象并再次保留整个

随机推荐

  • 在 Windows 上编译 Erlang 代码

    我安装了 Erlang 13B 并尝试按照教程进行操作 每次我到达c tut 我得到一个错误而不是 ok tut 所以看起来没有安装任何模块 有人能指出我正确的方向吗 我尝试过 Emacs 但我真的不知道如何使用它 甚至还没有接近让 Erl
  • OpenGL ES 2.0 中的 glTexGen

    我已经尝试了几个小时来用 GL OBJECT LINEAR 实现 glTexGen 的 GLSL 替换 对于 OpenGL ES 2 0 在 Ogl GLSL 中 有 gl TextureMatrix 使这变得更容易 但这在 OpenGL
  • 将对象直接流式传输到 std::string

    给定某种可流式传输的类型 struct X int i friend std ostream operator lt lt std ostream os X const x return os lt lt X lt lt x i lt lt
  • 在 Python 中嵌套函数会产生开销吗?

    在Python中 如果我在父函数中有一个子函数 那么每次调用父函数时子函数是否都会 初始化 创建 将一个函数嵌套在另一个函数中是否会产生任何性能开销 代码对象是预编译的 因此该部分没有开销 函数对象在每次调用时构建 它将函数名称绑定到代码对
  • 在 WPF 中仅画刷椭圆的部分

    我无法找到绘制以下形状的最佳方法 我正在使用下面的代码来绘制Ellipse在视觉层上 但我怎么可能只刷宿舍呢 我认为可以使用LinearGradientBrush or RadialGradientBrush但我不知道如何使用它 var c
  • ActiveMQ NMS:当代理关闭时,connection.start() 会因故障转移协议而挂起

    我有使用 nms activemq 1 5 0 的 C 应用程序 当我的应用程序启动时 它尝试使用故障转移协议连接到代理 我有两个主从配置的代理 如果两个经纪人都关闭了 我的应用程序就会因为以下原因而陷入等待状态 connection st
  • 流行的源代码控制系统如何区分二进制文件和文本文件

    寻找有关不同源代码控制系统如何区分 或检测 文件类型 二进制与文本 的文章 文档或直观知识 特别令人感兴趣的是 Git 与 Mercurial 相比是如何做到这一点的 他们是否看 文件扩展名 文件签名或内容 即该文件是否为 UTF8 各种东
  • 这个C++宏的含义是什么?

    我不明白这个宏的含义 define DECLARE HANDLE n typedef struct n int i n DECLARE HANDLE HWND 我从中学到了C程序 表示连接参数 所以宏等于 typedef struct HW
  • Silverlight 和 C++ 或 C++ 到 C# 正在进行代码转换吗?

    我正在开发一款基于绘图的产品 我希望按照优先级顺序为 iPhone 桌面 OS X Windows 平板电脑 基于 Silveright 的浏览器 Windows Mobile 和 Windows 生成版本 对于 GUI 可移植性 经典的答
  • AVG 将我的程序检测为病毒。这是怎么回事? [关闭]

    很难说出这里问的是什么 这个问题是含糊的 模糊的 不完整的 过于宽泛的或修辞性的 无法以目前的形式得到合理的回答 如需帮助澄清此问题以便重新打开 访问帮助中心 help reopen questions AVG表示 从下面的代码编译出来的可
  • 使用保留的包名称访问包私有变量

    我正在研究源代码java util HashMap http www java2s com Open Source Java Document 6 0 JDK Core Collections Jar Zip Logging regex j
  • 查看 iOS 中的内存使用情况

    有什么办法可以知道iOS有多少可用内存吗 我知道当可用内存变低时 系统会发出低内存警告 然而 我的应用程序有一些点 单个线程将执行复杂的任务 有时该任务会占用足够的内存 以至于它被操作系统终止 我的应用程序可以从互联网下载图片 我将它们缩小
  • 获取 C 中编译时表达式的值

    有没有办法让 C 编译器 在我的例子中是 XC16 它基于 gcc 转储编译时表达式的结果 我们有很多 define 比如 define FOO 37 6 define FOO BASE 0 035 define FOO FIXEDPOIN
  • 在 UWP 中使用滑动手势

    我已经看到 自最新更新 Windows Fall Creators Update 以来 存在一系列 Swipe 类 但在当前稳定版本的 VS 15 4 1 中 没有办法让它工作 我目前正在使用 Visual Studio 2017 Ente
  • 寻找共同块

    我有两个文件 f1 和 f2 其中包含一些文本 或二进制数据 如何快速找到共同的区块 e g f1 ABC 防御f2 XXABC XEF output 常见块 长度 4 f1 0 和 f2 2 中的 ABC 长度 2 f1 5 和 f2 8
  • 将数组转换为函数参数列表[重复]

    这个问题在这里已经有答案了 是否可以将 JavaScript 中的数组转换为函数参数序列 例子 run render 10 20 200 200 function run calls var app app is retrieved fro
  • 如何获取 DB2 MQT 上次刷新时间

    对于 z OS 上的 DB2 物化查询表 如何检索上次刷新时间 文档指出 http www 01 ibm com support knowledgecenter SSEPEK 10 0 0 com ibm db2z10 doc perf s
  • Windows 8.1 上的 Pyusb - 没有可用的后端 - 如何安装 libusb?

    使用 pyinstaller 3 1 python 2 7 9 和 tkinter 尝试使用 pyusb 而不是 pyserial 但没有可用的后端 调查Windows 上的 Pyusb 没有可用的后端 https stackoverflo
  • 给子例程别名时出现“...仅使用一次:可能的拼写错误”警告

    我有一些模块 想为一些子模块创建别名 这是代码 usr bin perl package MySub use strict use warnings sub new my class shift my params shift my sel
  • 如何在 Stata 中聚合关系数据?

    我无法解决以下 Stata 编程问题 我有一个表格 列出了客户购买的所有汽车并进行 Customer Make Price c1 m1 1 c1 m1 2 c1 m3 1 c2 m2 2 c3 我想将其转换为每个客户一个观察 行的表格 列出