在 R 中将大向量分割成区间[重复]

2023-12-14

我对 R 不太擅长。我运行了这个循环，得到了一个包含 11,303,044 行的巨大结果向量。我有另一个由维度为 1681 行的循环产生的向量。

我希望运行一个chisq.test来比较它们的分布。但由于它们的长度不同，所以它不起作用。

我尝试从 11,303,044 大小的向量中获取 1681 大小的样本来匹配第二个向量的大小长度，但我得到了不同的结果chisq.test每次我运行它的结果。

我正在考虑将两个向量分成相等数量的间隔。

比方说

vector1:

temp.mat<-matrix((rnorm(11303044))^2, ncol=1) 
head(temp.mat)
dim(temp.mat)

vector2:

temp.mat<-matrix((rnorm(1681))^2, ncol=1) 
head(temp.mat)
dim(temp.mat)

如何将它们以相等的间隔分割以产生相同长度的向量？

mat1<-matrix((rnorm(1130300))^2, ncol=1) # only one-tenth the size of your vector
smat=sample(mat1, 100000)                #and take only one-tenth of that
mat2<-matrix((rnorm(1681))^2, ncol=1)
qqplot(smat,mat2)                       #and repeat the sampling a few times

从统计的角度来看，您所看到的似乎很有趣。在“偏离平均值”较高的水平下，大样本总是偏离“良好拟合”，这并不奇怪，因为它具有更多数量的真正极值。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

在 R 中将大向量分割成区间[重复] 的相关文章

如何在knitr和RStudio中为word和html设置不同的全局选项？

我正在使用 RStudio 0 98 932 和 knitr 1 6 想要为word和html设置不同的全局knitr选项例如想要将word的fig width和fig height设置为6 html的fig width和fig hei
获取函数的命名空间

我正在开发一个包我希望在其中向对象添加编辑历史记录该包允许其他包注册用于编辑对象的函数我正在寻找一种方法来记录注册用于编辑的函数的包的版本问题是给定一个函数如何从导出的位置获取包我的想法是调查它的搜索路径但是search 仅
无法更新/编辑从 R 中的包（`gratia`）导出的 ggplot2 对象

我希望我在这里遗漏了一些令人痛苦的明显的东西我希望更新例如修复标题实验室等由生成的 ggplot 对象gratia draw 不太确定为什么我无法更新该对象有一个简单的解决方案吗 devtools install github
randomForest 包在删除一个预测类时的奇怪行为

我正在运行一个随机森林模型它产生的结果从统计角度来看对我来说完全没有意义因此我确信有些东西mustrandomForest 包的代码出现错误至少在模型的本次迭代中预测左侧变量是具有 3 种可能结果的政党 ID 民主党独立党共和
R中的重叠矩阵

我有以下数据框 id channel 1 a 1 b 1 c 2 a 2 c 3 a 我想创建并重叠矩阵它基本上是一个方阵行和列标签为 a b c 表中的每个条目显示每个通道共有多少个 id 例如在上面的例子中矩阵看起来像 a b
R - 计算 bin 中特定值的数量

我有一个如下所示的数据框 df Value lt c 1 1 0 2 1 3 4 0 0 1 2 0 3 0 4 5 2 3 0 6 Sl lt c 1 20 df lt data frame Sl Value gt df Sl Value
实现 XGboost 自定义目标函数

我正在尝试使用 XGboost 实现自定义目标函数在 R 中但我也使用 python 所以有关 python 的任何反馈也很好我创建了一个返回梯度和粗麻布的函数它工作正常但是当我尝试运行 xgb train 时它不起作用然后我
如何按时间间隔匹配数据帧？

这是我从数据记录器导入原始数据时经常出现的问题温度记录仪设置为每十分钟记录一次温度单独的气体记录仪设置为记录最后十分钟间隔内使用的气体我想将这两个记录器的数据合并到一个数据框中进行绘图和分析但时间并不完全一致我希望每十分钟的时间段
如何按用户定义（例如非字母顺序）对数据框进行排序[重复]

这个问题在这里已经有答案了给定一个数据框dna gt dna chrom start chr2 39482 chr1 203918 chr1 198282 chrX 7839028 chr17 3874 以下代码重新排序dna by ch
为什么 sapply 的缩放速度比样本大小的 for 循环慢？

假设我想采用向量 X 2 1 N 并将 e 计算为每个元素的指数是的我认识到最好的方法就是通过向量化 exp X 但这样做的目的是将 for 循环与 sapply 进行比较我通过逐步尝试三种方法一种使用 for 循环两种以不同方
`as.matrix` 和 `as.data.frame` S3 方法与 S4 方法

我注意到定义as matrix or as data frame作为 S4 类的 S3 方法使例如lm formula objS4 and prcomp object 开箱即用如果它们被定义为 S4 方法则这不起作用为什么将方法定义
行对名称中具有特定模式的列求和

我有一个像这样的数据表 DT lt ata table data table ref rep 3L 4L nb 12 15 i1 c 3 1e 05 0 044495 0 82244 0 322291 i2 c 0 000183 0 155
在 RcppArmadillo 中将列向量乘以数值标量

我在编译这个简单的程序时遇到一些麻烦c 代码使用Rcpp和RcppArmadillo包裹采用以下简单示例将矩阵的每一列乘以数值标量 code lt arma mat out Rcpp as
在 R 的 for 循环中创建动态命名对象并分配动态值

我正在尝试创建一套动态命名的新对象例如 temp2015 使用 for 循环并存储动态值具体来说其他对象的名称例如 Y2015 和 for 循环中使用的值例如 2015 在动态命名的新对象中我不确定为什么下面的代码不起作用 Y
R，使用具有两种以上可能性的二项式分布

我知道这可能是基本的但我似乎有一个心理障碍假设您想要计算在一个骰子上掷出 4 5 或 6 的概率在 R 中这很简单 sum 1 6 1 6 1 6 这给出了 1 2 这是正确答案然而我内心深处可能应该保留的地方认为我应该能够
在 R 中提取 data.frames 列表的名称以及 data.frame 中的值

在下面的代码中 j是 data frames 的命名列表我想知道是否有办法 a 提取变量的数值即one short and one long 在 data frames 内并附加它们的相关名称即 AAA or BBB or CCC 到
使用选定因子水平的值向 ggplot-barchart 添加水平线

在这个情节中 df lt data frame factor as factor c rep A 3 rep B 3 Treatment c rep c A B C 2 values runif 6 0 1 ggplot df aes Tr
dplyr：连接中的 NSE (by)

我很难弄清楚如何使用 dplyr left join 和 NSE 连接两个表问题是我无法为 by 提供正确的值我想我现在已经找到了解决方案但感觉我正在以一种额外复杂的方式来做因此如果您知道更简单更优雅的解决方案请告诉我这就是
如何根据 ggplot2 中的汇总数据创建堆积条形图

我正在尝试使用 ggplot 2 创建堆积条形图我的宽格式数据如下所示每个单元格中的数字是响应的频率 activity yes no dontknow Social events 27 3 3 Academic skills works
需要在R中跳过不同数量的行

我正在使用以下代码来处理我的数据但最近我意识到使用skip 27 在数据开始之前跳过存储在我的文件中的信息不是一个好的选择因为每个文件中要跳过的行数不同我的目标是读取存储在多个文件夹中的各种txt文件并非所有文件都有相同的列数列的

随机推荐

为什么我们不能在 setTimeout 上调用并应用？

为什么我们不能调用并应用 setTimeout var obj window setTimeout call obj callback delay it throws error stating illegal invocation 使用起
致命：此操作必须在工作树中运行[重复]

这个问题在这里已经有答案了当我尝试更改分支时出现此错误也许我会在以下位置提供一些命令信息 path to git repo 根据命令 git branch 我得到以下输出 V1 5 V2 0 master 当我尝试命令时 git che
PHP自动下载文件而不提示保存或打开文件

我有一个函数用于从非公共目录下载文件下载部分工作正常只是它之前没有提示用户并允许用户选择位置或只是简单的打开我使用以下代码 file L APP BILAGOR GET f finfo new finfo FILEINFO MIME
如何从命令行覆盖 `project.build.finalName` Maven 属性？

我有以下由 Maven 3 0 4 运行的普通 pom
当使用 JSch 通过 Java 执行时，即使启用了 setPty，某些 Unix 命令也会失败并显示“...未找到”

我正在创建一个 Android 应用程序它将命令发送到设备上的 Linux 终端使用 ls 命令时我能够获得正确的输出但是当我使用 ifconfig 或 iwconfig 时设备不会给我任何输出使用 Tera Term 我已经验证这
LINQ：动态选择

考虑我们有这个类 public class Data public string Field1 get set public string Field2 get set public string Field3 get set public
XML 序列化错误 - 类型“ItemsChoiceType[]”的选择标识符“ItemsElementName”值无效或缺失

我正在尝试序列化要传递给 Web 服务的对象并收到上述错误我可以在调试时看到该值存在于对象本身中但它似乎没有发现这一点 string tradeAreas new string Area1 Area2 Area3 Area4 Retri
Bash -eq 和 ==，有什么区别？

为什么这有效 Output tail lines 1 fileDiProva INFO Output OK if Output OK then echo OK else echo No Match fi 这不是吗 Output tail l
克服不同端口的最大持续连接数？

继从浏览器中的最大并行 http 连接数浏览器每个主机只能有几个连接我知道可以使用子域来解决这个问题但是我可以通过对同一主机使用不同的端口来解决这个问题吗那么以下内容是否允许浏览器将其连接增加三倍假设每个端口上都有某些东西正在侦听
哪些大小是普通加载并存储到 CUDA 原子中的全局内存？

如果满足以下条件则 CUDA 中对全局内存的一般读取和写入是原子的它是一个4字节指令我认为是的它是8字节还是16字节指令我认为是的至少在开普勒和费米通用 4 字节读取和写入全局存储器原子上 Warp 级别或 8 16 字节指令原
如何从以 latin1 编码的结果集中以 UTF-8 编码字符串

我正在编写一个应用程序使用 UTF 8 需要读写外部应用程序的第二个数据库使用 ISO 8859 1 try data in latin1 String s rs getString sAddrNameF System out pri
如何从指定号码（不带名称）中仅提取号码？

我正在寻找的只是价值B1 newx 线性模型系数不是名字我只想要 0 5 的值我不想要 newx 这个名字 newx lt c 0 5 1 5 2 5 newy lt c 2 3 4 out lt lm newy newx out好像
在 emgucv 上寻找运动检测功能

我是 emgu 简历的新手我正在尝试找到一个进行运动检测的代码我试过这个 CvInvoke cvAbsDiff frame backgroundImage BgDifference 但我有照明问题我想把有运动的像素变成白色然后在只有
找不到类：com.google.common.collect.Lists

I am attaching a screen shot of the problem that I am facing with Renjin Engine Please see the image below I m not able
我需要多少个进程来监视两个信号？

我是一名 vhdl 初学者需要帮助解决我的问题我有两个需要监控的信号一个是 CHECK 另一个是 OK 每次我要求检查时我都应该得到好的结果高或低我需要连续监测6个连续的CHECK脉冲并计数OK 如果我有 6 OK 低那么我
Flutter Firebase Auth / Google_sign_in 无法登录，状态代码=CANCELED

这是我的 pubspec yaml 我正在使用颤振 dependencies flutter sdk flutter cupertino icons 0 1 2 shared preferences 0 4 2 json serializa
使用 PHP 从 pdf 中提取内容

您能告诉我如何使用 PHP 从 PDF 文档中提取内容吗格式化是我在这里面临的主要问题因此如果有一些方法可以提取相同格式的内容并将其显示在在线文本编辑器上请告诉我 Thanks 看一下XPDF 我想你可以做 text shell e
防止WebSQL数据库中的SQL注入？（如何处理数据中的引号？）

我目前正在将 mysql 数据库的 xml 导出导入到 websql 数据库中以用于在线移动体验一切工作正常直到我插入的任何字符串中出现双引号通常在 PHP 中我会在插入时使用类似 mysql real escape string
通过网络发送数据并以倍频程绘图

我正在研究一个机器人我的目标是绘制机器人的状态目前我的工作流程是这样的启动程序重定向文件中的输出 robot bash rosrun explo explo node gt states txt 将文件发送到我的本地计算机 rob
在 R 中将大向量分割成区间[重复]

这个问题在这里已经有答案了我对 R 不太擅长我运行了这个循环得到了一个包含 11 303 044 行的巨大结果向量我有另一个由维度为 1681 行的循环产生的向量我希望运行一个chisq test来比较它们的分布但由于它们的长度

在 R 中将大向量分割成区间[重复]

在 R 中将大向量分割成区间[重复] 的相关文章

随机推荐

热门标签