我可以成功使用foverlaps
使用我的数据集的一小部分样本,但是当使用完整数据(超过 30k 行的 data.tables)时,它会崩溃并抛出以下错误:
错误信息:
Error in if (any(x[[xintervals[2L]]] - x[[xintervals[1L]]] < 0L)) stop("All entries in column ", :
missing value where TRUE/FALSE needed
我解释错误消息的方式是两个 data.table 之间没有重叠。
Q1-我能很好地理解这条信息吗?
Q2-知道为什么更大的数据集可能会发生这种情况吗?这可能是由于数据集的大小造成的吗?
我确实有很多独特的价值观,根据foverlaps
帮助文件,预计会成比例地减慢速度,但不会在它进入数百万行之前,而这里的情况远非如此。谢谢。
没有可重现的示例,因此无法调查您的问题。
正如 Carl 在评论中所述,这可能是由输入中存在的 NA 值引起的。
在最近的开发版本中进行了一些改进foverlaps
由阿伦.其中一项改进是在检测到 NA 值时提供更好的错误消息。
install.packages("data.table")
自 1.12.2 起,此功能已在 CRAN 上出现。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)