这个问题也许之前已经得到了回答,但我没有看到答案。
我有一个由数字和缺失值组成的数据集。一行是一个百分比。下面是一小组假数据,其中 AA、BB 和 CC 是列名称。该数据集中的第三行是百分比。
AA BB CC
234 432 78
1980 3452 2323
91.1 90 93.3
34 123 45
在这种情况下,当我读取数据集 AA 和 CC 是数字,BB 是整数。我猜某个地方 90.0 被舍入为 90。如果我不指定 BB 是数字,这会导致基本算术出现问题吗?
我相信如果 dd = 1 和 ee = 2 并且都是整数,那么 C 语言表示 dd / ee = 0,而 R 表示 dd / ee = 0.5。
下面是一系列简单的数学运算,所有这些似乎都表明无论数据是数字还是整数,R 中的答案都不会改变。尽管如此,我仍然认为在读取数据时指定所有变量都是数字是明智的。使用谷歌,我发现了一两个例子,其中数据类型似乎确实有所不同,但不是下面的例子。
aa <- c(1,2,3,4,5,6,7)
bb <- 2
str(aa)
str(bb)
cc <- as.integer(aa)
dd <- as.integer(bb)
str(cc)
str(dd)
aa/bb
cc/dd
aa/dd
cc/bb
ee <- aa * aa
str(ee)
sum(ee/2)
ff <- cc * cc
str(ff)
sum(ff/2)
gg <- 4.14
hh <- ((aa * aa) * gg) / 2
hh
ii <- ((cc * cc) * gg) / 2
ii
jj <- (aa * aa) / gg
jj
kk <- (cc * cc) / gg
kk
jj == kk
mm <- as.integer(1)
nn <- as.integer(2)
mm/nn
我想我希望得到保证,这不太可能是简单数学的问题,但我怀疑它可以。我一直认为这里有一个编程的基本规则,但我不确定那是什么。 (我知道双精度的概念。)
感谢您对这肯定是一个基本问题的任何建议。