我想用以下方法进行线性回归lm
功能。我的因变量是一个称为AccountStatus
:
1:0 days in arrears, 2:30-60 days in arrears, 3:60-90 days in arrears and 4:90+ days in arrears. (4)
作为自变量,我有几个数值变量:Loan to value
, debt to income
and interest rate
.
是否可以用这些变量进行线性回归?我在互联网上查找了一些关于虚拟变量的信息,但这些都是针对自变量的。
这不起作用:
fit <- lm(factor(AccountStatus) ~ OriginalLoanToValue, data=mydata)
summary(fit)
线性回归不采用分类变量作为因变量,它必须是连续的。考虑到您的 AccountStatus 变量只有四个级别,因此将其视为连续是不可行的。在开始任何统计分析之前,人们应该了解测量水平一个人的变量。
您可以做的是使用多项式逻辑回归,请参阅here例如。或者,您可以将 AccountStatus 重新编码为二分法并使用简单的逻辑回归。
抱歉让您失望了,但这只是多元回归的固有限制,与 R 无关。如果您想更多地了解哪种统计技术适合因变量和自变量测量水平的不同组合,我可以竭诚为您提供建议这本书.
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)