没有循环匹配指定的签名和转换错误

2024-04-28

我是 python 和机器学习的初学者。当我尝试将数据放入 statsmodels.formula.api OLS.fit() 时，出现以下错误

回溯（最近一次调用最后一次）：

文件“”，第 47 行，位于 regressor_OLS = sm.OLS(y , X_opt).fit()

文件 “E：\ Anaconda \ lib \ site-packages \ statsmodels \回归\ Linear_model.py”，第 190 行，适合 self.pinv_wexog，奇异值 = pinv_extended(self.wexog)

文件“E:\Anaconda\lib\site-packages\statsmodels\tools\tools.py”，第 342 行，在 pinv_extended 中 u, s, vt = np.linalg.svd(X, 0)

文件“E:\Anaconda\lib\site-packages\numpy\linalg\linalg.py”，行第1404章 u, s, vt = gufunc(a, 签名=签名, extobj=extobj)

类型错误：没有与指定签名和转换匹配的循环找到 ufunc svd_n_s

code

#Importing Libraries
import numpy as np # linear algebra
import pandas as pd # data processing
import matplotlib.pyplot as plt #Visualization


#Importing the dataset
dataset = pd.read_csv('Video_Games_Sales_as_at_22_Dec_2016.csv')
#dataset.head(10) 

#Encoding categorical data using panda get_dummies function . Easier and straight forward than OneHotEncoder in sklearn
#dataset = pd.get_dummies(data = dataset , columns=['Platform' , 'Genre' , 'Rating' ] , drop_first = True ) #drop_first use to fix dummy varible trap 


dataset=dataset.replace('tbd',np.nan)

#Separating Independent & Dependant Varibles
#X = pd.concat([dataset.iloc[:,[11,13]], dataset.iloc[:,13: ]] , axis=1).values  #Getting important  variables
X = dataset.iloc[:,[10,12]].values
y = dataset.iloc[:,9].values #Dependant Varible (Global sales)


#Taking care of missing data
from sklearn.preprocessing import Imputer
imputer =  Imputer(missing_values = 'NaN' , strategy = 'mean' , axis = 0)
imputer = imputer.fit(X[:,0:2])
X[:,0:2] = imputer.transform(X[:,0:2])


#Splitting the dataset into the Training set and Test set
from sklearn.cross_validation import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X,y,test_size = 0.2 , random_state = 0)

#Fitting Mutiple Linear Regression to the Training Set
from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor.fit(X_train,y_train)

#Predicting the Test set Result
y_pred = regressor.predict(X_test)


#Building the optimal model using Backward Elimination (p=0.050)
import statsmodels.formula.api as sm
X = np.append(arr = np.ones((16719,1)).astype(float) , values = X , axis = 1)

X_opt = X[:, [0,1,2]]
regressor_OLS = sm.OLS(y , X_opt).fit()
regressor_OLS.summary()

Dataset

数据集链接 https://www.dropbox.com/s/w2hq4t0utbvk7bu/Video_Games_Sales_as_at_22_Dec_2016.csv?dl=0

在 stack-overflow 或 google 上找不到任何有助于解决此问题的内容。

尝试指定

dtype = '浮动'

创建矩阵时。例子：

a=np.matrix([[1,2],[3,4]], dtype='float')

希望这有效！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

machinelearning

scikitlearn

没有循环匹配指定的签名和转换错误的相关文章

在推送到容器注册表之前如何对构建的映像运行测试？

从 gitlab 文档中可以看出如何使用 kaniko 创建 docker 镜像 build stage build image name gcr io kaniko project executor debug entrypoint sc
检查子字符串是否在字符串列表中？

我之前已经找到了这个问题的一些答案但它们对于当前的Python版本来说似乎已经过时了或者至少它们对我不起作用我想检查字符串列表中是否包含子字符串我只需要布尔结果我找到了这个解决方案 word to check or wordlis
Python函数组成

我尝试使用良好的语法来实现函数组合这就是我所得到的 from functools import partial class compfunc partial def lshift self y f lambda args kwargs s
如何调试 numpy 掩码

这个问题与this one https stackoverflow com q 73672739 11004423 我有一个正在尝试矢量化的函数这是原来的函数 def aspect good angle float planet1 goo
烧瓶 - 404 未找到

我是烧瓶开发的新手这是我在烧瓶中的第一个程序但它向我显示了这个错误在服务器上找不到请求的 URL 如果您输入了网址请手动检查拼写并重试这是我的代码 from flask import Flask app Flask name ap
从字典中绘制直方图

我创建了一个dictionary计算 a 中出现的次数list每个键的内容我现在想绘制其内容的直方图这是我想要绘制的字典的内容 1 27 34 1 3 72 4 62 5 33 6 36 7 20 8 12 9 9 10 6 11 5
dask apply：AttributeError：“DataFrame”对象没有属性“name”

我有一个参数数据框并对每一行应用一个函数该函数本质上是几个 sql queries 和对结果的简单计算我正在尝试利用 Dask 的多处理同时保持结构和界面下面的例子有效并且确实有显着的提升 def get metrics row
Pandas如何按时间段过滤DataFrame

我有一个包含下表的文件 Name AvailableDate totalRemaining 0 X3321 2018 03 14 13 00 00 200 1 X3321 2018 03 14 14 00 00 200 2 X3321 20
如何将 Pyspark Dataframe 标题设置到另一行？

我有一个如下所示的数据框 col1 col2 col3 id name val 1 a01 X 2 a02 Y 我需要从中创建一个新的数据框使用 row 1 作为新的列标题并忽略或删除 col1 col2 等行新表应如下所示 id na
使用 numpy.argsort 的输出就地排序

我有两个数组 A 和 B 我想根据 A 对 A 和 B 进行排序所以我这样做 sort order numpy argsort A A A sort order B B sort order 问题是 A 和 B 都非常非常大因此上述情况
如何让 Streamlit 每 5 秒重新加载一次？

我必须每 5 秒重新加载 Streamlit 图表以便在 XLSX 报告中可视化新数据如何实现这一目标 import streamlit as st import pandas as pd import os mainDir os pa
导入目录下的所有模块

有没有办法导入当前目录中的所有模块并返回它们的列表例如对于包含以下内容的目录 mod py mod2 py mod3 py 它会给你
将 Python Selenium 输出写入 Excel

我编写了一个脚本来从在线网站上抓取产品信息目标是将这些信息写入 Excel 文件由于我的Python知识有限我只知道如何在Powershell中使用Out file导出但结果是每个产品的信息都打印在不同的行上我希望每种产品都有一条
更新 matplotlib 中颜色条的范围

我想更新一个contourf在函数内绘制效果很好然而数据的范围发生了变化因此我还必须更新颜色条这就是我未能做到的地方请参阅以下最小工作示例 import matplotlib pyplot as plt import numpy
更改用作函数全局作用域的字典

我想做一个 purePython 的装饰器其中一部分是能够有选择地禁止访问函数的全局范围有没有一种方法可以以编程方式更改哪个字典事物充当函数的全局外部作用域因此例如在下面我希望能够拦截对f in h并抛出错误但我想允许访问g因为
异步异常处理程序：在事件循环线程停止之前不会被调用

我正在我的异步事件循环上设置异常处理程序但是在事件循环线程停止之前它似乎不会被调用例如考虑以下代码 def exception handler loop context print Exception handler called
在 for 循环中访问 itertools 产品的元素

我有一个列表列表是附加 itertools 产品的一些其他结果的结果我想要的是能够使用 for 循环访问列表列表中列表的每个元素但我无法访问所有元素我只能访问最后一个列表的元素结果是一个非常巨大的列表列表例如 1 2 4 3 6
有没有办法拉伸整个显示图像以适应给定的分辨率？

我最近一直在使用pygame制作游戏遇到了一个小问题基本上我希望能够将屏幕上的整个图像我已经传输到它的所有内容拉伸到用户将窗口大小调整到的分辨率我在 pygame 和堆栈溢出的文档中搜索了很多但我似乎找不到答案这可能吗我的
Python RE（总之检查第一个字母是否区分大小写，其余部分不区分大小写）

在下面的情况下我想匹配字符串 Singapore 其中 S 应始终为大写其余单词可能为小写或大写但在下面的字符串 s 是小写的它在搜索条件中匹配任何人都可以让我知道如何实施吗 import re st Information in
当训练和测试的特征数量不同时，如何处理生产环境中的One-Hot Encoding？

在做某些实验时我们通常在 70 上进行训练在 33 上进行测试但是当您的模型投入生产时会发生什么可能会发生以下情况训练集 Ser Type Of Car 1 Hatchback 2 Sedan 3 Coupe 4 SUV 经过

随机推荐

Swift Alamofire + Promise 捕获

伙计们除了catch之外以下工作正常 xcode错误与expected member name following 这是使用 PromiseKit 进行承诺的正确方法吗欢迎所有建议谢谢 IBAction func loginButt
使用 ProcessBuilder 运行 msys.bat

我正在尝试使用 ProcessBuilder 在 java 中运行 msys bat 当我使用程序运行 bat 文件时出现以下错误找不到 rxvt exe 或 sh exe 二进制文件正在中止按任意键继续这是代码 ProcessB
当字符串和类都是引用类型时

这是我上次面试的情况问题字符串存储在哪里 Answer 堆因为它是引用类型问题解释一下下面的代码 static void Main string args string one test string two one one one
增加 C++ 程序 CPU 使用率

我有一个用 C 编写的程序每秒运行多个 for 循环而不使用任何会使其因任何原因等待的东西它始终使用 2 10 的 CPU 有没有什么方法可以强制它使用更多的CPU并进行更多的计算而不使程序变得更复杂此外我在 Windows 计算
在当前元素的 onchange 上发送 $(this)

我有这个html
我可以在 iTunes Connect 中恢复到之前版本的应用程序吗？

我在App Store中有应用程序我提交了1 1版本在Apple审核批准和发布后我注意到有一个明显的重大错误所以我不得不从App Store暂停我的应用程序我提交了新版本 1 2 您知道审核和发布需要 5 7 天在新版本发布期
如何使用 ggplot 绘制反向（互补）ecdf？

我目前使用 stat ecdf 来绘制累积频率图这是我使用的代码 cumu plot lt ggplot house total year aes download speed colour ISP stat ecdf size 1 但是
获取 HTML 元素相对于窗口的边界框的正确方法是什么？

我正在编写一个 Firefox 扩展我试图将其限制为仅 XUL Javascript 无 XPCOM 当我得到一个mouseover对于 HTML 元素的事件我需要获取其在 Windows 坐标系中的边界框即内置 XUL 文档 bro
你能在 MS Windows 上用 Python 将 stdin 作为文件打开吗？

在 Linux 上我使用 subbprocess Popen 来运行应用程序该应用程序的命令行需要输入文件的路径我了解到我可以将路径 dev stdin 传递到命令行然后使用 Python 的 subproc stdin write
Google Spreadsheet Api 结构化查询语法的官方参考

我正在寻找用于创建的查询语法的官方参考结构化查询用于请求 Google Spreadsheet API 中的行如所讨论的here https developers google com google apps spreadsheets s
R 识别数据框列中的文本字符串

我的数据框的一列包含单词和短语我正在尝试为此列中具有特定文本字符串的字段创建一个虚拟变量例如 kite cars 箱形风筝模型车我喜欢飞翔的风筝世界汽车 myvector lt c kite cars box kites mode
张量流：简单 LSTM 网络的共享变量错误

我正在尝试构建一个最简单的 LSTM 网络只是想让它预测序列中的下一个值np input data import tensorflow as tf from tensorflow python ops import rnn cell im
使 div 为浏览器窗口的 100% 高度

我的网站有两列现在背景颜色以左列的最后一段内容结束用于导航我试过高度 100 最小高度 100 等等似乎不起作用这是CSS container width 100 height 100 min width 960px backgro
批处理脚本一次运行多个 Jar 文件

我有两个批处理文件我想立即运行它们所以我写了这个 echo off java jar happyjar jar java jar sadjar jar pause 当我运行脚本时它首先运行 happyjar 然后运行 Sadjar 是
调整容器 div 内部 div 的 margin-top 会将内部 div 和容器 div 从 body 向下推

我觉得这一定是我做了一些愚蠢的事情的问题但我无法弄清楚这是显示我的问题的演示页面 http boxofbaskets com html demo html页面来源
war文件可以部署在任何服务器上吗？

如果这个问题很愚蠢请原谅我假设我使用 Spring 框架和 MS SQL Server 数据库以及 WebSphere 应用程序服务器开发一个 J2EE Web 应用程序我后来为此应用程序创建了一个 WAR 文件我可以在不更改代码的
Firefox createMediaStreamDestination 使用 rtc 的错误？

我通过 rtc 流式传输音频并想要静音和取消静音音频这有效但没有增益控制 function stream getUserMedia stream console log Access granted to audio video pee
如何获取 VESA BIOS 信息

我正在跟踪Phil Opp 教程 https os phil opp com 关于用 Rust 编写一个操作系统在稍微尝试了一下之后我想在屏幕上显示真实的图形我发现我应该从使用带有 VESA 的线性帧缓冲区开始我在 osdev or
端口不是所有 Docker 网络都通用的吗？

我创建了两个docker网络中国网络 docker network create subnet 172 19 0 0 16 chnetwork 内部网络 docker network create internal subnet 10 1
没有循环匹配指定的签名和转换错误

我是 python 和机器学习的初学者当我尝试将数据放入 statsmodels formula api OLS fit 时出现以下错误回溯最近一次调用最后一次文件第 47 行位于 regressor OLS sm OLS y

没有循环匹配指定的签名和转换错误

没有循环匹配指定的签名和转换错误 的相关文章

随机推荐

热门标签

没有循环匹配指定的签名和转换错误的相关文章