scikit-learn 中出现“ValueError：无法将字符串转换为浮点数”错误

2024-01-11

我正在运行以下脚本：

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
dataset = pd.read_csv('data/50_Startups.csv')
X = dataset.iloc[:, :-1].values
y = dataset.iloc[:, 4].values
onehotencoder = OneHotEncoder(categorical_features=3, 
handle_unknown='ignore')
onehotencoder.fit(X)

数据头看起来像：data https://i.stack.imgur.com/mEkVF.png

我有这个：

ValueError：无法将字符串转换为浮点数：'New York'

我阅读了以下问题的答案similar https://stackoverflow.com/questions/8420143/valueerror-could-not-convert-string-to-float-id提问然后打开 scikit-learn文档 https://scikit-learn.org/stable/modules/preprocessing.html#encoding-categorical-features，但是你如何才能看到 scikit-learn 作者没有字符串中的空格问题

我知道我可以使用LabelEncocder from sklearn.preprocessing然后使用 OHE 效果很好，但在这种情况下

In case you used a LabelEncoder before this OneHotEncoder to convert the categories to integers, then you can now use the OneHotEncoder directly.
warnings.warn(msg, FutureWarning)

发生按摩。

您可以使用完整的 csv 文件 https://pastebin.com/RtwkfsHJ or

[[165349.2, 136897.8, 471784.1, 'New York', 192261.83],
[162597.7, 151377.59, 443898.53, 'California', 191792.06],
[153441.51, 101145.55, 407934.54, 'Florida', 191050.39],
[144372.41, 118671.85, 383199.62, 'New York', 182901.99],
[142107.34, 91391.77, 366168.42, 'Florida', 166187.94]]

5 第一行测试此代码。

It is categorical_features=3这伤害了你。你不能使用categorical_features与字符串数据。删除这个选项，幸运就会降临到你身上。另外，你可能需要fit_transform, not fit像这样。

onehotencoder = OneHotEncoder(handle_unknown='ignore')
transformed = onehotencoder.fit_transform(X[:, [3]]).toarray()
X1 = np.concatenate([X[:, :2], transformed, X[:, 4:]], axis=1)
#array([[165349.2, 136897.8, 0.0, '0.0, 1.0, 192261.83],
#       [162597.7, 151377.59, 1.0, 0.0, 0.0, 191792.06],
#       [153441.51, 101145.55, 0.0, 1.0, 0.0, 191050.39],
#       [144372.41, 118671.85, 0.0, 0.0, 1.0, 182901.99],
#       [142107.34, 91391.77, 0.0, 1.0, 0.0, 166187.94']])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scikit-learn 中出现“ValueError：无法将字符串转换为浮点数”错误的相关文章

PyQt：如何通过匿名代理使用网页

这真让我抓狂我想在 QWebPage 中显示一个 url 但我想通过匿名代理来实现 Code setting up the proxy proxy QNetworkProxy proxy setHostName 189 75 98 199
for 循环如何评估其参数

我的问题很简单 Does a for循环评估它每次使用的参数 Such as for i in range 300 python 是否会为此循环的每次迭代创建一个包含 300 个项目的列表如果是的话这是避免这种情况的方法吗 lst ra
如何在 PyCharm 4.5.2 中使用 PyPy 作为标准/默认解释器？

如何在 PyCharm 4 5 2 中使用 PyPy 作为标准默认解释器一切都在 Ubunutu 14 10 下运行并且 pypy 已经安装您可以在项目的设置下进行配置这个官方文档直接涵盖了 https www jetbrains
更新 Sqlalchemy 中的多个列

我有一个在 Flask 上运行的应用程序并使用 sqlalchemy 与数据库交互我想用用户指定的值更新表的列我正在使用的查询是 def update table value1 value2 value3 query update T
更改 Altair 中的构面标题位置？

如何将方面标题在本例中为年份移动到每个图的上方默认值似乎位于图表的一侧这可以轻易改变吗 import altair as alt from vega datasets import data df data seattle weat
登录网站并使用 python 请求下载文件

我有一个带有 HTML 表单的网站登录后它会将我带到 start php 站点然后将我重定向到overview php 我想从该服务器下载文件当我单击 ZIP 文件的下载链接时链接后面的地址是 getimage php path
WindowsError：[错误 126] 使用 ctypes 加载操作系统时

python代码无法在Windows 7平台上运行 def libSO lib ctypes cdll LoadLibrary ConsoleApplication2 so lib cfoo2 1 3 当我尝试运行它时得到来自python
python是带有字符串的运算符行为[重复]

这个问题在这里已经有答案了我无法理解以下行为我正在创建 2 个字符串并使用 is 运算符来比较它对于第一种情况它的工作方式有所不同对于第二种情况它按预期工作当我使用逗号或空格时它显示是什么原因False与比较is当没有使用
python 中的 Johansen 协整检验

我找不到任何有关在处理统计和时间序列分析 pandas 和 statsmodel 的 Python 模块中执行 Johansen 协整检验的功能的参考有谁知道是否有一些代码可以执行时间序列之间的协整测试现在这已在 Python 的 s
Apache Spark 中的高效字符串匹配

我使用 OCR 工具从屏幕截图中提取文本每个大约 1 5 句话然而当手动验证提取的文本时我注意到时不时会出现一些错误鉴于文本你好我真的很喜欢 Spark 我注意到 1 像 I 和 l 这样的字母被替换 2 表情符号未被正确提
动态 __init_subclass__ 方法的参数绑定

我正在尝试让类装饰器工作装饰器会添加一个 init subclass 方法到它所应用的类但是当该方法动态添加到类中时第一个参数不会绑定到子类对象为什么会发生这种情况举个例子这是可行的下面的静态代码是我试图最终得到的示例 cl
在Python中计算内存碎片

我有一个长时间运行的进程不断分配和释放对象尽管正在释放对象但 RSS 内存使用量会随着时间的推移而增加如何计算发生了多少碎片一种可能性是计算 RSS sum of allocations 并将其作为指标即便如此我该如何计算分母
在 Sphinx 中，有没有办法在声明参数的同时记录参数？

我更喜欢在声明参数的同一行记录每个参数根据需要以便应用D R Y http en wikipedia org wiki Don t repeat yourself 如果我有这样的代码 def foo flab nickers a ser
解析根元素内元素之间的 XML 文本

我正在尝试用 Python 解析 XML 以下是 XML 结构的示例 a aaaa1 b bbbb b aaaa2 a
Python 声音（“铃声”）

我想让一个 python 程序在完成任务时通过发出嘟嘟声来提醒我目前我使用import os然后使用命令行语音程序说进程完成我更愿意它是一个简单的铃我知道有一个函数可以用于Cocoa apps NSBeep 但我认为这与此没有太
检测 IDLE 的存在/如何判断 __file__ 是否未设置

我有一个脚本需要使用 file 所以我了解到 IDLE 没有设置这个有没有办法从我的脚本中检测到 IDLE 的存在 if file not in globals file is not set 如果你想做一些特别的事情 file 未设置
对数据帧的每 2 小时数据进行 Groupby

我有一个数据框 Time T201FN1ST2010 T201FN1VT2010 1791 2017 12 26 00 00 00 854 69 0 87 1792 2017 12 26 00 20 00 855 76 0 87 1793
Pandas - 合并数据框以将所有值保留在左侧，如果“左侧没有键”，则从右侧“插入”值，否则“更新”左侧现有的“键”

我有两个数据框 df1 和 df2 np random seed 0 df1 pd DataFrame key A B C D id 2 23 234 2345 2021 np random randn 4 df2 pd DataFrame
Django 模型：如何使用 mixin 类来覆盖 django 模型以实现 save 等功能

我想在每次保存模型之前验证值所以我必须重写保存函数代码几乎是一样的我想把它写在 mixin 类中但失败了我不知道如何写 super func 我英语不好抱歉 class SyncableMixin object def sav
python sklearn中的fit方法

我问自己关于 sklearn 中拟合方法的各种问题问题1 当我这样做时 from sklearn decomposition import TruncatedSVD model TruncatedSVD svd 1 model fit X

随机推荐

替换java中的字符序列

我正在解析一个结构不良的 rss feed 并且返回的一些数据已 p at在里面我怎样才能替换所有实例 p p at有一个空格使用java 我很熟悉 replaceString 类的方法但我不确定正则表达式的外观我试过inputSt
实施 Rijndael 解密时是否可以不使用 IV？

我正在使用 Rijndael 算法实现密文解密不幸的是我无法访问数据的加密并且只提供了密码用于生成密钥和算法类型我没有盐看起来没问题也没有静脉注射现在我的问题是我是否绝对必须拥有 IV 才能执行解密我怀疑编写加密的开发
从字符串java中提取日期

我有一个包含多个日期的字符串例如 20 Jul 2012 5 11 36 670 UTC PM 20 Jul 2012 5 11 36 683 UTC PM 如何读取该字符串并提取每个日期我正在使用SimpleDateFormat类来创
将不同层独立部署到 Azure

假设我有一个应用程序它分为各个层演示业务数据访问如何将这些层独立部署到Azure 问题是关于Azure配置而不是关于应用程序的架构应用程序通常分为各种角色每个角色都是 Windows Server 2008 R2 具有已定义
CardMedia高度材质-ui

我正在努力尝试改变 CardMedia 内图像的高度我设置样式 const style height 32 并将其用于
使用 pip 从 github 的特定分支安装包

我遇到了一个非常奇怪的问题我尝试从我的 github fork 中 pip 安装一个包我过去曾多次这样做过而且总是有效这就是我所做的 pip install git https my branch 虽然这在我的本地计算机上工作得很好
Python beautifulsoup 抢表

我正在尝试从此网页中获取表格我不确定我是否抓住了正确的标签这是我到目前为止所拥有的 from bs4 import BeautifulSoup import requests page http www airchina com cn
使用 LINQ to SQL 是否有助于防止 SQL 注入

我正在建立一个公共站点我首先想到的是 SQL 注入我正在保存一些文本字段并使用 linq 来更新写入数据库我使用 linq 安全吗此示例正在创建用户帐户 Data MemberRegistrationDataContext co
如何在 Android 中关闭/销毁 Firebase 引用？

这是场景创建了 firebase 引用 Firebase myRef new Firebase url In Main Activity 用户单击按钮导航到其他活动调用主活动的 onPause 有没有办法销毁这个构造函数此引用正在创建
Base64 编码图像 blob 未在 IE 中显示

echo img src height 150 这在 firefox safari 和 chrome 中显示的图像效果很好但在 Internet Explorer 中它显示了一个漂亮的红十字我认为这是因为编码的原因尝试更换data i
Nlog目标数据库在运行时设置连接信息

使用 Nlog 和数据库目标有没有办法在运行时设置连接信息我记得我的一些同事也做过类似的事情他找到了这样的答案 http nlog forum 1685105 n2 nabble com DDL for Database Table
溢出：隐藏不适用于正方向的平移

我最近遇到了一件奇怪的事情overflow hidden 我将它设置为一个元素然后我想将其中的元素转换为translate 当它向负方向平移时它将被隐藏但如果我向正方向平移它就不会被隐藏在桌面浏览器中它并没有真正显示出来但您可
sp_executesql 与 'IN' 语句

我试图使用 sp executesql 来防止 SQL 2005 中的 SQL 注入我有一个像这样的简单查询 SELECT from table WHERE RegionCode in X101 B202 但是当我使用 sp execu
函数后面的const如何优化程序？

我见过一些这样的方法 void SomeClass someMethod const 这个 const 声明有什么作用它如何帮助优化程序 Edit 我看到这个问题的第一部分之前已经被问过 BUT 它仍然没有回答第二部分这将如何优化程序
可编辑文本字段的 UITableView 列表

我知道这可能不符合 Apple 的 iPhone 人机界面指南但我想摆脱一级推送视图并拥有可编辑文本字段的列表此外我希望当视图出现时键盘从一开始就出现在屏幕上问题是当我有超过三个这样的字段时弹出键盘将覆盖下面的字段用户无法向下
如果 @Produces 注释缺失，球衣服务会返回什么？

我开始学习开发安全的网络服务正如我注意到的大多数示例都使用以下注释 Consumes 定义输入参数的格式 Produces 定义输出参数的格式但在实际代码中我看到的方法如下所示 POST Consumes MediaType APPL
Chrome扩展，在后台脚本中播放声音

我想从 Chrome 扩展程序播放声音但我读到内容脚本无法播放声音所以我把这段代码放在我的后台脚本中 var audio new Audio alert ogg audio play 但还是没有声音从 generated backgr
将 ASP.NET 会员资格提供程序与现有用户数据库结合使用

我目前正在 Net 中重写整个网站当前网站是用foxpro编写的并使用自定义逻辑验证规则和Sql服务器表来存储和验证用户我想使用会员提供程序但我有一个主要问题我不知道如何克服新站点和旧站点都必须共享用户和凭据用户必须能够在过
没有匹配的构造函数来初始化“std::thread”

我一直在研究一个相当简单的设施并发for循环构造它采用输入元素列表输出向量和从输入元素计算输出元素的函数我有这个片段无法编译 template
scikit-learn 中出现“ValueError：无法将字符串转换为浮点数”错误

我正在运行以下脚本 import numpy as np import matplotlib pyplot as plt import pandas as pd from sklearn preprocessing import OneHo

scikit-learn 中出现“ValueError：无法将字符串转换为浮点数”错误

scikit-learn 中出现“ValueError：无法将字符串转换为浮点数”错误 的相关文章

随机推荐

热门标签

scikit-learn 中出现“ValueError：无法将字符串转换为浮点数”错误的相关文章