'KMeansModel' 对象在 apache pyspark 中没有属性 'computeCost'

2024-01-11

我正在 pyspark 中试验聚类模型。我试图获得适合不同 K 值的簇的均方成本

def meanScore(k,df):
  inputCol = df.columns[:38]
  assembler = VectorAssembler(inputCols=inputCols,outputCol="features")
  kmeans = KMeans().setK(k)
  pipeModel2 = Pipeline(stages=[assembler,kmeans])
  kmeansModel = pipeModel2.fit(df).stages[-1]
  kmeansModel.computeCost(assembler.transform(df))/data.count()

当我尝试调用此函数来计算数据框中不同 K 值的成本时

for k in range(20,100,20):
  sc = meanScore(k,numericOnly)
  print((k,sc))

我收到属性错误：AttributeError：“KMeansModel”对象没有属性“computeCost”

我对 pyspark 相当陌生，刚刚学习，我真诚地感谢任何帮助。谢谢

正如 Erkan Sirin 提到的，computeCost 在最近的版本中已被弃用，这可能会帮助您解决问题

# Make predictions 
predictions = model.transform(dataset)
from pyspark.ml.evaluation import ClusteringEvaluator
# Evaluate clustering by computing Silhouette score
evaluator = ClusteringEvaluator()
silhouette = evaluator.evaluate(predictions)
print("Silhouette with squared euclidean distance = " + str(silhouette))

希望对您有帮助，您可以查看官方文档以获取更多信息

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

apachespark

PySpark

clusteranalysis

kmeans

'KMeansModel' 对象在 apache pyspark 中没有属性 'computeCost' 的相关文章

AttributeError：模块“pandas”没有属性“read_csv”Python3.5

我已经成功使用pandas read csv很久以来当我尝试读取 csv 文件时突然开始出现错误 df pd read csv file csv encoding utf 8 错误是 AttributeError module pand
动态添加jinja模板

我有一个 jinja 模板它是一组 div 标签内的唯一内容 div include temppage html div 当我按下按钮时我想用其他内容替换标签之间的所有内容我希望用另一个 jinja 模板 include realpa
通过 SSH 的 Pygame 不注册击键（Raspberry Pi 3）

所以我得到了 raspi 3 和简单的 8x8 LED 矩阵在玩了一些之后我决定用 pygame 的事件制作一个简单的蛇游戏显示在该矩阵上我之前没有 pygame 的经验除了 LED 矩阵之外没有连接任何屏幕显示器所以最初的
Python：按条件绘制多个正/负条形图

这是我第一次用 python 绘制条形图我的 df 操作 key descript score 0 noodles taste 5 1 noodles color 2 2 noodles health 3 3 apple color 7
具有相同内容的拆分列表

例如我有以下列表 contents i have two pens prices 5 made in and 我想将它们分开使其具有与以下内容相同的内容 array 0 i have two pens array 1 prices 5 a
如何使用scrapy抓取xml url

你好我正在使用 scrapy 来抓取 xml url 假设下面是我的 Spider py 代码 class TestSpider BaseSpider name test allowed domains www example com s
尽管 Matplotlib FuncAnimation(...,repeat=False) 保存的动画图不断循环

我想使用制作动画matplotlib进行 Powerpoint 演示动画应该只播放一次在我的代码中参数repeat of FuncAnimation 被设置为 false 因为我需要将图导入到powerpoint中所以我使用保存它a
通过Python通过蓝牙发送消息或数据

如何通过 python 通过蓝牙发送消息而无需输入数字等密钥身份验证我用过 pybluez 但我收到了这个错误 File send line 12 in
Jupyter 笔记本中未显示绘图

我正在尝试为 Anscombe 数据集创建 2x2 图加载数据集并分离数据集中的每个类 import seaborn as sns import matplotlib pyplot as plt anscombe sns load dat
Keras ImageDataGenerator 相当于 csv 文件

我在文件夹中排序了一堆数据如下图所示我需要构建一个 DataIterator 以便将数据放入神经网络模型中当数据是图像时我找到了很多例子来解决这个问题使用 Keras 类图像数据生成器及其方法流自目录但当数据是 csv 结构时则
用于 OAuth 身份验证的 WSGI 中间件

我使用构建了一个非常小的网络应用程序Flask http flask pocoo org 现在我想向网站添加非常基本的身份验证我不需要授权由于 Flask 不支持开箱即用的 auth auth 我想插入 WSGI 中间件来完成这项工作
按最小值分组并用另一列中的值填充 NA

我有一个如下所示的示例数据框 df pd DataFrame data uid 1 1 1 2 2 3 pagename home blah blah home blah blah startpage NA NA NA home home
加载 IPython 笔记本时出错

一旦我用 Jupyter 打开笔记本文件它要求我转换文件我就再也无法在标准 IPython 笔记本中打开它了我收到以下错误 Error loading notebook Bad Request 2014 12 21 04 13 03
为什么计算大整数阶乘的“分而治之”方法如此快？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
使用 asyncio 时应该如何创建属性？

在创建使用 asyncio 的类时我发现自己处于属性 getter 需要进行 io 操作的情况因此该函数应该是一个协程然而等待房产的感觉却很不寻常这是我的意思的一个最小的例子该代码有效并且可以运行 import asyncio
将文本文件转换为 plink PED 和 MAP 格式

我有以下数据其中的一小部分名为 short2 pre snp tumor txt rs987435 C G 1 1 1 0 2 rs345783 C G 0 0 1 0 0 rs955894 G T 1 1 2 2 1 rs608879
Python：Scrapy返回元素后面的所有html，而不仅仅是元素的html

我遇到了 Scrapy 行为异常的问题几个月前我编写了一个简单的函数它返回给定 xpath 处的项目列表 def get html response path sel Selector text response page source
使 flake8 区分未定义函数和星型导入

我有一个相当大的项目我试图在发布之前清理它但是当我运行 flake8 时我得到了大量的 F405
在 Spark MLlib 上使用 Java 中的 Breeze

在尝试从Java使用MLlib时使用微风矩阵运算的正确方法是什么例如scala 中的乘法很简单 matrix vector 相应的功能在Java中是如何表达的有一些方法例如 colon times 可以通过正确的方式调用 breez
重定向到破折号中的 url

我正在使用 dash 构建一个仪表板每当单击特定数据点时我都会创建一个唯一的 url 如何将用户重定向到此创建的 url 我正在使用下面给出的代码每当有人单击任何数据点时单击事件就会触发并执行回调函数 app layout html

随机推荐

JQuery Animate() 从页面底部向上滑动 div

希望很简单但尝试实施其他问题的答案却无济于事我有一个 div I 我想在文档加载时从页面底部向上滑动但是我似乎无法让 JQuery 工作这是我所拥有的 content width 640px margin auto margin
Ubuntu 16.04 上适用于 TensorFlow 的 NVIDIA cuDNN 版本类型 [已关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案根据TensorFlow 1 5 安装说明 https www tensorflow org install install linux对
在 VS Code 中，当通过调试器运行 python 程序时，在 launch.json 中设置了internalConsole，然后我无法从命令行接收输入

在 VS Code 中当通过调试器运行 python 程序 launch json 并将控制台设置设置为 internalConsole 时我无法从命令行接收输入我不确定它是否应该是这样的因此这是否只是该设置的限制顺便说一句我说
如何在通过python请求模块发送请求时选择特定的密码

用例我想通过 python 请求模块了解主机名支持多少种密码我无法找到一种方法来提供密码名称来请求模块挂钩任何人都可以建议提供指定密码的方法 import ssl from requests adapters import HTTPA
查找二维数组中图形的边界

有一个图形由 1 个值表示这些值在 2 维数组中垂直水平或对角线连接我需要在任何类型的 C 容器中保存图形边界的索引连接到图形的 0 的行和列例如在下面的二维数组中我应该获得以下索引 0 2 0 3 0 4 1 2 1 4
pandas：合并两列，每隔一行

我有以下 pandas df original mean 0 0 000000 0 065500 1 0 131000 0 135890 2 0 140779 0 144875 3 0 148971 0 150029 4 0 151088
如何在 Swift 中将字符串转换为 NSUUID？

我正在开发 iOS Swift 我已经转换了NSUUID to String像下面这样 var bdAddr NSUUID var text String bdAddr UUIDString 但如何转换String to NSUUID在斯威
如何更新 ionic 2 侧面菜单中的值

如何将数据从页面传输到side menu在 Ionic2 中即拥有app page html像下面这样
体系结构 i386 的未定义符号：“_OBJC_CLASS_$_ZipException”，引用自：错误

我在项目中使用了一些 o 文件在编译时显示以下错误 error linker command failed with exit code 1 use v to see invocation 我在下面发布了错误日志 Ld Users dee
如何从目录中删除某个部分？

或者换句话说有没有类似的东西 tocless为 Rmd 的我找到了乳胶的东西here https tex stackexchange com a 214137 137734 但找不到 Rmd 的任何内容更改目录深度不是一个选项 out
Python/Sklearn - 值错误：无法将字符串转换为浮点数

我正在尝试使用 10 倍 CV 在我的数据集中运行 kNN 分类器我对 WEKA 中的模型有一些经验但很难将其转移到 Sklearn 下面是我的代码 filename train4 csv names attribute names a
如何从 TextInputLayout 或 TextInputEditText 中删除下划线

我想删除下划线这是我的代码
如何使用协调器父级在滚动回收器视图上显示/隐藏 FAB

我有一个带有协调器布局的活动活动内部有一个带有回收器视图和浮动按钮的片段如何在滚动回收器视图时显示隐藏浮动按钮并避免使用 fab 行为在活动布局中 CoordinatorLayout gt AppBarLayout gt Toolb
如何在 C# 中内部检测应用程序是处于控制台模式还是 Windows 模式

有没有办法从应用程序本身检查程序是处于控制台模式还是窗口模式我知道 Read 和 ReadLine 可以以某种方式检测到这一点但是如何检测呢您应该能够检查是否Console In StreamReader Null 如果这是真的则没
类路径设置但 java.lang.NoClassDefFoundError com/google/protobuf/MessageOrBuilder 错误？

我正在尝试运行一个使用 protobuf jar 的 java 程序但我不断收到此错误我已经在 linux 中设置了类路径变量以便 CLASSPATH home src PlaceServer class home src proto
从 JavaScript 调用 ASP.NET 函数

我正在 ASP NET 中编写网页我有一些 JavaScript 代码并且有一个带有单击事件的提交按钮是否可以使用 JavaScript 单击事件调用我在 ASP 中创建的方法好吧如果您不想使用 Ajax 或任何其他方式来完成此操
Android 地图性能因叠加层过多而变差？

我的 Android 应用程序中有一张地图显示了许多标记 20 50 但当我尝试滚动缩放时该应用程序的性能非常差在 Google Android 地图中我对披萨进行了示例搜索还发现了一些 20 50 个结果并且在缩放滚动时我
angular2：如何测试具有可观察时间间隔的组件

我有一个幻灯片放映组件它有一个幻灯片对象的输入数组并显示每个幻灯片对象只要它是在slide time其本身还有两个按钮单击它们必须滑动到下一个项目并重置计时器为了完成这项工作我使用如下 Observables a SUBJEC
即使使用 babel 插件，解构赋值在 IE 11 中也不起作用

我遇到了一种情况我添加了一个包含破坏性参数的中间件当在谷歌浏览器中打开时它工作正常但它在互联网浏览器中打开失败这是我的 webpack 配置文件 var path require path var webpack require
'KMeansModel' 对象在 apache pyspark 中没有属性 'computeCost'

我正在 pyspark 中试验聚类模型我试图获得适合不同 K 值的簇的均方成本 def meanScore k df inputCol df columns 38 assembler VectorAssembler inputCols i

'KMeansModel' 对象在 apache pyspark 中没有属性 'computeCost'

'KMeansModel' 对象在 apache pyspark 中没有属性 'computeCost' 的相关文章

随机推荐

热门标签