形状图裁剪/截断特征名称

2024-06-23

import csv
import pandas as pd
import numpy as np
from matplotlib import pyplot 
import shap
from sklearn import preprocessing
from sklearn.preprocessing import StandardScaler
df1=pd.read_csv("./wine.data",sep=",",encoding='utf_8_sig')
X_train = df1
le = preprocessing.LabelEncoder()
X_train['alc_class'] = le.fit_transform(X_train.alc_class.values)
print(X_train.columns)

print(X_train.describe())


y = X_train['alc_class']
X = X_train.drop(columns='alc_class')
import xgboost as xgb


# split X and y into training and testing sets

from sklearn.model_selection import train_test_split
from sklearn.model_selection import GridSearchCV, RandomizedSearchCV


X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.30, random_state = 2100, stratify = y)

# import XGBClassifier
import xgboost as xgb
from sklearn.metrics import mean_squared_error
DM_train = xgb.DMatrix(data = X_train, 
                       label = y_train)
                       
                       
DM_test =  xgb.DMatrix(data = X_test,
                       label = y_test)


xgb_param_grid = {
     'colsample_bytree': np.linspace(0.5, 0.9, 2),
     'n_estimators':[30],
     'max_depth': [5],
     'learning_rate':[0.01],
     'alpha':[10],
     'objective':['binary:logistic'],
     'tree_method':['hist'],
     'min_child_weight': [1],
     'gamma': [0.5],
     'subsample': [0.6],

}

          
# instantiate the classifier 
xgb_clf = xgb.XGBClassifier(use_label_encoder=False, eval_metric="auc")


# perform 5 fold cross-validation using mean square error as a scoring method
grid_mse = GridSearchCV(estimator = xgb_clf, param_grid = xgb_param_grid, scoring = 'neg_mean_squared_error', cv = 5, verbose = 1)

# Fit grid_mse to the data, get best parameters and best score (lowest RMSE)

grid_mse.fit(X_train, y_train)



print("Best parameters found: ",grid_mse.best_params_)
print("Lowest RMSE found: ", np.sqrt(np.abs(grid_mse.best_score_)))


#Predict using the test data


y_pred = grid_mse.predict(X_test)
y_pred_prob = grid_mse.predict_proba(X_test)


print("Root mean square error for test dataset: {}".format(np.round(np.sqrt(mean_squared_error(y_test, y_pred)), 2)))



from sklearn.metrics import accuracy_score, roc_curve, auc,recall_score,precision_score, precision_recall_curve,f1_score, classification_report, confusion_matrix,roc_auc_score


print('XGBoost model accuracy score: {0:0.4f}'. format(accuracy_score(y_test, y_pred)))
print('XGBoost model F1 score: {0:0.4f}'. format(f1_score(y_test, y_pred, average='weighted')))

precision, recall, thresholds = precision_recall_curve(y_test, y_pred)
area = auc(recall, precision)
print("----------------")
print("\n\n Evaluation Metrics \n\n")


aucroc_score = roc_auc_score(y_test, y_pred_prob[:,1])
print("Area Under ROC Curve: ",aucroc_score)
# roc curve for models
fpr, tpr, thresh = roc_curve(y_test, y_pred_prob[:,1], pos_label=1)

# roc curve for tpr = fpr 
random_probs = [0 for i in range(len(y_test))]
p_fpr, p_tpr, _ = roc_curve(y_test, random_probs, pos_label=1)


print("confusion_matrix ", confusion_matrix(y_test,y_pred))
print("classification_report ", classification_report(y_test,y_pred))


explainer = shap.TreeExplainer(grid_mse.best_estimator_)
shap_values = explainer(X_train)
shap.plots.beeswarm(shap_values, plot_size = 1.8, max_display = 13)


print(grid_mse.best_estimator_.feature_importances_)
for col,score in zip(X_train.columns,grid_mse.best_estimator_.feature_importances_):
    print('%s, %0.3f ' %(col,score))

我有很长的特征名称，我绘制了蜂群沙普利图，并且特征名称被截断。我希望在 y 轴上显示完整的功能名称。任何帮助将不胜感激。
我尝试过更改绘图大小，但没有成功。

添加一个标志来隐藏绘图。然后使用紧凑的 bbox 布局保存到输出：

path = 'save_path_here.png'
shap.plots.beeswarm(shap_values, plot_size = 1.8, max_display = 13, show=False)
plt.savefig(path, bbox_inches='tight', dpi=300)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

matplotlib

shap

形状图裁剪/截断特征名称的相关文章

如何获取 Pandas df.merge() 不匹配的列名称

给出以下数据 data df pd DataFrame Reference A A A B C C D E Value1 U U U V W W X Y Value2 u u u v w w x y index 1 2 3 4 5 6 7
Django：NoReverseMatch at /'myapp'不是注册的命名空间

我在模板渲染期间遇到此错误我想做的是允许用户上传 csv 然后将数据处理到模型中第 109 行出错 myapp 不是已注册的命名空间这是我的第 109 行代码
Django 1.6：清除一张表中的数据

我有一个名为 UGC 的表想要清除该表中的所有数据我不想重置整个应用程序这也会删除所有其他模型中的所有数据是否可以只清除一个模型我还为我的应用程序配置了 South 如果这有帮助的话你可以使用原始 SQL https docs
查找数据集中的异常值

我有一个 python 脚本它创建服务器正常运行时间和性能数据列表的列表其中每个子列表或行包含特定集群的统计信息例如格式良好的它看起来像这样 Cluster Availability Requests Sec Errors S
使用不带引号的块样式的 Python YAML 转储

如何使用 PyYAML 加载和转储 YAML 以便它尽可能地使用原始样式我有 Python 来加载和转储 YAML 数据例如 import sys import yaml def represent dictorder self dat
Python TypeError：不支持的操作数类型 -：“int”和“function”

我是 Python 初学者正在做一项作业我不断得到TypeError unsupported operand type s for int and function 即使在研究了错误并应用了建议的修复之后我并不是在寻找任何人给我一个解
如何在嵌套列表中查找给定元素？

这是我的迭代解决方案 def exists key arg if not arg return False else for element in arg if isinstance element list for i in elemen
为什么Flask后台线程获取错误的数据库信息？

为了将实时数据库信息推送到客户端我在服务器端使用flask socketio 通过使用websocket将所有实时数据库信息推送到客户端我的视图文件有一个片段 from models import Host from flask soc
将 postgres 连接到 django 时遇到问题

以下文档来自Django Postgres 文档 https docs djangoproject com en 4 1 ref databases postgresql notes我添加到我的settings py 在我设置的设置中 DA
如何向 Jupyter (ipython) 笔记本自动添加扩展？

我已经安装了扩展 calico document tools 我可以使用以下命令从 Jupyter 笔记本中加载它 javascript IPython load extensions calico document tools 如何为每个
基于 Pandas 中特殊字符分隔列中的每个项目进行聚合

我输入的数据如下 Date Investment Type Medium 1 1 2000 Mutual Fund Stocks Fixed Deposit Real Estate Own Online Through Agent 1 2
构建wheel失败/“错误：INCLUDE环境变量为空”

我正在使用 Python 2 7 11 并尝试 pip install 模块但是其中一些模块失败了我收到的消息是无法为 X 构建轮子和错误包含环境变量为空我尝试安装 Scrapy LXML 和 Twisted 但都失败了我尝
如何忽略 Sentry 捕获中的某些 Python 错误

我已将 Sentry 配置为捕获 Django Celery 应用程序中的所有错误它工作正常但我发现一个令人讨厌的用例是当我必须重新启动我的 Celery 工作人员 PostgreSQL 数据库或消息服务器时这会导致数千种各种无法访
如何隐藏 Tkinter python Gui

有人知道如何隐藏 python GUI Tkinter 我已经创建了键盘记录器对于 GUI 我使用了 python 模块 Tkinter 我想添加名为 HIDE 的按钮因此当用户单击它时它将隐藏 GUI 当用户按下 CTRL E 之类
Python for 循环前瞻

我有一个 python for 循环其中我需要向前查看一项以查看在处理之前是否需要执行某项操作 for line in file if the start of the next line 0 perform pre processing
tkinter 库 treectrl 转换为 exe 安装程序时出现 cx_freeze 错误

我使用的是 python 版本 3 7 我使用了这个名为 treectrl 的外部库当我运行 py 文件时它工作得很好但是当我使用 cx freeze 转换为 exe 文件时它给了我错误 NomodulleFound 名为 tkint
pandas groupby 中两个系列的最大值和最小值

是否可以从 groupby 中的两个系列中获取最小值和最大值例如下面的情况分组时c 我怎样才能得到最小值和最大值a and b同时 df pd DataFrame a 10 20 3 40 55 b 5 14 8 50 60 c x x
Python - 将列表作为参数传递给 SQL，以及更多变量

我试图在 python 3 6 中将未知数量的参数传递给 SQL Server 这是我使用 pypyodbc 的代码 cursor cnxn cursor theargs 1033286869 1053474957 1063654630 1
如何限制单元测试的最大运行时间？

我目前正在运行一些单元测试这些测试可能需要很长时间才能失败或无限期地运行在成功的测试运行中它们总是会在一定的时间内完成是否可以创建一个 pytest 单元测试如果在一定时间内未完成该测试就会失败您可以安装 pytest tim
定义Python类时，如何在其中设置随机变量？

假设我有一个名为Person 其中只有该人的姓名和性别性别应从男性和女性中随机选择为此我导入random randint 功能根据随机int确定随机性别 import random class Person alias random

随机推荐

Elastic Search：聚合随机顺序？

是否可以进行随机顺序的聚合好像只有asc或者desc可能 aggs genders terms field gender order count asc 对的这是可能的是这样做的 aggs genders terms field ge
Algolia 初始搜索参数 instantsearch.js

我有一个索引我试图在其中传递 algolia 中查询的初始值我正在使用 instantsearch js 现在它只是从我的索引加载所有内容如何在页面加载时将初始值传递给索引例如Select from index where Cate
如何强制 Visual Studio 2010 重新加载磁盘上已更改的文件和项目？

我经常使用命令行工具对已加载到 Visual Studio 2010 中的文件和项目进行源代码管理更新在以前的版本中当我执行此操作时我可以通过执行全部保存来强制 Visual Studio 注意到并加载更改这在 Visual S
如何更改 Mediawiki 导航侧边栏和页脚中的字体大小和颜色？

我的网站是使用 Mediawiki 开发的我有以下问题如何更改导航侧边栏和页脚中的字体大小和字体颜色我正在使用矢量皮肤但很难找到进行这些更改的正确方法对于导航在你的CSS中搜索 div mw panel div portal d
将数据保存到 iOS 的最佳方式？

在我的应用程序 iOS 5 中我想保存数据我想节省债务所以就是加或减钱金额以及有债务的人的姓名或您有债务的人的姓名但我不知道如何保存数据 NSUserdefaults Core data SQLite 也许你可以告诉我拯救他
WebClient 上的 Exchange() 会抛出哪些异常？

我已经实现了一个服务它使 ReST 调用其他服务来实现其部分功能我正在使用反应式WebClient为此类似 webClient post uri contentType accept header syncBody someReque
处理续集迁移和初始化的工作流程？

我不明白续集迁移工作流程是如何工作的我有一个新建项目数据库是使用 SQL 脚本设计的我们用了sequelize auto之后生成模型我现在需要生成一个迁移文件以便我可以运行 CLI 来运行 SQL 查询为本地配置的数据库创建包含
操作系统如何选择正确的 ico/favicon 大小？

基于此 stackoverflow 讨论 https stackoverflow com questions 1526747 ideal size for ico 可以在单个文件中提供各种大小并且操作系统将选择最好的一个来显示这是如何
mod_rewrite 仅适用于 GET

这是一个不太可能的事情但我希望找到一个简单的解决方法来解决一个奇怪的错误该错误仅在应用程序省略推断查询字符串时才会出现在深入研究一千行缩小的第三方 javascript 之前我想了解是否可以使用 mod rewrite 自动应用查
如何使用 python 查找 iframe 中按钮的 XPath？

我在 iframe 中有以下 html 对象提交按钮的 html 代码 https i stack imgur com pe3rZ png 我需要找到它的 XPath 才能单击提交按钮但找不到它 XPath 助手仅显示 ifram
使用 Tomcat 的外部 LDAP JNDI 连接

我想知道如何使用 TOMCAT 中的 JNDI 配置连接外部 LDAP 我的代码是这样的 try InitialContext iniCtx new InitialContext ctx LdapContext iniCtx lookup
如何使用纸对话高分子元件？

我通过添加开始和结束标签来使用该元素
pymssql 包不适用于 aws 中的 lambda

我们如何为 lambda 创建 pymssql 包我尝试使用创建它 pip install pymssql t 当我运行 lambda 函数时它抱怨说无法导入模块 lambda function 没有名为 lambda functio
如何在 SwiftUI 中实现触发 switch case 的左或右 DragGesture() ？

我在视图中创建了一个 DragGesture 无论用户向左还是向右滑动它都应该选择 State Bool 问题是只检测到向右滑动如何使用 gesture 捕获用户在屏幕上向左还是向右滑动 import SwiftUI struct Sw
为什么要给伪元素添加块级别？

从本页的代码 http css tricks com snippets css sticky footer http css tricks com snippets css sticky footer page wrap min heigh
视图和表在性能上的差异

对于包含大量数据的表来说什么是最好的我有一个存储过程可以根据一些过滤器创建报告在我的 SP 中我读取表格并放入所有内部联接和公式然后在放置过滤器的 where 条件中谈论性能什么更好创建一个包含所有联接的视图或读取表就像我正
无法在静态方法中创建静态变量？

为什么这不起作用 public static int GetListOfAllDaysForMonths static int MonthDays new int 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
从 Angular 2 中的 FileReader 获取值

我有以下组件加载文件并将其内容绑定为字符串 export class NgCsvComponent Input csv any Output csvChange any new EventEmitter public localCsv an
如何隐藏 UITableViewCells 同时不违反自动布局约束

我目前正在开发一个应用程序来学习 iOS 编程和 Swift 我有一个视图其中包含两个主要子视图一个 MKMapView 和一个 UITableView 当在 MapView 中选择某个注释时我希望隐藏 TableView 中的某些单
形状图裁剪/截断特征名称

import csv import pandas as pd import numpy as np from matplotlib import pyplot import shap from sklearn import preproce

形状图裁剪/截断特征名称

形状图裁剪/截断特征名称 的相关文章

随机推荐

热门标签

形状图裁剪/截断特征名称的相关文章