有没有办法将 pmml 文件导入到 python 中？

2023-12-02

我使用 sklearn 训练了一个模型，并使用 sklearn2pmml 将其导出为 pmml 格式。有没有办法将该 pmml 文件转换回可以在 python 中导入和运行的文件？

我之所以这样做，是因为我注意到 pmml 模型与 sklearn 模型的行为方式略有不同。具体来说，pmml 文件设置了变量的硬上限和下限（使用训练集中变量的最大值和最小值），而 sklearn 则没有。当 pmml 模型遇到超出这些范围的数据时，我会遇到问题。这只是 pmml 模型和 sklearn 模型之间的一个区别，我希望能够将 pmml 文件重新导入到 python 中来运行它，看看是否还有其他的。

您不需要测试 sklearn2pmml 生成的模型的正确性。它基于JPMML-SkLearn库，它完全覆盖了集成测试 - Scikit-Learn 预测和 PMML 预测被证明是相同的。

您真正的问题是您想要在其预期的“适用范围”之外应用模型。这是一个珠子的想法，因为在这种情况下没有指定模型的行为 - 垃圾输入，垃圾预测。

但是，如果您坚持必须能够在生产环境中向模型提供垃圾，那么只需禁用 PMML 值边界检查即可。有很多方法可以实现这一点：

Remove Value and Interval子元素来自/PMML/DataDictionary/DataField元素。
Modify Value and Interval子元素，以便那些以前未见过的值将被识别为有效值。例如，您可以定义页边距Input元素包含所有值 [-Inf, +Inf]。参见解释Value and IntervalPMML 规范中的元素以确保语法正确。
改变invalidValueTreatment全部属性值/PMML/<Model>/MiningSchema/MiningField元素从“returnInvalid”到“asIs”。如果缺少此属性，则默认为“returnInvalid”。所以你需要插入invalidValueTreatment=asIs there.

我会推荐选项#3。您可以使用自动化该过程JPMML模型图书馆：

org.dmg.pmml.PMML pmml = loadFromFile(..)
org.dmg.pmml.Visitor mfUpdater = new org.jpmml.model.visitors.AbstractVisitor(){
  @Override
  public VisitorAction visit(MiningField miningField){
    miningField.setInvalidValueTreatment(InvalidValueTreatmentMethod.AS_IS);
    return VisitorAction.CONTINUE;
  }
}
mfUpdater.applyTo(pmml);
saveToFile(pmml, ...)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

scikitlearn

sklearnpandas

pmml

有没有办法将 pmml 文件导入到 python 中？的相关文章

错误：process_executor.py:702: ... 当一些作业被分配给执行器时，工作人员停止了。这可能是由于工作超时太短造成的

根据主题中的错误修复方法是什么环境 Python 3 9 或 3 10 Windows 10 x64 使用时出现错误joblib https joblib readthedocs io en latest 对于并行处理 result c
如何使用 Python 3 绕过 HTTP Error 403: Forbidden with urllib.request

您好不是每次都这样但有时在尝试访问 LSE 代码时我会收到每一个烦人的 HTTP 错误 403 禁止消息任何人都知道我如何仅使用标准 python 模块来克服这个问题遗憾的是没有漂亮的汤 import urllib request
使用python查找txt文件中字母出现的次数

我需要从 txt 文件中读取该字母并打印 txt 文件中出现的次数到目前为止我已经能够在一行中打印内容但计数有问题有人可以指导吗 infile open grades txt content infile read for char
从 Azure ML 实验中访问 Azure Blob 存储

Azure ML 实验提供了通过以下方式读取 CSV 文件并将其写入 Azure Blob 存储的方法 Reader and Writer模块但是我需要将 JSON 文件写入 blob 存储由于没有模块可以执行此操作因此我尝试在Ex
无法在 selenium 和 requests 之间传递 cookie，以便使用后者进行抓取

我用 python 结合 selenium 编写了一个脚本来登录网站然后从driver to requests这样我就可以继续使用requests进行进一步的活动 I used item soup select one div class
Series.sort() 和 Series.order() 有什么区别？

s pd Series nr randint 0 10 5 index nr randint 0 10 5 s Output 1 3 7 6 2 0 9 7 1 6 order 按值排序并返回一个新系列 s order Output 2 0
使用python从gst管道抓取帧到opencv

我在用着OpenCV http opencv org 和GStreamer0 10 我使用此管道通过自定义套接字通过 UDP 接收 MPEG ts 数据包sockfd由 python 提供并显示它xvimagesink 而且效果很好以下命
AttributeError：“模块”对象没有属性[重复]

这个问题在这里已经有答案了我有两个 python 模块 a py import b def hello print hello print a py print hello print b hi b py import a def hi
两个不同长度的数据帧的列之间的余弦相似度？

我在 df1 中有文本列在 df2 中有文本列 df2 的长度将与 df1 的长度不同我想计算 df1 text 中每个条目与 df2 text 中每个条目的余弦相似度并为每场比赛给出分数输入样本 df1 mahesh suresh
Airflow 1.9 - 无法将日志写入 s3

我在 aws 的 kubernetes 中运行气流 1 9 我希望将日志发送到 s3 因为气流容器本身的寿命并不长我已经阅读了描述该过程的各种线程和文档但我仍然无法让它工作首先是一个测试向我证明 s3 配置和权限是有效的这是在我们
Python 中维基百科 API 中的 DisambiguationError 和 GuessedAtParserWarning

我想获得维基百科与搜索词相关的可能且可接受的名称列表在这种情况下是电晕当输入以下内容时 print wikipedia summary Corona 这给出了以下输出 home virej local lib python3 8 si
可以使用哪些技术来衡量 pandas/numpy 解决方案的性能

Question 如何简洁全面地衡量下面各个功能的性能 Example 考虑数据框df df pd DataFrame Group list QLCKPXNLNTIXAWYMWACA Value 29 52 71 51 45 76 68 6
为什么 __dict__ 和 __weakref__ 类从未在 Python 中重新定义？

类创建似乎从来没有re 定义 dict and weakref class属性即如果它们已经存在于超类的字典中则它们不会添加到其子类的字典中但始终re 定义 doc and module class属性为什么 gt gt gt c
使用 PIL 在 Tkinter 中显示动画 GIF

我正在尝试制作一个程序来使用 Tkinter 显示动画 GIF 这是我最初使用的代码 from future import division Just because division doesn t work right in 2 7 4
无法通过 Python 子进程进行 SSH

我需要通过堡垒 ssh 进入机器因此该命令相当长 ssh i
如何在亚马逊 EC2 上调试 python 网站？

我是网络开发新手这可能是一个愚蠢的问题但我找不到可以帮助我的确切答案或教程我工作的公司的网站用 python django 构建托管在亚马逊 EC2 上我想知道从哪里开始调试这个生产站点并检查存储在那里的日志和数据库我有帐户信
Django 管理器链接

我想知道是否有可能如果可以的话如何将多个管理器链接在一起以生成受两个单独管理器影响的查询集我将解释我正在研究的具体示例我有多个抽象模型类用于为其他模型提供小型的特定功能其中两个模型是DeleteMixin 和GlobalMix
如何编写一个接受 int 或 float 的 C 函数？

我想用 C 语言创建一个扩展 Python 的函数该函数可以接受 float 或 int 类型的输入所以基本上我想要f 5 and f 5 5 成为可接受的输入我认为我不能使用if PyArg ParseTuple args i v
rpy2 无法加载外部库

希望有人能帮忙解决这个问题 R版本 2 14 1rpy2版本 2 2 5蟒蛇版本 2 7 3 一直在尝试在 python 脚本中使用 rpy2 加载 R venneuler 包该包以 rJava 作为依赖项 venneuler 和 rJa
如何使用 python 定位和读取 Data Matrix 代码

我正在尝试读取微管底部的数据矩阵条形码我试过libdmtx http libdmtx sourceforge net 它有 python 绑定当矩阵的点是方形时工作得相当好但当矩阵的点是圆形时工作得更糟如下所示另一个复杂问题是在某

随机推荐

在 R 中重新编码多个变量

我想在 R 中一次重新编码多个变量这些变量位于更大的数据框中以下是一些示例数据 z lt data frame A c 1 2 300 444 555 B c 555 444 300 2 1 C c 1 2 300 444 555 D
Angular UI Router - 如何在切换视图时保留视图

我是 Angular 和 UI Router 的新手 Plunk http plnkr co edit 1wfyrGryfGG5RtXozPFY p preview Setup我有三个顶级应用程序导航按钮主页项目帮助他们使用 Ang
R.java 文件未创建

我的 Android 应用程序中有 R java 文件但我不知道它是如何删除的要再次创建它我清理我的项目并通过单击构建项目重建我的项目我不知道是什么问题它不会再次被创建一般来说每当我构建项目时它都会自动创建如果您在更
firebase获取每个子项的子项的数据

大家好我是 firebase 的超级新手我需要一些帮助首先我正在做的是一份清单例如刻度表包含一个项目列表其中包含刻度日志因此我设计的数据如下清单 ticksheets JbN5ol2jGRtAOZ9ovrO auto ge
noscript 标签，如果未启用，我需要提供替代 html

如果用户浏览器上未启用 JavaScript 是否可以用 HTML 替换 javascript 我知道我可以使用
当以 C++03 为目标时，使用 std::basic_string 作为连续缓冲区是否合理？

我知道在 C 03 中从技术上讲std basic string模板不需要有连续的内存然而我很好奇现代编译器有多少实现实际上利用了这种自由例如如果有人想使用basic string要接收某些 C API 的结果如下面的示例分配
是否可以从具有超时的输入流中读取？

具体来说问题是编写一个这样的方法 int maybeRead InputStream in long timeout 如果数据在超时毫秒内可用则返回值与 in read 相同否则返回 2 在该方法返回之前任何生成的线程都必须退出
您如何简单地解释类型转发？

我正在准备 MCTS 70 536 阅读后this文章我不确定我是否理解类型转发的概念我发现文章中给出的步骤更加令人困惑如果我复制要转发的类型的源代码并重新编译它该怎么办旧的 dll 和客户端会发生什么类型转发允许您在程序集之间
如何在Python中将日转换为年和月？

如何在Python中将日转换为年月和日例如如果某人已经 5 538 天了我怎样才能通过这样的年月日来显示这一点 15岁2个月又1天这是为了获取用户的输入 print Please enter your birthday bd ye
UICollectionView - 水平排列单元格

所以基本上我的问题是我的集合视图单元格是从上到下排序的而不是从左到右排序的 This is what it looks like 1 4 7 2 5 8 3 6 9 This is what i want 1 2 3 4 5 6 7 8
需要在角度2中插入Script标签

我已经做了一些阅读和搜索几乎所有我发现的内容都表明脚本标签不能包含在 Angular 2 的模板中我们会像您一样有意从模板中删除标签不应该使用它们来按需加载代码 https github com angular angular iss
特定元素是否存在事件

是否有任何事件可以知道原始 javascript 中特定元素何时开始存在例如我有 div class parent div class child div div 我想在 parent 和只有 parent 不是 child 开始存在
更快地绘制实时音频信号

我有一段代码它从笔记本电脑的音频插孔获取实时音频信号并在进行一些基本过滤后绘制其图表我面临的问题是随着程序的运行实时绘图变得越来越慢有什么建议可以让绘图更快并以恒定的速度进行吗我认为动画功能会使其更快但无法根据我的要求制定
git diff 用于任何存储库之外的自定义 2 个文件？

I need git diff我在任何存储库之外拥有的 2 个文件的功能有办法做到吗就像是git diff file1 path file1 txt file2 path file2 txt如果没有替代解决方案是什么答案就在the
强制请求使用 IPv4 / IPv6

如何强制requests库使用特定的互联网协议版本来获取请求或者可以用Python中的另一种方法更好地实现这一点吗我可以但我不想使用curl 阐明目的的示例 import requests r requests get https m
在 Woocommerce 3 中使用 WC_Cart add_to_cart() 方法存储自定义数据

我正在创建一个会员网站并为每个会员计划完全创建静态页面只有 3 个计划但是我为每个计划添加了产品当我点击选择计划按钮时我会重定向到一些自定义表单在其中询问用户我们将用于实现计划的信息范围与sneakertub com相同
如何使用 CGContext 获取像素的 RGB 值？

我正在尝试通过更改像素来编辑图像我有以下代码 let imageRect CGRectMake 0 0 self image image size width self image image size height UIGraphics
出现编译错误时eclipse如何执行java代码

当下面的java代码在eclipse中执行时它给出了正确的输出即打印 Class B 但根据java规范代码无法编译因为超类构造函数需要一个int编译器为类 B 提供的参数和构造函数包括对超类无参数构造函数的调用该构造函数未定
JavaScript ES6 Promise for 循环

for let i 0 i lt 10 i const promise new Promise resolve reject gt const timeout Math random 1000 setTimeout gt console l
有没有办法将 pmml 文件导入到 python 中？

我使用 sklearn 训练了一个模型并使用 sklearn2pmml 将其导出为 pmml 格式有没有办法将该 pmml 文件转换回可以在 python 中导入和运行的文件我之所以这样做是因为我注意到 pmml 模型与 sklea

有没有办法将 pmml 文件导入到 python 中？

有没有办法将 pmml 文件导入到 python 中？ 的相关文章

随机推荐

热门标签

有没有办法将 pmml 文件导入到 python 中？的相关文章