Huggingface 分类与预测作斗争

2024-01-21

我正在微调 longformer，然后使用进行预测TextClassificationPipeline and model(**inputs)方法。我不确定为什么会得到不同的结果

import pandas as pd
import datasets
from transformers import LongformerTokenizerFast, LongformerForSequenceClassification, Trainer, TrainingArguments, LongformerConfig
import torch.nn as nn
import torch
from torch.utils.data import DataLoader#Dataset, 
import numpy as np
from sklearn.metrics import accuracy_score, precision_recall_fscore_support
from tqdm import tqdm
#import wandb
import os
from datasets import Dataset
from transformers import TextClassificationPipeline, AutoTokenizer, AutoModelForSequenceClassification

tokenizer = LongformerTokenizerFast.from_pretrained('folder_path/', max_length = maximum_len)

从保存的位置加载微调模型。使用原始分词器

saved_location='c:/xyz'
model_saved=AutoModelForSequenceClassification.from_pretrained(saved_location)
pipe = TextClassificationPipeline(model=model_saved, tokenizer=tokenizer, device=0)#tokenizer_saved, padding=True, truncation=True)
prediction = pipe(["The text to predict"], return_all_scores=True)
prediction
[[{'label': 'LABEL_0', 'score': 0.7107483148574829},
  {'label': 'LABEL_1', 'score': 0.2892516553401947}]]

第二种方法

inputs = tokenizer("The text to predict", return_tensors="pt").to(device)
outputs = model_saved(**inputs)#, labels=labels)
print (outputs['logits'])
#tensor([[ 0.4552, -0.4438]], device='cuda:0', grad_fn=<AddmmBackward0>)
torch.sigmoid(outputs['logits'])
#tensor([[0.6119, 0.3908]], device='cuda:0', grad_fn=<SigmoidBackward0>)

AutoModelForSequenceClassification返回概率0.71 and 0.29。当我看第二种方法时。它返回逻辑0.4552, -0.4438转换为概率0.6119, 0.3908

#更新1

第一个链接文本分类管道 https://huggingface.co/docs/transformers/v4.17.0/en/main_classes/pipelines#transformers.TextClassificationPipeline克罗诺克的回答如下

function_to_apply (str, optional, defaults to "default") — The function to apply to the model outputs in order to retrieve the scores. Accepts four different values:
"default": if the model has a single label, will apply the sigmoid function on the output. If the model has several labels, will apply the softmax function on the output.
"sigmoid": Applies the sigmoid function on the output.
"softmax": Applies the softmax function on the output.
"none": Does not apply any function on the output.

因为这是一个二元分类问题（单标签），它不应该应用 sigmoid 吗？

我假设model.config.num_labels==2，如果是这样的话，则文本分类管道 https://huggingface.co/docs/transformers/v4.17.0/en/main_classes/pipelines#transformers.TextClassificationPipeline应用 softmax 而不是 sigmoid 来计算概率 (code https://github.com/huggingface/transformers/blob/198c335d219a5eb4d3f124fdd1ce1a9cd9f78a9b/src/transformers/pipelines/text_classification.py#L142).

import torch

logits = torch.tensor([ 0.4552, -0.4438])
print(torch.softmax(logits,0))

Output:

tensor([0.7107, 0.2893])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Huggingface 分类与预测作斗争的相关文章

递归 lambda 表达式可能吗？

我正在尝试编写一个调用自身的 lambda 表达式但我似乎找不到任何语法或者即使它是可能的本质上我想将以下函数传输到以下 lambda 表达式中我意识到这是一个愚蠢的应用程序它只是添加但我正在探索可以在 python 中使用 l
如何在Python中流式传输和操作大数据文件

我有一个相对较大 1 GB 的文本文件我想通过跨类别求和来减小其大小 Geography AgeGroup Gender Race Count County1 1 M 1 12 County1 2 M 1 3 County1 2 M 2
用缺失的日期填充其他列 Nan Pandas DataFrame

我实际上是从几个 Excel 文件中提取数据来监控我的每日卡路里摄入量我设法使用列表理解来生成日期我尝试使用合并或连接但它不起作用 ValueError 您正在尝试合并对象和 float64 列 date list 2021 05 2
如何检查python xlrd库中的excel文件是否有效

有什么办法与xlrd库来检查您使用的文件是否是有效的 Excel 文件我知道还有其他库可以检查文件头我可以使用文件扩展名检查但为了多平台性我想知道是否有任何我可以使用的功能xlrd库本身在尝试打开文件时可能会返回类似 false 的内
检查 Python 中的可迭代对象中的所有元素的谓词是否计算为 true

我很确定有一个常见的习语但我无法通过谷歌搜索找到它这是我想做的用Java Applies the predicate to all elements of the iterable and returns true if all ev
如何在Python中同时运行两只乌龟？

我试图让两只乌龟一起移动而不是一只接着另一只移动例如 a turtle Turtle b turtle Turtle a forward 100 b forward 100 但这只能让他们一前一后地移动有没有办法让它们同时移动有没有
Mac OS X 中文件系统的 Unicode 编码在 Python 中不正确？

在 OS X 和 Python 中处理 Unicode 文件名有点困难我试图在代码中稍后使用文件名作为正则表达式的输入但文件名中使用的编码似乎与 sys getfilesystemencoding 告诉我的不同采取以下代码 usr b
Python3.0 - 标记化和取消标记化

我正在使用类似于以下简化脚本的内容来解析较大文件中的 python 片段 import io import tokenize src foo bar src bytes src encode src io BytesIO src src l
在 Django OAuth Toolkit 中安全创建新应用程序

如何将 IsAdminUser 权限添加到 Django OAuth Toolkit 中的 o applications 视图 REST FRAMEWORK DEFAULT PERMISSION CLASSES rest framework
Django send_mail SMTPSenderRefused 530 与 gmail

一段时间以来我一直在尝试使用 Django 从我正在开发的网站接收电子邮件现在我还没有部署它并且我正在使用Django开发服务器我不知道这是否会影响它这是我的 settings py 配置 EMAIL BACKEND djang
Geodjango距离查询未检索到正确的结果

我正在尝试根据地理位置的接近程度来检索一些帖子正如您在代码中看到的我正在使用 GeoDjango 并且代码在视图中执行问题是距离过滤器似乎被完全忽略了当我检查查询集上的距离时我得到了预期距离 1m 和 18km 但 18km 的帖
SMTP_SSL SSLError: [SSL: UNKNOWN_PROTOCOL] 未知协议 (_ssl.c:590)

此问题与 smtplib 的 SMTP SSL 连接有关当与 SMTP 无 ssl 连接时它正在工作在 SMTP SSL 中尝试相同的主机和端口时出现错误该错误仅基于主机 gmail 设置也工作正常请检查下面的示例如果 Out
Weka J48 分类器：无法处理数字类？

我现在尝试使用 Weka 在我的训练数据上构建 J48 C4 5 分类器模型首先我这样做这似乎很顺利 java Xmx10G cp weka weka jar weka core converters TextDirectoryLoad
ANTLR 获取并拆分词法分析器内容

首先对我的英语感到抱歉我还在学习我为我的框架编写 Python 模块用于解析 CSS 文件我尝试了 regex ply python 词法分析器和解析器但我发现自己在 ANTLR 中第一次尝试我需要解析 CSS 文件中的注释
将seaborn.palplot轴添加到现有图形中以可视化不同调色板

将seaborn人物添加到子图中是usually https seaborn pydata org examples cubehelix palette html创建图形时通过传递 ax 来完成例如 sns kdeplot x y cma
在 keras 中保存和加载权重

我试图从我训练过的模型中保存和加载权重我用来保存模型的代码是 TensorBoard log dir output model fit generator image a b gen batch size steps per epoch
SocketIO + Flask 检测断开连接

我在这里有一个不同的问题但意识到它可以简化为如何检测客户端何时从页面断开连接关闭其页面或单击链接换句话说套接字连接关闭我想制作一个带有更新用户列表的聊天应用程序并且我在 Python 上使用 Flask 当用户连接时浏览器发
从 NumPy 数组到 Mat 的 C++ 转换 (OpenCV)

我正在围绕 ArUco 增强现实库基于 OpenCV 编写一个薄包装器我试图构建的界面非常简单 Python 将图像传递给 C 代码 C 代码检测标记并将其位置和其他信息作为字典元组返回给 Python 但是我不知道如何在 Pytho
在 Django 查询中使用 .extra(select={...}) 引入的值上使用 .aggregate() ？

我正在尝试计算玩家每周玩游戏的次数如下所示 player game objects extra select week WEEK games game date aggregate count Count week 但姜戈抱怨说 Fiel
给定文档，选择相关片段

当我在这里提出问题时自动搜索返回的问题的工具提示给出了问题的前一点但其中相当一部分没有给出任何比理解问题更有用的文本标题有谁知道如何制作一个过滤器来删除问题中无用的部分我的第一个想法是修剪仅包含某个列表中的单词的任何前导句子例如

随机推荐

Python 和 ctypes：如何正确地将“指针到指针”传递到 DLL 中？

我有一个 DLL 它分配内存并返回它 DLL中的函数如下 void Foo unsigned char ppMem int pSize pSize 4 ppMem malloc pSize for int i 0 i lt pSize i
PHP file_put_contents 在 75 万行文本文件上的性能

此 PHP 脚本将行添加到我的文本文件日志中 file put contents filename log PHP EOL FILE APPEND LOCK EX 我将日志文件限制在 100Mb 以内此后将创建一个新文件因此我预计大
Celery 工作者和命令行参数

我正在重构我的代码以使用芹菜工人之前我曾经使用 argparse 来传递命令行参数 e g if name main parser argparse ArgumentParser description Node parser add a
我可以参数化空约束类型吗？

我有一个队列类它允许实例定义它对元素施加的约束例如优先级队列要求其元素是可排序的 LANGUAGE MultiParamTypeClasses ConstraintKinds FunctionalDependencies class
postgresql 与 jdbc 和存储过程（函数）：ResultSet

我只是尝试从服务器调用存储函数 getStat 如下所示 create type stat as type text location text number int create function getStat returns seto
提升线程取消

您可以像取消 pthread 一样取消 Boost Thread 吗我正在编写一个简单的看门狗以便在工作线程崩溃时终止它们并且似乎没有办法简单地取消 Boost Thread 库中的线程他们不支持取消这是一件好事因为它可能会导致
如何从AJAX事件中获取源元素？

我有一个表格其中的控件成行我想在输入更改时处理行中的其他元素
如何在调用和事件 VB.net 时传递附加参数

Public Event DocumentCompleted As WebBrowserDocumentCompletedEventHandler Dim arg As Object homeTeam guestTeam AddHandle
如何从 Windows 8 中的 MediaCapture API 获取反馈

我正在尝试在 Windows 8 应用程序中执行面部跟踪应用程序我知道为了访问相机流我必须使用MediaCapture AddEffectAsync 必须与 C 结合起来如图所示在这个样本中 http code msdn micros
为什么一些专业的网页设计师使用绝对路径而不是相对路径（例如 CSS、Javascript、图像等）？

我曾经认为每个人都使用相对路径例如 styles style css 但我想知道为什么一些受欢迎的网页设计师例如http www getfinch com http www getfinch com and http 31two com
使用 Visual Studio 2015 新模拟器调试 Cordova 应用程序 (android)

我不确定这是我在做一些愚蠢的事情还是只是在前沿我正在开发一个简单的 Cordova 应用程序但这是学术性的因为我可以使用标准的 Wizzard 生成默认应用程序重复此问题我让应用程序在 VS2013 上使用 Ripple 并偶尔在
将全局变量传递给函数

为什么下面的代码给我的是 0 而不是 1 我希望我的函数更改在函数外部声明的变量但我不想在函数声明中指定该变量 that 0 function go input input go that console log that 正如 Orio
从给定的物理和有效地址查找段地址

如何从给定的数据中找到段地址物理地址 0x119B 有效地址 0x10AB 公式可能是什么 x86 16位实模式下的有效地址只是20位的偏移量部分段偏移量 address https thestarman pcministry com
正则表达式 - 将数字与常量进行比较

如果我想匹配所有小于 2000 的数字我使用正则表达式 01 1 0 9 3 如果我想匹配 1 到 5 之间的所有数字我可以使用表达式 2 4 1 但是如果我想匹配 5 到 123 之间的所有数字怎么办有语法吗要匹配数字 gt 5
混合内容 - 不安全的样式表

在浏览器中我收到以下错误混合内容页面位于 https www website com https www website com 通过 HTTPS 加载但请求不安全的样式表 http fonts googleapis com css
使用自定义错误处理程序时如何从中止命令访问错误消息

使用 python Flask 服务器我希望能够使用 abort 命令抛出 http 错误响应并在正文中使用自定义响应字符串和自定义消息 app errorhandler 400 def custom400 error response
Python-LDAP 无法编译[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 所以我从源代码中获得了最新的 pyt
Django heroku 静态目录

我是 Heroku 的新手我尝试了一个没有 css 的简单 django 应用程序但我刚刚在我的应用程序中添加了一个 css 文件当我这样做时 git push heroku master 静态文件收集失败 gt Collecting
无论数据源如何，使用 Django/Django Rest Framework 验证和保存数据的正确过程是什么？

我有一个特定的模型我想对其执行自定义验证我想保证在创建新实例时始终存在至少一个标识符字段这样就不可能在没有这些字段之一的情况下创建实例尽管没有特别需要单独的字段 from django db import models class
Huggingface 分类与预测作斗争

我正在微调 longformer 然后使用进行预测TextClassificationPipeline and model inputs 方法我不确定为什么会得到不同的结果 import pandas as pd import datas

Huggingface 分类与预测作斗争

Huggingface 分类与预测作斗争 的相关文章

随机推荐

热门标签

Huggingface 分类与预测作斗争的相关文章