【深度学习

2023-11-06

文章目录

一、前言
二、Computer vision
三、NLP

一、前言

Transformers 是用于自然语言处理 (NLP)、计算机视觉以及音频和语音处理任务的预训练最先进模型库。该库不仅包含 Transformer 模型，还包含非 Transformer 模型，例如用于计算机视觉任务的现代卷积网络。

pipeline()可以加载多个模型让进行推理变得简单，即使没有使用特定模态的经验或不熟悉模型背后的底层代码，仍然可以使用它们通过pipeline()进行推理。

二、Computer vision

2.1 Image classification

从一组预定义的类中标记图像。

from transformers import pipeline
classifier = pipeline(task="image-classification")
preds = classifier(
    "https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/pipeline-cat-chonk.jpeg"
)

preds = [{"score": round(pred["score"], 4), "label": pred["label"]} for pred in preds]

输出结果为：

{'score': 0.4335, 'label': 'lynx, catamount'}
{'score': 0.0348, 'label': 'cougar, puma, catamount, mountain lion, painter, panther, Felis concolor'}
{'score': 0.0324, 'label': 'snow leopard, ounce, Panthera uncia'}
{'score': 0.0239, 'label': 'Egyptian cat'}
{'score': 0.0229, 'label': 'tiger cat'}

2.2 Object detection

目标检测识别图像对象以及对象在图像中的位置。

from transformers import pipeline
detector = pipeline(task="object-detection")
preds = detector(
    "https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/pipeline-cat-chonk.jpeg"
)

preds = [{"score": round(pred["score"], 4), "label": pred["label"], "box": pred["box"]} for pred in preds]

输出结果为：

[{'score': 0.9865,
  'label': 'cat',
  'box': {'xmin': 178, 'ymin': 154, 'xmax': 882, 'ymax': 598}}]

2.3 Image segmentation

图像分割是一项像素级任务，它将图像中的每个像素分配给一个类别。

from transformers import pipeline
segmenter = pipeline(task="image-segmentation")
preds = segmenter(
    "https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/pipeline-cat-chonk.jpeg"
)

preds = [{"score": round(pred["score"], 4), "label": pred["label"]} for pred in preds]

输出结果为：

{'score': 0.9879, 'label': 'LABEL_184'}
{'score': 0.9973, 'label': 'snow'}
{'score': 0.9972, 'label': 'cat'}

2.4 Depth estimation

预测图像中每个像素与相机的距离。

from transformers import pipeline
depth_estimator = pipeline(task="depth-estimation")
preds = depth_estimator(
    "https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/pipeline-cat-chonk.jpeg"
)

三、NLP

3.1 Text classification

从一组预定义的类中标记一系列文本。

from transformers import pipeline
classifier = pipeline(task="sentiment-analysis")
preds = classifier("Hugging Face is the best thing since sliced bread!")

3.2 Token classification

为每个token分配定义类别中的标签。

from transformers import pipeline
classifier = pipeline(task="ner")
preds = classifier("Hugging Face is a French company based in New York City.")

3.3 Question answering

返回问题的答案，有时有上下文（开放域），有时没有上下文（封闭域）。

from transformers import pipeline
question_answerer = pipeline(task="question-answering")
preds = question_answerer(
    question="What is the name of the repository?",
    context="The name of the repository is huggingface/transformers",
)

3.4 Summarization

从较长的文本创建较短的版本，同时试图保留原始文档的大部分含义。

from transformers import pipeline
summarizer = pipeline(task="summarization")
summarizer(
    "In this work, we presented the Transformer, the first sequence transduction model based entirely on attention, replacing the recurrent layers most commonly used in encoder-decoder architectures with multi-headed self-attention. For translation tasks, the Transformer can be trained significantly faster than architectures based on recurrent or convolutional layers. On both WMT 2014 English-to-German and WMT 2014 English-to-French translation tasks, we achieve a new state of the art. In the former task our best model outperforms even all previously reported ensembles."
)

3.5 Translation

将一种语言的转换为另一种语言。

from transformers import pipeline
text = "translate English to French: Hugging Face is a community-based open-source platform for machine learning."
translator = pipeline(task="translation", model="t5-small")

3.6 Language modeling

3.6.1 预测序列中的下一个单词

from transformers import pipeline
prompt = "Hugging Face is a community-based open-source platform for machine learning."
generator = pipeline(task="text-generation")

3.6.2 预测一个序列中的一个被屏蔽的token

text = "Hugging Face is a community-based open-source <mask> for machine learning."
fill_mask = pipeline(task="fill-mask")

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

计算机视觉

自然语言处理

深度学习

Transformer

【深度学习的相关文章

GinCMS 使用golang Gin框架xorm开发的小型内容管理系统

系统介绍服务器端使用GoLang 基于Gin框架 MySQL数据库用到的组件xorm 前端展示使用基于LayUI的layuicms 用到的第三方组件authtree treeTable GinCMS是我学习golang 使用Gin开
hdu 1210 Eddy's 洗牌问题

题目连接 http acm hdu edu cn showproblem php pid 1210 题目思路很简单只要保证1在第一个位置的时候就说明牌的顺序达到要求输出M就可以了代码 include
Unity3d——UI（血条制作）

血条 Health Bar 制作具体要求如下分别使用 IMGUI 和 UGUI 实现使用 UGUI 血条是游戏对象的一个子元素任何时候需要面对主摄像机分析两种实现的优缺点 IMGUI 效果图血条红色不是很明显为了显示IMGUI

随机推荐

python包安装相关-conda，pip-虚拟环境

运行python的时候一定要注意当前运行所在环境位置环境位置不同包含的依赖包是不同的然后不注意的话就是出很多莫名其妙的问题比如一个pycharm里面不能运行的东西命令行又能运行啥的 PIP使用的一些点 pip安装包的时候加上后缀
7.4.3-elasticsearch索引字段类型参数

fielddata 大多数字段默认情况下都会建立索引方便查询但是针对排序聚合以及脚本访问字段值则需要另外的访问方式查询操作需要回答哪些doc包含查询的词而排序和聚合则需要回答 doc中该字段的值是多少大多数字段可以通过文档索引在
linux grep命令

1 作用 Linux系统中grep命令是一种强大的文本搜索工具它能使用正则表达式搜索文本并把匹配的行打印出来 grep全称是Global Regular Expression Print 表示全局正则表达式版本它的使用权限是所有用户
maven中mirror镜像和repository仓库配置

maven仓库和镜像配置 1 名词解释 2 reportsitory仓库配置 3 mirror镜像配置 4 mirror与reporsitory 4 1 mirror与reporsitory的关系 4 2 mirrorOf的作用 1 名词解
Deveco studio 鸿蒙app访问网络详细过程（js）

目录效果图安装IDE工具Deveco studio 创建项目项目配置编辑功能开发效果图话不多说上效果安装IDE工具Deveco studio 下载地址 HUAWEI DevEco Studio和SDK下载和升级 Harmo
vue2如何使用element ui快速搭建自己的前端页面

文章目录前言一 element ui是什么二使用步骤 1 在项目中引入 element ui 2 全局引入 element ui 组件 3 局部引入 element ui 组件 4 使用组件前言 element ui 是一款非常好
使用pyecharts绘制系统依赖关系图

使用pyecharts绘制系统依赖关系图背景介绍近期梳理了公司内部系统之间的数据关系得到了多个excel格式的统计文件每个文件包含了该系统自身数据清单依赖的其他系统的数据清单对其他系统供应的数据清单各系统之间依赖关系复杂所以
【Tomcat】Tomcat配置ssl证书

记一次因各种需求在Linux中配置tomcat的https自签发证书过程 SSL证书简介 1 公开可信认证机构例如CA 但是申请一般是收费的一般几百到几千一年在这里可以给你们介绍一下腾讯云截止到目前还有免费一年的CA证书服务可以用一
第三方服务器不在响应,服务器是怎样响应请求的？

小弟最近在改后端项目但出了个 bug 又解决不了我觉得是我的后端知识太欠缺了特来这里请教流程是这样的前端有上送信息接口收到信息后用收到的部分信息再去第三方接口请求信息把两部分合起来存储收到的信息中有一部分是用户ID 绝不重
Java: StringBuffer类的运用

字符串的学习不比其他数据类型的学习不管是对对象对象的实体属性等的打印还是在平常所有可以展示出来供我们进行参考的数据内容共同点就是它们都是 string 字符串都是一种字符串文本而且在对一些我们所想表达的数据的提交和获取时都
DBA的一些职责

1 DBA的一些职责安装和升级数据库服务器如Oracle Microsoft SQL server 以及应用程序工具数据库设计系统存储方案并制定未来的存储需求计划一旦开发人员设计了一个应用就需要DBA来创建数据库存储结构 tab
DNN结构：CNN、LSTM/RNN中的Attention结构

前言 attention作为一种机制有其认知神经或者生物学原理注意力的认知神经机制是什么如何从生物学的角度来定义注意力大多数attention gating 技巧都可以直接加入现有的网络架构通过合理设计初始化和训练步骤也可以利用现
Linux--写时拷贝、内存管理

目录 1 内存管理 2 写时拷贝技术 1 内存管理简单分页逻辑页物理页页表将虚拟内存空间和物理内存空间划分为大小相同的页面 4k 8k 16k等虚拟内存在磁盘上划分一块空间为什么要有逻辑页面和物理页面物理页面很长不能确定
ubuntu 设置网络代理

Ubuntu下通过终端设置网络代理以便apt get等命令可以正常使用只需在终端里设置http proxy系统变量即可 plain export http proxy http usr name usr password ipaddre
华为云交付项目服务器配置表,云服务器设备配置列表

云服务器设备配置列表内容精选换一换当您在华为云上部署了弹性云服务器以及其他云服务想在关联VPC内通过内网域名实现互访可以为弹性云服务器配置内网域名解析内网域名可以随意创建无需注册只需要保证VPC内唯一本操作以为弹性云服务器
JavaScript设计模式——工厂模式

在介绍工厂模式之前首先我们要理解一下什么是设计模式什么是设计原则设计模式通常在我们解决问题的时候很多时候不是只有一种方式我们通常有多种方式来解决但是肯定会有一种通用且高效的解决方案这种解决方案在软件开发中我们称它为设计模式
字符串的截取

第二个开始截取 String orderArr1 order substring order indexOf order indexOf 1 最后一个开始截取 String orderArr1 order substring order
iOS如何提高tableView的性能

a 重用cell 我们都知道申请内存是需要时间特别是在一段时间内频繁的申请内存将会造成很大的开销而且上tebleView中cell大部分情况下布局都是一样的这个时候我们可以通过回收重用机制来提高性能 b 避免content的重新布局
webservice 安全认证请求头信息

java import java io IOException import java util Enumeration import javax servlet Filter import javax servlet FilterChai
【深度学习

文章目录一前言二 Computer vision 2 1 Image classification 2 2 Object detection 2 3 Image segmentation 2 4 Depth estimation 三

【深度学习

文章目录

一、前言

二、Computer vision

2.1 Image classification

2.2 Object detection

2.3 Image segmentation

2.4 Depth estimation

三、NLP

3.1 Text classification

3.2 Token classification

3.3 Question answering

3.4 Summarization

3.5 Translation

3.6 Language modeling

3.6.1 预测序列中的下一个单词

3.6.2 预测一个序列中的一个被屏蔽的token

【深度学习 的相关文章

随机推荐

热门标签

【深度学习的相关文章