BART 文本摘要示例

2023-11-14

采用BART进行文本摘要

首先从transformers library导入BartTokenizer进行分词, 以及BartForConditionalGeneration进行文本摘要

from transformers import BartTokenizer, BartForConditionalGeneration 

这里,bart-large-cnn 是预训练的BART模型,模型大小约为1.6G(下载时间可能较慢,需耐心等待进度条).

model = BartForConditionalGeneration.from_pretrained('facebook/bart-large-cnn')
tokenizer = BartTokenizer.from_pretrained('facebook/bart-large-cnn')

在这里插入图片描述

text = """We have created a large diverse set of cars from overhead
images, which are useful for training a deep
learner to binary classify, detect and count them. The dataset and all
related material will be made publically available. The set contains contextual
matter to aid in identification of difficult targets.We demonstrate
classification and detection on this dataset using a neural network we call
ResCeption. This network combines residual learning with Inceptionstyle
layers and is used to count cars in one look. This is a new way
to count objects rather than by localization or density estimation. It is
fairly accurate, fast and easy to implement. Additionally, the counting
method is not car or scene specific. It would be easy to train this method
to count other kinds of objects and counting over new scenes requires no
extra set up or assumptions about object locations"""
text = '''
2008年凭借歌曲《青花瓷》获得第19届金曲奖最佳作曲人奖。2009年入选美国CNN评出的“25位亚洲最具影响力人物” ,
同年凭借专辑《魔杰座》获得第20届金曲奖最佳国语男歌手奖。2010年入选美国《Fast Company》评出的“全球百大创意人物” 。
2011年凭借专辑《跨时代》再度获得金曲奖最佳国语男歌手奖,并且第四次获得金曲奖最佳国语专辑奖;同年主演好莱坞电影《青蜂侠》。
2012年登福布斯中国名人榜榜首。2014年发行华语乐坛首张数字音乐专辑《哎呦,不错哦》。2016年发行专辑《周杰伦的床边故事》
'''

对长文本进行分词

inputs = tokenizer([text], max_length=1024, return_tensors='pt')

利用预训练BART模型产生这段长文本摘要的数字索引

summary_ids = model.generate(inputs['input_ids'], num_beams=4, max_length=100, early_stopping=True)

将获取的数字索引在字典中查找,并输出对应的单词

summary = ([tokenizer.decode(i, skip_special_tokens=True, clean_up_tokenization_spaces=False) for i in summary_ids])

将获取的摘要打印出来

print(summary)

在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

BART 文本摘要示例 的相关文章

随机推荐

  • UI系统——作业与练习

    血条 Health Bar 的预制设计 具体要求如下 分别使用 IMGUI 和 UGUI 实现 使用 UGUI 血条是游戏对象的一个子元素 任何时候需要面对主摄像机 分析两种实现的优缺点 给出预制的使用方法 IMGUI制作血条 using
  • easy-excel批量导出数据

    easy excel批量导出 前言 最近遇到个用户数据批量导出excel的需求 第一次看到这个需求大家第一时间想到的应该大多都是easy excel这个框架吧 哈哈 我第一时间想到的也是这个框架 但是对于少量的数据 比如有10个用户这样的数
  • 项目一 计算器

    目录 学习目标 1 1准备工作 1 1 1搭建QT开发环境 1 2用户界面UI设计 1 2 1显示模块 1 2 2按键模块 1 3功能实现 1 3 1输入输出反馈 1 3 2退格与清除功能 1 3 3浏览历史记录与历史记录清除功能 1 3
  • Matlab第二版(本科教学版)

    matlab程序 数字图像处理第二版 本科教学版 第七章 图像分割 注 代码原因 程序源码中笑脸 符合都为 例7 1 点检测 程序源码 f imread D photo DIP3E CH05 Original Images Fig0524
  • 语音特征公式与python实现

    参考pyAudioAnalysis openSmile以及语音信号处理实验教程 MATLAB源代码 Introduction to Audio Analysis A Matlab Approach 完整测试文件 注意 以下代码不在genFe
  • uboot下载与安装

    uboot下载 uboot的下载链接 Index of pub u boot denx de uboot安装 这里使用uboot 2012 04 01版本 配合韦东山的s3c2440开发板做实验 如下图 tar zvfx u boot 20
  • linux入门学习(3权限管理)

    权限管理 一 文件或目录的权限查看 1 文件权限的查看 两种查看文件详细信息的方法 ls l file 查看file文件的详细信息 如果是目录 则是查看该目录下的所有子文件的详细信息 ls ld dir 查看dir目录的详细信息 2 文件权
  • STM32串口环形队列

    一 环线队列 在设计串口驱动的过程中 要遵循的两条准则是 1 尽量的减少程序运行的时间 2 尽量的减少程序所占用的内存 单片机相对于电脑来说 单片机的储存空间和电脑的存储空间根本不是一个量级 电脑并不用过多考虑内存的多少 而单片机就需要考虑
  • NodeMCU ESP8266使用温湿度传感器SHT31的方法

    温湿度传感器有各种各样的型号 例如DHT11和HTU21D 但是 由于精度和灵敏度等参数 它们都不适合工业级温度和湿度监测 它们的准确性和灵敏度均较差 因此 本文中我们将使用SHT31温度 湿度传感器 它们是您可以获得的最好和最高精度的器件
  • 尚硅谷2021最新Git教程笔记

    笔记根据网课5h打通Git全套教程丨2021最新IDEA版 与自己操作整理 尚硅谷2021最新Git教程笔记 1 Git概述 1 1 何为版本控制 1 2 为什么需要版本控制 1 3 版本控制工具 1 4 Git简史 1 5 Git工作机制
  • 多线程的同步与互斥——读者写者模型

    在读者写者模型中 同样有 一二三 一个交易场所 两种角色 三种关系 在读者写着模型中 读者与读者之间是共享的关系 因为并没有改变资源 所以不需要互斥 写者与写者之间是互斥的关系 读者与写者之间是同步与互斥的关系 那么如何实现这么复杂的关系呢
  • 前端面试题(一)

    目录 一 解答题 1 样式表以及选择器的优先级 权重 2 浮动特点 3 元素 标签 类型的分类 4 水平垂直居中方法集锦 5 定位模式和定位的特点 6 画个三角形 7 BFC 块级格式化上下文 的特点和触发规则 8 宽高自适应 9 什么是高
  • C语言 一维数组

    一维数组的存储 一维数组在内存中是一段连续的存储区域 格局如下 验证代码如下 include
  • 如何自己开发一个Android APP(6)——程序与操作系统合作

    系统的事件处理 响应系统设置的事件Configuration类 获取系统的Configuration对象 Configuration cfg getResources getConfiguration Configuration类的常用方法
  • JavaScript函数七重关之函数定义

    JavaScript函数七重关的第一关是函数定义 函数定义需要用到function关键字 function myFunction 函数体 document write hello javascrept br 这是函数定义的第一种方法 也可以
  • Cisco Packet Tracer中配置DHCP服务器

    转载于 https blog csdn net qq 41745698 article details 85019218 DHCP介绍 DHCP Dynamic Host Configuration Protocol 动态主机配置协议 通常
  • 感谢CSDN平台记录了我6年的点点滴滴

    感谢CSDN平台记录了我6年的点点滴滴 我的新博客如下 博客园https www cnblogs com ztguang
  • Mysql基本语法

    1 创建数据库 CREATE DATABASE语句用于创建一个新的数据库 语法是 SQL gt CREATE DATABASE DATABASE NAME 例子 创建一个名为 EXAMPLE 数据库 SQL gt CREATE DATABA
  • uni-app this 传递的问题

    最近在使用uni app做个小程序的尝试 因为很久没有做前端了 对这块有点陌生了 毕竟这个和之前的 web的还是有点区别的 上传logo的一个小功能 想法是上传之后 用临时文件替换src的值
  • BART 文本摘要示例

    采用BART进行文本摘要 首先从transformers library导入BartTokenizer进行分词 以及BartForConditionalGeneration进行文本摘要 from transformers import Ba