法研杯参赛总结：“抽取-生成”式长文本摘要

2023-11-17

©PaperWeekly 原创 · 作者｜苏剑林

单位｜追一科技

研究方向｜NLP、神经网络

“法研杯” [1] 算是近年来比较知名的 NLP 赛事之一，今年是第三届，包含四个赛道，其中有一个“司法摘要”赛道引起了我们的兴趣。经过了解，这是面向法律领域裁判文书的长文本摘要生成，这应该是国内第一个公开的长文本生成任务和数据集。过去一年多以来，我们在文本生成方面都有持续的投入和探索，所以决定选择该赛道作为检验我们研究成果的“试金石”。很幸运，我们最终以微弱的优势获得了该赛道的第一名。在此，我们对我们的比赛模型做一个总结和分享。

▲ 比赛榜单截图

在该比赛中，我们跳出了纯粹炼丹的过程，通过新型的 Copy 机制、Sparse Softmax 等颇具通用性的新方法提升了模型的性能。整体而言，我们的模型比较简洁有效，而且可以做到端到端运行。窃以为我们的结果对工程和研究都有一定的参考价值。

赛题分析

观察、分析任务数据是 NLP 的第一步，也是相当重要的一步，它关系到我们后面的模型选择，也关系到后面的提升方向。

1.1 统计信息

这次比赛官方共提供了 9484 个标注样本，以“（原文, 摘要）”这样的数据对形式出现，原训练数据还附带了其他的一些辅助标注信息，但为了模型的通用性，我们没有用这些辅助信息，所以我们的模型原则上适用于所有单条样本格式为“（原文, 摘要）”的监督式摘要任务。

下面是训练数据的一些统计信息：

1、总量：9484；

2、输入：平均字数 2568，字数标准差 1122，最大字数 13064，最小数字 866；

3、输出：平均字数 283，字数标准差 36，最大字数 474，最小数字 66；

4、指标：以词为单位的加权 Rouge。

因此，简单来说这大概就是一个“输入 3000 字、输出 300 字”的文本生成任务，其难度在于两千多的平均长度远远超出了我们平时处理的文本长度。

1.2 样本预览

▲ 法研杯2020司法摘要赛道样本演示

上图演示的是训练集的某个样本，其中上面是输入（裁判文书原文），下面是输出（人工标注的摘要），其中绿色部分标注的是两者的“最长公共子序列”。可以看到，输出跟输入是高度重合的。

1.3 建模思路

综合上述数据特性，我们不难想到应该采取“抽取+生成”相结合的方式进行摘要，并配合一些新方法来保证摘要的忠实程度与提升最终的效果。最终的模型笔者我们命名为 SPACES：

S：Sparse Softmax（新设计的 Softmax 替代品）；

P：Pretraiend Language Model（预训练模型）；

A：Abstractive（抽象式，即生成式）；

C：Copy Mechanism（新设计的 Copy 机制）；

E：Extractive（抽取式）；

S：Special Words（将特殊词添加到预训练模型）。

很显然，这是笔者“煞费苦心”强行拼凑的（捂脸），对应于本人博客的域名之一“spaces.ac.cn”。不过，上述缩写确实已经把我们的模型的主要技术点都罗列出来了。下面我们将仔细介绍 SPACES 为何物。

抽取模型

这一节我们将对抽取模型部分做一个简要介绍。抽取模型的思路是先通过规则将原始的生成式语料转化为序列标注式语料，然后用笔者常用的 DGCNN 模型来建模。

2.1 语料转换

首先，我们需要记住的是，抽取模型只是过程而不是结果，我们还要把抽取的结果送入到 Seq2Seq 模型优化。因此，抽取模型的原则是“求全”，即尽量把最终摘要所需要的信息覆盖到。为此，我们按照如下规则将原始训练语料转换为抽取式语料：

1、自行构建分句函数，使得句子的颗粒度更细；

2、人工摘要的每个句子，都在原文中匹配与之相似度最高的那个句子（可以重复匹配）；

3、将所有匹配到的原文句子作为抽取句子标签；

4、删掉部分匹配出来的句子，使得与人工摘要的 Rouge 得分最高。

注意，我们在最终模型中删掉了第 4 点，而它本来是我们最初版模型的默认选择。事实上，加上第 4 点有利于提高抽取模型的指标，但是综合生成模型后最终得分反而下降了。

这不难理解，生成模型本来有删改功能，而且比抽取模型做得更好；如果抽取模型意外地把本应该抽取的关键句子删掉了的话，那么生成模型就很难把它恢复出来了，从而导致性能下降。也就是说，第 4 点不满足抽取模型的“求全”原则，我们应该把删改工作教程生成模型来做，不应该放到抽取模型中。

2.2 指标问题

上述转换流程涉及到一个“相似度”的选择，根据前面的介绍，本次比赛选择“以词为单位的加权 Rouge”作为评测指标，因此我们可以直接选择这个加权 Rouge 作为相似度指标。事实上，我们一开始确实是这样做的，但是后来在调试的时候发现，这样并不是一个好的选择，我们最终选择的是“以字为单位的加权 Rouge”。

这两者有什么区别呢？对于以词为单位来算评测指标的做法，我们也不难理解其目的，就是为了使得专有名词能够完全匹配上。比如本来是“中华人民共和国未成年人保护法”，你预测成了“中华人民共和国文物保护法”，如果以字为单位的话，最长公共子序列为“中华人民共和国xxx保护法”，至少还是算对了大部分，但是如果以词为单位的话，两者就是不同的词，因此算全错。因此，以词为单位有利于专有名词匹配得更精准。

然而，以词为单位会带来一个严重的副作用，那就是降低了长词的权重。比如“根据《中华人民共和国未成年人保护法》的有关规定”中，核心词“中华人民共和国未成年人保护法”的权重仅为 1，剩下的“根据”、“《”、“》”、“的”等我们认为无关紧要的词权重分别都为 1，占了大部分，这样一来，模型宁愿去匹配“根据”、“《”、“》”、“的”等词，也不愿意去拟合核心词“中华人民共和国未成年人保护法”了。说白了，以词为单位的话，得分高的摘要未必是有什么关键信息的摘要。

那怎么调和两者呢？事实上，最好的方案应该还是以词为单位，但是算指标的时候，按照字数跟每个词加权，比如“中华人民共和国未成年人保护法”，匹配不上就给 0 分，匹配对了就给 14 分（因为有 14 个字）而不是 1 分才好。不过，这需要自己来实现 Rouge 计算函数，有点麻烦，我们最终是直接选择以字为单位来算加权 Rouge，这也勉强够用，因为在转换语料的时候，我们知道摘要和原文都是在描述同一件案子，因此基本不会出现“中华人民共和国未成年人保护法”预测成“中华人民共和国文物保护法”的情况。

2.3 模型结构

回到模型方面，我们使用的是以句为单位的序列标注模型作为抽取模型，句向量部分用“BERT+平均池化”来生成，并固定不变，标注模型主体方面则用 DGCNN 模型构建。关于 DGCNN 模型，请参考基于 CNN 的阅读理解式问答模型：DGCNN、开源一版 DGCNN 阅读理解问答模型（Keras版）[2] 、基于DGCNN和概率图的轻量级信息抽取模型等。

▲ SPACES的抽取模型示意图

值得指出的一个细节是，在训练抽取模型的时候，我们是以 0.3 为阈值做 EarlyStop 的，但最终以 0.2 为阈值构建生成模型的数据，依据还是前面说的抽取模型的原则是要“求全”。

2.4 输出数据

我们需要将原文作为输入，通过抽取模型输出抽取摘要，然后把抽取摘要作为生成模型的输入，来输出最终摘要。但是，这有一个问题，训练的数据我们都是见过的，但我们真正预测的是未见过的数据，如果直接训练一个抽取模型，然后用该模型抽取训练集的摘要，那么很明显由于都被训练过了，抽取出来的摘要分数肯定会偏高，而新样本的效果则会偏低，造成训练预测的不一致性。

这时候的解决方案就是交叉验证了。具体来说，我们将标注数据分为 n 份，其中 n-1 份训练抽取模型，然后用这个抽取模型预测剩下的那份数据的抽取摘要，如此重复 n 遍，就得到全部数据的抽取摘要，并且尽可能地减少了训练和预测阶段的不一致性。

生成模型

生成模型是我们投入主要时间的部分，也是我们的主要贡献点。生成模型就是一个Seq2Seq 模型，以抽取模型的输出结果作为输入、人工标注的摘要作为输出进行训练，我们可以理解为是对抽取结果做进一步的“润色”。

3.1 模型总览

如果用一张图概括我们的生成模型，那么大概如下：

▲ SPACES的生成模型示意图

接下来我们会介绍模型的各个模块。

3.2 基础架构

Seq2Seq模型依然选择了经典的UniLM（参考从语言模型到 Seq2Seq：Transformer 如戏，全靠 Mask），并且考虑到“输入+输出”的总长度基本上都超过 512 了，所以选择华为的 NEZHA 模型作为基础模型架构，因为 NEZHA 使用了相对位置编码，不限长度。

当然，这是当时的选择，现在的话我们至少还有如下两个选择：

1、参考层次分解位置编码，让 BERT 可以处理超长文本中的直接延拓绝对位置编码的做法，使得 BERT 有能力直接处理更长序列（理论上可达 26 万），自然也可以用于“BERT+UniLM”中；

2、使用那个屠榜的 T5 模型，现在可以在中文上玩玩了 [3] 的多国语言版 T5 模型（mT5），它用的也是相对位置编码，不限长度，但要注意 T5 用的 tokenizer 会将全角逗号转为半角逗号，这会导致评测分数下降。

此外，在使用预训练模型方面，我们首创地将部分词语加入到了 NEZHA 模型中，改变了中文预训练模型以字为单位的通用选择，这使得模型的效果和速度都有一定的提升。这部分结果已经发布在之前的文章提速不掉点：基于词颗粒度的中文 WoBERT [4] 之中，读者可以移步参考。

3.3 BIO Copy

Copy机制在摘要生成模型中并不新鲜，甚至可以说已经成为了生成式摘要的标配了。常规的 Copy 机制一般就是 PointerNet [5] 的做法，但这种做法有两个不足之处：1）每次只能 Copy 一个 token，不能保证 Copy 一个连续片段（n-gram）出来；2）实现起来比较复杂，不够即插即用。为此，我们构思了一种新型的 Copy 机制，暂时称为 BIO Copy，它实现起来非常简单，而且具有 Copy 连续片段的能力。

其实前面的图示已经展示了这种 Copy 机制，它其实就是在 Decoder 部分多加一个序列预测任务，即原来 Decoder 建模的是每个 Token 的分布，现在多预测一个标签分布，变为：

其中，含义如下：

B：表示该 token 复制而来；

I：表示该 token 复制而来且跟前面 Token 组成连续片段；

O：表示该 token 不是复制而来的。

那么，训练时 z 的标签哪里来呢？这里直接采用一种比较简单的方法：算摘要与原文的“最长公共子序列”，只要是出现在最长公共子序列的 token，都算是 Copy 过来的，根据 BIO 的具体含义设置不同的标签。比如前面图片中的例子，“我真的非常热爱我的祖国”与“我爱我的祖国”的最长公共子序列“我我的祖国”，其中第一个“我”是单字，标签为 B，后面“我的祖国”是一个连续片段，标签为“B I I”，其他标签为 O，所以总的标签为“B O B I I”。

所以，在训练阶段，其实就是多了一个序列预测任务，并且标签都是已知的，实现起来很容易，也不增加什么计算成本。至于预测阶段，对于每一步，我们先预测标签 z_t，如果 z_t 是 O，那么不用改变，如果 z_t 是B，那么在 token 的分布中 mask 掉所有不在原文中的 token，如果 z_t 是 I，那么在 token 的分布中 mask 掉所有不能组成原文中对应的 n-gram 的 token。也就是说，解码的时候还是一步步解码，并不是一次性生成一个片段，但可以通过 mask 的方式，保证 BI 部分位置对应的 token 是原文中的一个片段。

需要指出的是，Copy 机制的引入未必能明显提高分数，印象中好像只提升了 0.5% 左右，但是 Copy 机制可以保证摘要与原始文本的忠实程度，避免出现专业性错误，这在实际使用中是相当必要的。

3.4 稀疏Softmax

在这次比赛中，我们还发现了一个 Softmax 及交叉熵代替品，我们称之为 Sparse Softmax，我们发现 Sparse Softmax 可以在相当多的分类问题（包括常规分类问题和文本生成等）中替换掉 Softmax，并且效果能得到一定的提升。

Sparse Softmax的思想源于 From Softmax to Sparsemax: A Sparse Model of Attention and Multi-Label Classification [6]、Sparse Sequence-to-Sequence Models [7] 等文章，里边作者提出了将 Softmax 稀疏化的做法来增强其解释性乃至提升效果。但笔者嫌里边的设计太麻烦，于是自己想了一个更简单的版本：

其中是将从大到小排列后前 k 个元素的下标集合。说白了，我们提出的 Sparse Softmax 就是在计算概率的时候，只保留前 k 个，后面的直接置零，k 是人为选择的超参数，这次比赛中我们选择了 k=10。在算交叉熵的时候，则将原来的对全体类别操作，改为只对最大的 k 个类别进行，其中 t 代表目标类别。

为什么稀疏化之后会有效呢？我们认为这是因为避免了 Softmax 的过度学习问题。假设已经成功分类，那么我们有（目标类别的分数最大），此时我们可以推导原始交叉熵的一个不等式：

假设当前交叉熵值为，那么解得：

我们以为例，这时候，那么。也就是说，为了要 loss 降到 0.69，那么最大的 logit 和最小的 logit 的差就必须大于，当 n 比较大的时候，对于分类问题来说这是一个没有必要的过大的间隔，因为我们只希望目标类的 logit 比所有非目标类都要大一点就行，但是并不一定需要大那么多，因此常规的交叉熵容易造成过度学习而导致过拟合，而截断之后就不会有这个问题。

在这次比赛中，Sparse Softmax 带来的提升可能（没有细测）有 2% 左右！通过，我们私下还补充做了很多实验，包括 NLP 和 CV 的，发现它在大多数任务上都有 1% 的提升，所以非常欢迎大家尝试！不过，我们也发现，Sparse Softmax 只适用于有预训练的场景，因为预训练模型已经训练得很充分了，因此 finetune 阶段要防止过拟合；但是如果你是从零训练一个模型，那么 Sparse Softmax 会造成性能下降，因为每次只有 k 个类别被学习到，反而会存在学习不充分的情况（欠拟合）。

3.5 其他细节

在训练生成模型的时候，我们加入了 EMA（权重滑动平均），这能使得训练过程更加稳定，甚至可能提升模型效果。事实上，EMA 基本是笔者打比赛的标配，它能让我们省一些调试训练策略的心。

其外，在谈到 BIO Copy 机制时，我们说到理论上只需要在 Decoder 处新增一个 BIO 预测，不过在实际训练的时候，我们同时在 Encoder 和 Decoder 处都加了，我们发现这样能提升模型的最终效果。直观来想的话，起作用的原因应该是同时加的话增强了 Encoder 和 Decoder 之间的同步性，能够引导 Decoder 更精准地 Attention 到 Encoder 的合理的位置。

至于其他要补充的，还在想，想到了再补充吧。

代码开源

SPACES 模型的源码已经发布在 Github 上：

SPACECS：https://github.com/bojone/SPACES

使用说明在 Github 上也有介绍，这里就不重复了，有问题可以提 issue 或者留言。开源是技术进步的动力，在非利益相关的情况下，笔者会尽量做到开源，也鼓励大家开源。

可能有读者想看看当前的自动摘要能生成到什么程度了，这里演示一个例子吧（验证集的样本，无人工修改，第一行是原文，第二行是标准摘要，第三行是模型摘要，绿色部分是标准摘要与模型摘要的最长公共子序列）：

▲ 最终生成效果演示（一）

▲ 最终生成效果演示（二）

文章小结

本文总结了我们做法研杯司法摘要任务的经验，提出了一个名为 SPACES 的长文本摘要模型，它通过“先抽取后生成”的方式，结合了我们自研的 BIO Copy 机制、Sparse Softmax 等方法，最终可以得到比较靠谱的摘要结果，欢迎大家交流使用。

参考文献

[1] http://cail.cipsc.org.cn/

[2] https://kexue.fm/archives/6906

[3] https://kexue.fm/archives/7867

[4] https://kexue.fm/archives/7758

[5] https://arxiv.org/abs/1506.03134

[6] https://arxiv.org/abs/1602.02068

[7] https://arxiv.org/abs/1905.05702

更多阅读

#投稿通道#

让你的论文被更多人看到

如何才能让更多的优质内容以更短路径到达读者群体，缩短读者寻找优质内容的成本呢？答案就是：你不认识的人。

总有一些你不认识的人，知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁，促使不同背景、不同方向的学者和学术灵感相互碰撞，迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人，在我们的平台上分享各类优质内容，可以是最新论文解读，也可以是学习心得或技术干货。我们的目的只有一个，让知识真正流动起来。

???? 来稿标准：

• 稿件确系个人原创作品，来稿需注明作者个人信息（姓名+学校/工作单位+学历/职位+研究方向）

• 如果文章并非首发，请在投稿时提醒并附上所有已发布链接

• PaperWeekly 默认每篇文章都是首发，均会添加“原创”标志

???? 投稿邮箱：

• 投稿邮箱：hr@paperweekly.site

• 所有文章配图，请单独在附件中发送

• 请留下即时联系方式（微信或手机），以便我们在编辑发布时和作者沟通

????

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域，欢迎在公众号后台点击「交流群」，小助手将把你带入 PaperWeekly 的交流群里。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

法研杯参赛总结：“抽取-生成”式长文本摘要的相关文章

扬帆证券：三只松鼠去年扣非净利预增超1.4倍

在高端性价比战略驱动下三只松鼠 300783 重拾增势 1月15日晚间三只松鼠发布成绩预告预计2023年度净赢利为2亿元至2 2亿元同比增加54 97 至70 47 扣非后净赢利为1亿元至1 1亿元同比增速达146 9 至17
毕业设计- 基于深度学习的小样本时间序列预测算法 - Attention

目录前言课题背景与意义课题实现一数据集二设计思路三相关代码示例最后前言大四是整个大学期间最忙碌的时光一边要忙着准备考研考公考教资或者实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校
毕业设计：基于深度学习的微博谣言检测系统人工智能

目录前言设计思路一课题背景与意义二算法理论原理三检测的实现最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有
【毕业设计选题】复杂背景下的无人机(UVA)夜间目标检测系统 python 人工智能深度学习

前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有不少课题是研究生级别难度的对本科同学来说是充满挑战为帮助大家顺利通过和节省时间
无人机视角、多模态、模型剪枝、国产AI芯片部署

无人机视角多模态模型剪枝国产AI芯片部署是当前无人机技术领域的重要研究方向其原理和应用价值在以下几个方面进行详细讲述一无人机视角无人机视角是指在无人机上搭载摄像头等设备通过航拍图像获取环境信息并进行图像处理和分析这种技术
机器学习算法实战案例：BiLSTM实现多变量多步光伏预测

文章目录 1 数据处理 1 1 导入库文件 1 2 导入数据集 1 3 缺失值分析 2 构造训练数据
做大模型也有1年多了，聊聊这段时间的感悟！

自ChatGPT问世以来做大模型也有1年多了今天给大家分享这一年后的感悟过去一年应该是AI圈最万千瞩目的一年了大家对大模型 OpenAI ChatGPT AI Native Agent这些词投入了太多的关注以至于有一年的时间好像经
用通俗易懂的方式讲解：使用 LlamaIndex 和 Eleasticsearch 进行大模型 RAG 检索增强生成

检索增强生成 Retrieval Augmented Generation RAG 是一种结合了检索 Retrieval 和生成 Generation 的技术它有效地解决了大语言模型 LLM 的一些问题比如幻觉知识限制等随着 RAG
如何用GPT进行论文润色与改写？

详情点击链接如何用GPT GPT4进行论文润色与改写一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Ge
机器学习算法实战案例：Informer实现多变量负荷预测

文章目录机器学习算法实战案例系列答疑技术交流 1 实验数据集 2 如何运行自己的数据集 3 报错分析机器学习算法实战案例系
2023最新pytorch安装（超详细版）

前言一判断是否有Nvidia 英伟达显卡二 CPU版 2 1 安装Anaconda 2 2 创建虚拟环境 2 3安装pytorch 2 4 验证pytorch是否安装成功三 GPU版 3 1 安装Anaconda 3 2 创建虚拟环
AI帮助终结全球饥饿问题

全球饥饿问题是牵动人心的头等大事 5月28日是世界饥饿日这一问题更值得关注让人人都能吃饱的想法不仅令人向往而且很快就会变成现实与大多数新事物引进一样对于在控制世界粮食供应这样复杂的任务中AI究竟应该发挥多大的作用人们还踟蹰不前
【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 有无策略奖励 2 2 训练结果1
史上最全自动驾驶岗位介绍

作者自动驾驶转型者编辑汽车人原文链接 https zhuanlan zhihu com p 353480028 点击下方卡片关注自动驾驶之心公众号 ADAS巨卷干货即可获取点击进入自动驾驶之心求职交流技术交流群本
15天学会Python深度学习，我是如何办到的？

陆陆续续有同学向我们咨询 Python编程如何上手深度学习怎么学习如果有人能手把手一对一帮帮我就好了我们非常理解初学者的茫然和困惑大量视频书籍广告干扰了大家的判断学习Python和人工智能成为内行人不难为此我们推出了
【产品兼容认证】WhaleStudio 成功兼容TiDB数据库软件

平凯星辰和白鲸开源宣布成功完成产品兼容认证北京 2023年12月27日平凯星辰北京科技有限公司以下简称平凯星辰旗下的 TiDB 产品与白鲸开源的 WhaleStudio 已成功完成产品兼容性认证这一重要合作旨在为全球客户提供更
两个月进口猛增10倍，买近百台光刻机，难怪ASML不舍中国市场

据统计数据显示 2023年11月和12月中国从荷兰进口的光刻机设备同比猛增10倍进口金额超过19亿美元让ASML赚得盆满钵满 ASML早前表示中国客户在2023年订购的光刻机全数交付 2023年11月中国进口的光刻机达到42台进口金
实力认证！鼎捷软件荣膺“领军企业”和“创新产品”两大奖项

近日由中国科学院软件研究所中科软科技股份有限公司联合主办的 2023中国软件技术大会于北京成功举办本届大会以大模型驱动下的软件变革为主题数十位来自知名互联网公司和软件巨头企业的技术大咖不同领域行业专家畅销书作者等分享嘉宾
Making Large Language Models Perform Better in Knowledge Graph Completion论文阅读

文章目录摘要 1 问题的提出引出当前研究的不足与问题 KGC方法 LLM幻觉现象解决方案 2 数据集和模型构建
2023下半年软考「单独划线」合格标准公布

中国计算机技术职业资格网发布了关于2023年度下半年计算机软件资格考试单独划线地区合格标准的通告 2023下半年软考单独划线地区合格标准各科目均为42分 01 官方通告关于2023年度下半年计算机软件资格考试单独划线地区合格标准的通告

随机推荐

antd pro protable request请求有数据页面不渲染或postdata里的data一直是undefined

异常原因 protable的request请求默认的数据格式为 data pageSize 10 current 1 total 28 success true request请求如果返回的数据格式不是以上形式就会获取不到data page
STM32 DMA 应用之(二) DMA 串口数据传输--发送

一 DMA请求映像由此我们知道如果需要使用串口1的发送功能需要用到的是DMA1 Channel4 使用串口1的接收功能需要用到的是DMA1 Channel5 二怎样配置软件来使用DMA 把数据传到串口发送 1 配置dma 函数名称 Dm
vim退出时提示:q:未找到命令的解决办法

有一天我在WSL上快乐的用vim编游戏可就在我输入 q时 bash提醒我 q 未找到命令平常程序都在WSL上 cat不自动在行尾加换行违反了我的强迫症然后我就开始修理vim了然后我又试了 wq等等和q有关的命令甚至连 q都没问题
C#编程，.NTE调用java类、jar包方法

基本思路用C 实现调用Java编写的类中的方法重点是将Java编写的程序打包成Jar 然后使用开源工具IKVM将其转化成DLL控件在 NET环境下调用一使用IKVM NET组件首先到IKVM官网 http www ikvm ne
React学习（JSX+组件+state+表单）

React JSX 声明元素渲染元素组件练习 this props children PropTypes 默认值获取真实的DOM节点 this state 表单组件的生命周期例子 JSX JSX是一种JavaScript语法的拓
链式前向星存树图和遍历它的两种方法【dfs、bfs】

目录一链式前向星存图二两种遍历方法一链式前向星存图 n个点 n 1条边链式前向星把上面的树图存下来输入 9 代表要存进去n个点 1 2 下面是n 1条边每条边连接两个点 1 3 1 7 2 4 4 5 4 6 3 8 3
json-server在vscode终端运行文件报错

错误无法加载文件 D 因为在此系统上禁止运行脚本 json server 无法加载文件 D ruanjian nodejs node global json server ps1 因为在此系统上禁止运行脚本有关详细信息请参阅 htt
关于宝塔面板无法访问的解决方法

前言本篇文章主要介绍宝塔面板无法访问的几种情况以及如何解决正文 1 没有开放相应端口这种情况比较常见服务商默认情况下会将所有的端口关闭你需要使用哪个端口就得手动去打开这个端口例如 http 47 8888 adminuser 中
ubuntu如何开放22端口 ubuntu22端口开启

ubuntu开放22端口的操作步骤 1 打开终端命令行模式 2 依次输入以下命令进行开放22端口即可输入以下命令打开22端口 sudo ufw allow 22 重启防火墙使其生效即可 sudo ufw reload 附加 sudo ap
详解混合类型文件（Polyglot文件）的应用生成与检测

1 引入混合类型文件 Polyglot文件是指一个文件既可以是合法的A类型也可以是合法的B类型比如参考3中的文件是一个html文件可以用浏览器正常打开它也是一个一个 jar文件可以用JVM正常运行参考4 如下图所示这样
Spring源码：PropertyValues类及属性注入一

概要相关类属性注入概要 Spring获取Bean的实例时需要把配置的属性值解析到PropertyValues 然后填充入BeanWrapper中相关类 MutablePropertyValues类 PropertyValues接口
http://www.limodev.cn/blog/archives/category/gtk

The linux mobile development gt http www limodev cn blog 致力于基于linux的嵌入式系统的学习和研究包括内核驱动 GUI MMI 软件设计和优化等欢迎交换友情链接代码请到Pr
Docker实战-NFS安装

Docker安装 1 使用官方安装脚本自动安装 curl fsSL https get docker com bash s docker mirror Aliyun 2 启动 Docker 服务 systemctl start docker
Struts2框架详解（二）

Struts2结果页面配置全局结果页面场景多个action 有相同的方法返回值且都到同一个结果页面需求创建两个action 执行默认的方法execute方法让两个action的方法都返回success 返回success之后
Nerf 训练自有数据

1 拍摄序列图像放置在文件夹如duck images 2 使用colmap使用COLMAP获取相机位姿 1 参考官方文档安装colmap 2 使用win 可执行程序 3 点击 File 选择 new project 点击 New 在du
强化学习实现智能城市规划，清华团队最新成果登Nature子刊

由于城市地理空间的多样性和巨大的动作空间给城市布局用地和道路是一件非常复杂而困难的任务长久以来一直依靠人类规划师的经验和直觉如今城市规划领域也有了自己的AlphaGo 近日清华大学电子系城市科学与计算研究中心与建筑学院跨学科合作
eip系统服务器,eip系统

本词条缺少概述图补充相关内容使词条更完整还能快速升级赶紧来编辑吧 eip系统是以数据为基础应用为核心以实现业务及业务流程的自动化为目的多功能企业信息平台中文名 eip系统基础数据性质多功能企业信息平台方法把不同系
二货小易有一个W*H的网格盒子 JAVA

import java util public class Main public static void main String args Scanner sc new Scanner System in int w sc nextInt
VS2017调试unity没有解决方案

1 VS2017之前的版本调试unity 需要下载 Visual Studio Tools for Unity 2 VS2017内置了Visual Studio Tools for Unity 3 首先打开帮助 gt 关于已安装程序中查
法研杯参赛总结：“抽取-生成”式长文本摘要

PaperWeekly 原创作者苏剑林单位追一科技研究方向 NLP 神经网络法研杯 1 算是近年来比较知名的 NLP 赛事之一今年是第三届包含四个赛道其中有一个司法摘要赛道引起了我们的兴趣经过了解这是面向法律领域裁

法研杯参赛总结：“抽取-生成”式长文本摘要

法研杯参赛总结：“抽取-生成”式长文本摘要 的相关文章

随机推荐

热门标签

法研杯参赛总结：“抽取-生成”式长文本摘要的相关文章