`enforce_stop_tokens` 如何在 LangChain 中与 Huggingface 模型一起工作？

2024-04-08

当我们查看 HuggingFaceHub 模型的使用情况时langchain有这部分作者不知道如何停止生成，https://github.com/hwchase17/langchain/blob/master/langchain/llms/huggingface_pipeline.py#L182 https://github.com/hwchase17/langchain/blob/master/langchain/llms/huggingface_pipeline.py#L182:

class HuggingFacePipeline(LLM):
        ...
    def _call(
        ...
        if stop is not None:
            # This is a bit hacky, but I can't figure out a better way to enforce
            # stop tokens when making calls to huggingface_hub.
            text = enforce_stop_tokens(text, stop)
        return text

我应该使用什么来将停止标记添加到模板的末尾？

如果我们看一下https://github.com/hwchase17/langchain/blob/master/langchain/llms/utils.py https://github.com/hwchase17/langchain/blob/master/langchain/llms/utils.py，它只是一个正则表达式分割，根据停用词列表分割输入字符串，然后取第一个分区re.split

re.split("|".join(stop), text)[0]

让我们尝试从 Huggingface 模型获取生成输出，例如

from transformers import pipeline
from transformers import GPT2LMHeadModel, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained('gpt2')
model = GPT2LMHeadModel.from_pretrained('gpt2')

generator = pipeline('text-generation', model=model, tokenizer=tokenizer)
output = generator("Hey Pizza! ")
output

[out]:

[{'generated_text': 'Hey Pizza! 」\n\n「Hurry up, leave the place! 」\n\n「Oi! 」\n\nWhile eating pizza and then, Yuigahama came in contact with Ruriko in the middle of the'}]

如果我们应用re.split:

import re
def enforce_stop_tokens(text, stop):
    """Cut off the text as soon as any stop words occur."""
    return re.split("|".join(stop), text)[0]

stop = ["up", "then"]
text = output[0]['generated_text']

re.split("|".join(stop), text)

[out]:

['Hey Pizza! 」\n\n「Hurry ',
 ', leave the place! 」\n\n「Oi! 」\n\nWhile eating pizza and ',
 ', Yuigahama came in contact with Ruriko in the middle of the']

但这没有用，我想在一代结束时分裂。我可以使用哪些令牌来“enforce_stop_tokens”？

您可以通过将 eos_token_id 设置为停止项来做到这一点——在我的测试中，它似乎适用于列表。参见下文：正则表达式截断停用词，eos_token_id 在停用词之后截断（“once Upon a time”与“once Upon a”）


from transformers import GPT2LMHeadModel, GPT2Tokenizer
import regex as re

tokenizer = GPT2Tokenizer.from_pretrained('gpt2')
model = GPT2LMHeadModel.from_pretrained('gpt2')

# Define your custom stop terms
stop_terms = [ "right", "time"]

# Ensure the stop terms are in the tokenizer's vocabulary
for term in stop_terms:
    if term not in tokenizer.get_vocab():
        tokenizer.add_tokens([term])
        model.resize_token_embeddings(len(tokenizer))

def enforce_stop_tokens(text, stop):
    """Cut off the text as soon as any stop words occur."""
    return re.split("|".join(stop), text)[0]

# Get the token IDs for your custom stop terms
eos_token_ids_custom = [tokenizer.encode(term, add_prefix_space=True)[0] for term in stop_terms]

# Generate text
input_text = "Once upon "
input_ids = tokenizer.encode(input_text, return_tensors='pt')
output_ids = model.generate(input_ids, eos_token_id=eos_token_ids_custom, max_length=50)

# Decode the output IDs to text
generated_text = tokenizer.decode(output_ids[0], skip_special_tokens=True)

print(generated_text) # Once upon a time

print("ENFORCE STOP TOKENS")

truncated_text = enforce_stop_tokens(generated_text, stop_terms)

print(truncated_text) # Once upon a

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

`enforce_stop_tokens` 如何在 LangChain 中与 Huggingface 模型一起工作？的相关文章

我可以通过在 Android Activity 中声明适当的成员“静态”来提高效率吗

如果一个 Activity 在实践中是单例我认为我可以通过声明适当的成员静态来获得一些效率且风险为零是的 The Android 文档说 http developer android com guide topics fundam
Spark scala 模拟 Spark.implicits 用于单元测试

当尝试使用 Spark 和 Scala 简化单元测试时我使用 scala test 和mockito scala 以及mockito Sugar 这只是让你做这样的事情 val sparkSessionMock mock SparkSes
mybatis：使用带有 XML 配置的映射器接口作为全局参数

我喜欢使用 XML 表示法来指定全局参数例如连接字符串我也喜欢 Mapper 注释当我尝试将两者结合起来时我得到这个例外 https stackoverflow com questions 4263832 type interfac
如何在连接到 Heroku PostgreSQL 的 Flask 应用程序上处理更多并发用户？

Heroku 上的 Flask API 有许多端点它们在将 json 化结果返回给客户端之前在我的 Heroku PostgreSQL 数据库上运行查询我当前的计划是 Hobby Basic 层因此数据库最多只能处理 20 个连接如
Jquery 以编程方式更改
文本

编辑解决方案是将其添加到个人资料页面而不是性别页面 profile live pageinit function event p pTest text localStorage getItem gender 我在列表视图中有一个带有一些文
将客户端库添加到 Razor 类库

我正在学习 Blazor 我注意到创建 Razor 类库是一个很好的做法您将在其中定义大部分组件这样您就可以在客户端或服务器中使用它们而不会出现太多问题在不同的框架中我习惯于以 SASS 形式包含库作为引导程序这样我就可以在我的
区分 NaN 输入和输入类型为“number”的空输入

我想使用 type number 的表单输入并且只允许输入数字
如何将 SQLite 数据库捆绑到 Go 二进制文件中？

我尝试使用 go bindata 和 packr 但这些包没有显示如何将 SQLite 数据库文件打包到二进制文件中我不需要以任何方式更新数据库我只想在启动时从中读取数据如何将 SQLite 数据库文件嵌入到 Go 二进制文件中 SQ
在DialogFragment中，onCreate应该做什么？

我目前正在摆弄 DialogFragment 以学习使用它我假设相比onCreateView onCreate 可以这样做 public void onCreate Bundle savedInstanceState super onCr
如何通过点击复制 folium 地图上的标记位置？

I am able to print the location of a given marker on the map using folium plugins MousePosition class GeoMap def update
使用溢出支持定位粘性填充材料[重复]

这个问题在这里已经有答案了我在用position sticky在我的应用程序中在使用overflow属性来显示滚动条我已经寻找了一个确实支持这种情况的polyfill 但到目前为止没有任何运气有谁知道这样的polyfill shim
如何禁用 solr 管理页面

对于生产来说拥有一个甚至不要求登录凭据的 solr 管理员感觉不安全如何禁用默认的 solr 管理页面我只是希望我的 web 应用程序使用 Solr 进行搜索词索引我强烈建议保留管理页面用于调试目的它在很多情况下拯救了我有多种方
进程被杀死后不会调用 onActivityResult

我有一个主要活动 Main 和另一个活动 Sub 由 Main 调用 startActivityForResult new Intent this SubActivity class 25 当我在 Sub 时我终止该进程使用任务管理器或
在成为FirstResponder或resignFirstResponder的情况下将对象保持在键盘顶部？

我目前在键盘顶部有一个 UITextField 当您点击它时它应该粘在键盘顶部并平滑地向上移动我不知道键盘的具体时长和动画类型所以确实很坎坷这是我所拥有的 theTextView resignFirstResponder UIVie
水平和垂直居中 div 位于页面中间，页眉和页脚粘在页面顶部和底部

我正在尝试制作一个具有固定高度页眉和页脚的页面页眉位于屏幕顶部 100 宽度页脚位于底部 100 宽度我想将一个具有可变高度内容的 div 居中放置在页眉和页脚之间的空间中在下面的 jsfiddle 中如果内容比空格短它会起作用
java中void的作用是什么？

返回类型方法返回值的数据类型如果方法不返回值则返回 void http download oracle com javase tutorial java javaOO methods html http download oracle
是否可以使用 Dapper 流式传输大型 SQL Server 数据库结果集？

我需要从数据库返回大约 500K 行请不要问为什么然后我需要将这些结果保存为 XML 更紧急并将该文件通过 ftp 传输到某个神奇的地方我还需要转换结果集中的每一行现在这就是我正在做的事情 TOP 100结果使用 Dappe
对象指针值作为字典的键

我想使用对象的引用值作为字典的键而不是对象值的副本因此我本质上想在字典中存储与另一个对象的特定实例关联的对象并稍后检索该值这可能吗是不是完全违背了NSDictionary的理念我可以看出我可能以错误的方式处理这个问题因为字典
通过 Telnet 运行应用程序

我需要创建一个 BAT 文件来通过 telnet 运行应用程序但据我所知在 DOS 上无法执行此操作 Telnet 不允许在连接的瞬间向远程计算机发送任何命令并且 BAT 文件中的每个后续命令只有在 telnet 停止后才会执行这段
R data.table 1.9.2 关于 setkey 的问题

这似乎是 1 8 10 后引入的一个错误与包含列表的 DT 的 setkey 相关运行下面两个代码来查看问题 library data table dtl lt list dtl 1 lt data table scenario 1 p

随机推荐

MongoDB 连接被对等方重置

我研究过其他解决方案例如 Mongodb 连接被对等方重置 https stackoverflow com questions 2961648 mongodb connection reset by peer Mongodb 自动重新连接
如何将 Facebook 聊天工具添加到 Next.js？

我尝试在 Next js 应用程序中添加 Facebook 客户聊天但不起作用我找不到我的代码有任何问题如何在我的 Next js 应用程序中添加 Facebook 客户聊天我的代码有什么错误吗有更好的实现来解决这个问题吗这是我
如何从控制器返回 JavaScript？

我正在处理 ASP NET Core 2 2 项目需要从控制器返回 JavaScript 但是我怀疑没有直接的方法因此我遵循this https stackoverflow com a 42698821 4753489操作系统回答并
错误：未定义无法解析模块`@react-navigation/bottom-tabs`

一直在寻找有关导航错误模块的解决方案我尝试过重置缓存删除 nodu modules 重新安装模块但仍然无法正常工作错误的完整详细信息 Unable to resolve module react navigation native
使用 Interface Builder 在 nib 中设计 UICollectionView 单元格（无故事板）

我正在尝试设计一个定制的UICollectionViewCell原型在 Xcode 5 0 2 中但是 Interface Builder 不允许我向我的UICollectionView在设计笔尖时如果我使用故事板我可以设置项目单
指向具有不同参数的成员函数的指针的容器

我到处寻找现代 C 设计和合作但我找不到一种好方法来存储一组接受不同参数并对不同类进行操作的回调我需要这个因为我希望应用程序的每个对象都有可能将其方法之一的执行推迟到主对象Clock对象跟踪当前时间可以在正确的时刻调用此方法我
类型错误：names_to_saveables 必须是将字符串名称映射到张量/变量的字典

我正在尝试使用 freeze graph py 转换 MobileNet 0 50 的重新训练版本这是我的代码 python m tensorflow python tools freeze graph input checkpoint
DB 连接关闭后从 Oracle DB 读取 CLOB

在我正在查看的 Java 类之一中我看到以下代码 private oracle sql CLOB getCLOB oracle sql CLOB xmlDocument null CallableStatement cstmt null
php - 输出值到屏幕中间循环

在长 foreach 循环期间是否可以将任何内容输出到屏幕每当我执行一个需要很长时间的循环时在循环完全完成之前屏幕上不会输出任何内容即使 echo 语句位于循环内部有没有办法改变这种行为您需要刷新缓冲区如何执行取决于您的服务器
如何在 CUDA 应用程序中构建数据以获得最佳速度

我正在尝试编写一个简单的粒子系统利用 CUDA 来更新粒子位置现在我定义的粒子有一个对象该对象的位置由三个浮点值定义速度也由三个浮点值定义更新粒子时我向速度的 Y 分量添加一个常量值以模拟重力然后将速度添加到当前位置以得出新
为什么删除不完整的类型实际上是未定义的行为？

考虑这个经典的例子来解释什么not与前向声明有关 in Handle h file class Body class Handle public Handle Handle delete impl private Body impl in
JQUERY DOM：选择 Dom 加载后创建的元素

我正在开发一个项目在该项目中我需要在调用函数时更改某个类的所有选择输入的值问题是一些选择输入在 dom 首次加载时并不存在它们是通过 Javascript 动态创建的该函数适用于选择页面加载时存在的所有选择输入但不适用于动态添加
Delphi REST API 帖子示例

有人可以发布一个使用 Delphi 2005 向 API 发送 JSON POST 请求的简单示例我发现了许多使用 GET 的示例但 API 提供程序不允许通过 HTTP GET 请求也不支持 URL 编码参数我对调用 REST 服
什么时候在排序之外使用太空船运算符？

我只见过 Perl 宇宙飞船运算符在数字排序例程中使用但它在其他情况下似乎很有用我只是想不出实际用途什么时候可以在 Perl 排序之外使用它 This is a best practice question 我正在为机器人乔编写一个
App.Config 应该是应用程序的伴随文件还是放在自己的组件中？

当我创建 Windows Installer 程序包例如使用 WiX 并安装该应用程序时App exe以及App exe config配置文件应该有自己的组件还是应该是应用程序可执行文件的伴随文件
Netty 处理程序未调用

我正在尝试使用简单的服务器客户端应用程序进入 Netty 代码见下文我正在努力解决两个问题 ConfigServerHandler 分别ConfigClientHandler 被正确调用但是 FeedbackServerHandler
有没有办法为 Swift 4.2 随机数生成器提供种子

我喜欢新的 Swift 4 2 RandomNumberGenerator 东西但我没有看到那里有种子的可能性我是否遗漏了一些东西或者有什么方法可以通过调用底层低级函数来为这些生成器提供种子我有很多代码它们在默认数字类型上使用默认
创建APK时Android应用程序图标变得模糊

创建 APK 时我的应用程序图标变得模糊我尝试下载一个具有非常尖锐图标的 Android 应用程序的 APK 并将其放入我的 APK 中但得到了相同的结果为什么我的图标变得模糊而我在使用相同图标的其他应用程序中看到它却非常清晰当然
转换时我得到 LINQ to Entities Int32 ToInt32(System.String)

当 Convert i 尝试 int Parse SqlFunction 和 EdmFunction 时我得到 LINQ to Entities Int32 ToInt32 System String 但问题仍然存在例外 System
`enforce_stop_tokens` 如何在 LangChain 中与 Huggingface 模型一起工作？

当我们查看 HuggingFaceHub 模型的使用情况时langchain有这部分作者不知道如何停止生成 https github com hwchase17 langchain blob master langchain llms hu

`enforce_stop_tokens` 如何在 LangChain 中与 Huggingface 模型一起工作？

`enforce_stop_tokens` 如何在 LangChain 中与 Huggingface 模型一起工作？ 的相关文章

随机推荐

热门标签

`enforce_stop_tokens` 如何在 LangChain 中与 Huggingface 模型一起工作？的相关文章