利用ChatGPT如何进行批量长文本处理工具GPTBAT

2023-11-15

大家好,我是技术宅小伙,今天要跟大家分享一下我之前写的 GPT 长文本处理程序。当时我写完后就把它放到 Hog 上了,因为最开始是为了自己用,所以后来就忘掉了。最近有同学把它翻出来用,然后经常来问我,说不知道这个东西怎么用。其实在我看来这个挺简单的,但是如果你没有一些关于 GPT 或者说 OPPO AI 的基础知识的话,那你来用它可能就会有一些问题。所以今天我专门录一个文章来讲一下。

首先我们要来说为什么你需要这么一个长文本处理程序。通常情况下我们有一个对话窗口,然后你跟 GPT 来进行聊天就好了,但是这个聊天他的长度是有限的。有很多同学最近在网上钻研,说怎么在 GPT 的官方聊天界面里边去输入尽可能多的内容,但事实上呢,如果官方也是后边也是模型,前面是一个意外的话,他其实真正受到限制的是他后边的这个模型的 Max tokens,就是他可以接收的最大 token 数量。有可能说官方用的这个模型 token 数更多,但是也不会特别的多。现在我们已知的说你用 GPT4,然后有一个 32K 的 token,且这个 token 是非常高的,但是有非常的贵。

BAT 就是长文本处理程序,它是什么样一个逻辑呢?就是说虽然你 GPT 一次只能处理一定量的数据,但没有关系我们可以把一个非常长的文本给分成段落,然后每一个段落放进去然后来处理。处理完了以后把这些结果全部拼起来,再变成一个文本,这样就完成了对常文本的一个处理。当然这个具体的处理指什么,我们这里给了一个例子是说,你可以把这个英文给它翻成中文,这是一个翻译,一段一段翻,翻完了最后把所有翻好的拼接起来。当然你说我是不是也可以做其他的,当然可以,你可以通过写这个提示词,然后来指示它干什么。有同学说我不会写提示词,虽然说提示词他是一个专有名词,但是在 GPT 这个里边,他其实就是用自然语言来描述你想干什么。比方说我们现在来举一个例子,我之前写过一本电子书叫做经济副业假设,假设我们现在要把这本书然后翻译成繁体中文,要怎么做呢?就如果你没有这个 BAT 这个东西,那你可能就要一段一段的来粘贴,然后来复制。那如果有了它呢,我就最简单的方式就是首先我们把它整理成一个文本,一个长文本。但这个地方就是,然后我们把它存成 txt,然后把它处理成每个段落的长度,然后我们就可以来开始处理了。

点一下提交,然后你可以看到他在这个地方就已经开始在处理了,是 15 段里边的第二段。因为这个返回不是像这个聊天一样是一个字一个字返回的,所以他整体返回会比较慢。如果你想知道一些细节的话,你可以按一下 F12,然后你可以通过 network 来看见他是不是在正常工作。这个翻译完的内容会缓存到你这个浏览器里边,所以如果你翻译失败了,你在其中的一个地方,然后他的这个行为中断了,那你也不用着急,你可以到时候重新再照着这个一模一样的来进行。

除了对文本进行翻译,这个长文本处理程序还可以用于其他用途。比如在进行自然语言生成时,我们可以将一篇长文本的内容输入到 GPT 中,让它生成一些新的文章段落,这样可以得到更加丰富的内容。此外,在进行文本分类时,也可以将一篇长文本输入到 GPT 中,然后根据生成的文本内容来判断它的类别。总之,这个长文本处理程序可以帮助我们更好地使用 GPT,提高我们的文本处理效率。

如果你想要使用这个长文本处理程序,可以先将需要处理的文本整理成一个 txt 文件,然后将其上传到程序中。程序会自动将文本分段,并进行相应的处理。如果你对程序的使用还有其他疑问,可以随时联系我,我会尽力为你解答。 大家好,我是技术宅小伙,今天要跟大家分享一下我之前写的 GPT 长文本处理程序。当时我写完后就把它放到 Hog 上了,因为最开始是为了自己用,所以后来就忘掉了。最近有同学把它翻出来用,然后经常来问我,说不知道这个东西怎么用。其实在我看来这个挺简单的,但是如果你没有一些关于 GPT 或者说 OPPO AI 的基础知识的话,那你来用它可能就会有一些问题。所以今天我专门录一个文章来讲一下。

首先我们要来说为什么你需要这么一个长文本处理程序。通常情况下我们有一个对话窗口,然后你跟 GPT 来进行聊天就好了,但是这个聊天他的长度是有限的。有很多同学最近在网上钻研,说怎么在 GPT 的官方聊天界面里边去输入尽可能多的内容,但事实上呢,如果官方也是后边也是模型,前面是一个意外的话,他其实真正受到限制的是他后边的这个模型的 Max tokens,就是他可以接收的最大 token 数量。有可能说官方用的这个模型 token 数更多,但是也不会特别的多。现在我们已知的说你用 GPT4,然后有一个 32K 的 token,且这个 token 是非常高的,但是有非常的贵。

BAT 就是长文本处理程序,它是什么样一个逻辑呢?就是说虽然你 GPT 一次只能处理一定量的数据,但没有关系我们可以把一个非常长的文本给分成段落,然后每一个段落放进去然后来处理。处理完了以后把这些结果全部拼起来,再变成一个文本,这样就完成了对常文本的一个处理。当然这个具体的处理指什么,我们这里给了一个例子是说,你可以把这个英文给它翻成中文,这是一个翻译,一段一段翻,翻完了最后把所有翻好的拼接起来。当然你说我是不是也可以做其他的,当然可以,你可以通过写这个提示词,然后来指示它干什么。有同学说我不会写提示词,虽然说提示词他是一个专有名词,但是在 GPT 这个里边,他其实就是用自然语言来描述你想干什么。比方说我们现在来举一个例子,我之前写过一本电子书叫做经济副业假设,假设我们现在要把这本书然后翻译成繁体中文,要怎么做呢?就如果你没有这个 BAT 这个东西,那你可能就要一段一段的来粘贴,然后来复制。那如果有了它呢,我就最简单的方式就是首先我们把它整理成一个文本,一个长文本。但这个地方就是,然后我们把它存成 txt,然后把它处理成每个段落的长度,然后我们就可以来开始处理了。

点击提交按钮,你可以看到程序已经在处理长度为15段的第二段了。返回结果不像聊天一样一字一字地返回,所以整体返回会比较慢。如果你想了解更多细节,可以按F12键,通过network查看它是否正常工作。翻译完的内容会缓存到你的浏览器中,所以如果你在处理过程中遇到问题,处理被中断了,你也不用着急,你可以重新按照相同的步骤进行处理。

除了对文本进行翻译,这个长文本处理程序还可以用于其他用途。比如在进行自然语言生成时,我们可以将一篇长文本的内容输入到GPT中,让它生成一些新的文章段落,这样可以得到更加丰富的内容。此外,在进行文本分类时,也可以将一篇长文本输入到GPT中,然后根据生成的文本内容来判断它的类别。总之,这个长文本处理程序可以帮助我们更好地使用GPT,提高我们的文本处理效率。

如果你想要使用这个长文本处理程序,可以先将需要处理的文本整理成一个txt文件,然后将其上传到程序中。程序会自动将文本分段,并进行相应的处理。如果你对程序的使用还有其他疑问,可以随时联系我,我会尽力为你解答。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

利用ChatGPT如何进行批量长文本处理工具GPTBAT 的相关文章

随机推荐

  • C#DataTable转List互转

    using System using System Collections Generic using System Data using System Reflection namespace BT Preservation Models
  • 疫情期间沙雕文案

    1 希望如约而至的不至是春天 还有疫情过后平安的你 2 早知道半个月前是最后一次出门 就不应该喝一杯奶茶 3 刚刚有人约我出去过情人节 我果断拉黑删除了 非常时期骗我感情可以 但要我名不可以 4 烟花三月下扬州 愿我三月能下楼 5 疫情你走
  • postman进行post、get参数传递及中文乱码和各类型参数传递和json格式传参和日期型参数传递和响应数据传回

    postman是一种测试工具 用postman直接在其上输入参数名和参数值就行 不用区分post和get请求方法 当然java代码要改变一点 在响应注解的方法里面添加和postman中输入的参数名一样的形参 get请求 代码 注意在响应注解
  • Android 9 底部导航栏样式不正确

    1 项目预制了GMS后 底部导航栏只剩下一个返回键和唤醒Assistant的按钮 需要回到原来的导航栏来 修改方式屏蔽掉 config defaultAssistantAccessPackage 使用Android原始的config def
  • 原码、补码、反码的关系及应用场景

    是三种表示有符号整数的方法 它们之间存在一定的关系 概念 原码是最基本的表示方法 即将一个数的符号位和数值位分开表示 符号位用0表示正数 用1表示负数 例如 7的原码为00000111 7的原码为10000111 反码是在原码的基础上 将负
  • 局域网、城域网、广域网、国际互联网(internet)

    计算机网络按覆盖范围分类可分为局域网 城域网 广域网 一 局域网 1 地理分布范较小 一般为数百米至数公里 可覆盖一幢大楼 一所校园或一个企业 一个家庭 2 数据传输速率高 一般为100Mbps 目前已出现速率高达1000Mbps的局域网
  • vue3 element-plus el-form的二次封装

    form表单的二次封装 vue3 element plus el form的二次封装 属性说明 属性名 类型 默认值 说明 data Array 页面展示数据内容 onChange Function false 表单事件 bindProps
  • R语言的科学编程与仿真 chapter 4 答案

    chapter 4 Ex1 programe cha4 6 ex1 Ex1 https img blog csdn net 20151226125117523 12 25 15 author Sigua file path file age
  • java 加载oracle 驱动 19c_037、Java--JDBC技术

    1 JDBC 简介 JDBC Java DataBase Connectivity java 数据库连接 是 JavaEE 平台下的技术规范 定义了在 Java 语言中连接数据 执行 SQL 语句的标准 可以为多种关系数据库提供统一访问 数
  • https认证过程(TLS认证过程)

    最近在准备春招 刚好看到https 网上搜了一圈没看到满意的 于是打算自己整理一下 以下内容来源于 计算机网络 第8版 谢希仁 加上了一些自己的拙见 目前的HTTPS是使用http tls的 所以直接了解tls的认证过程即可 曾经广泛使用的
  • SAP接口 财务凭证集成_差旅费报销

    OA系统调用此接口 传输差旅费报销流程的凭证信息到SAP 生成借款类型SAP凭证 调用标准的BABI方法实现 1 首先先介绍一下实现会计凭证生成的BAPI 参考链接 2 增强操作在另一篇文章 SAP接口 财务凭证集成 借款 在此不再赘述 3
  • 最近研究xcodebuild批量打包的一些心得

    转自Rainbird的个人博客 以前的时候只知道做安卓开发的兄弟挺辛苦的 不但开发的时候要适配一堆的机型 好不容易开发完了还要打一堆不同的包给不同的市场 没想到现在这些市场都开辟iOS市场 于是需要打一堆的包给不同的市场 面对暂时给的十二个
  • +-1 RMQ

    考虑分块 令 b log 2 n
  • [SQL系列] 从头开始学PostgreSQL 分库分表

    什么是分库分表 分库分表是一种数据库架构设计的方法 用于应对大规模数据的存储和查询 当单个数据库的存储容量或查询性能无法满足需求时 可以通过将数据分散存储在多个数据库服务器上 以提高系统的可扩展性和性能 分库分表通常包括两个步骤 分库和分表
  • 【模板】AC自动机(加强版)【AC自动机fail树上求最多出现次数】

    题目链接 P3796 给出N个模式串 然后我们用一个文本串去进行匹配 这样的做法 就是AC自动机了 于是乎 我们可以先将N个模式串丢进去 然后建立fail树 然后先对所有的节点求出最大串在文本串中出现的次数 然后利用dfs跑fail树的办法
  • 工业数据存储数据库选型比较

    我们讲工业互联网 工业大数据 首先需要把数据从工业现场采集上来 这是第一步也是基础 海量的数据从工业现场采集之后存在哪里呢 使用什么样的存储方式对后面的数据分析和计算有重要影响 这里对数据库方式的存储进行了一个选型比较 当前的数据库按类型分
  • 线性滤波和卷积的概念 ,线性和非线性对比理解

    一 线性滤波与卷积的基本概念 线性滤波可以说是图像处理最基本的方法 它可以允许我们对图像进行处理 产生很多不同的效果 做法很简单 首先 我们有一个二维的滤波器矩阵 有个高大上的名字叫卷积核 和一个要处理的二维图像 然后 对于图像的每一个像素
  • python多个%s的使用方法 %格式符 使用

    直接看代码理解 usr bin python coding utf 8 a wry b zjl c xxx print a s b s c s a b c 输出 a wry b zjl c xxx 参考 格式符 格式符为真实值预留位置 并控
  • lua 中table的字符串索引和变量索引

    a x y a x 10 print a x 输出10 print a x 输出nil print a y 输出10 a x表示以字符串 x 来索引table a x 以变量x的值来索引table
  • 利用ChatGPT如何进行批量长文本处理工具GPTBAT

    大家好 我是技术宅小伙 今天要跟大家分享一下我之前写的 GPT 长文本处理程序 当时我写完后就把它放到 Hog 上了 因为最开始是为了自己用 所以后来就忘掉了 最近有同学把它翻出来用 然后经常来问我 说不知道这个东西怎么用 其实在我看来这个