ChatGPT学python——制作自己的AI模型(一)初步了解

2023-11-06

前言

在这里插入图片描述
「作者主页」雪碧有白泡泡
「个人网站」雪碧的个人网站
「推荐专栏」

java一站式服务
前端炫酷代码分享
uniapp-从构建到提升
从0到英雄,vue成神之路
解决算法,一个专栏就够了
架构咱们从0说
数据流通的精妙之道

请添加图片描述

引言

通过【ChatGPT学puthon】我们可以掌握

  • 了解ChatGPT的原理,用法以及应用场景
  • 利用ChatGPT辅助python的学习和开发
  • 掌握如何在自己的程序中接入ChatGPT
    在这里插入图片描述

Chatgpt简介

在使用ChatGPT之前,我们先来了解一下关于它的一些基本信息

ChatGPT是什么

ChatGPT是由OpenAI公司于2022年11月推出的一个个基于大型语言模型的人工智能聊天机器人应用
关于它的更多情况,我们就直接让它来自我介绍吧

ChatGPT是一个基于Transformer模型的聊天生成模型,由OpenAI开发。它是GPT(GenerativePre-trained Transformer)系列模型的一部分,旨在进行自然语言交互和对话生成。

GPT模型使用了Transformer架构,这是一种基于自注意力机制的深度神经网络模型。通过预训练大规模的语料库数据,GPT模型可以学习到语言的统计结构和语义表示,并且能够生成连贯、有逻辑性的文本。

ChatGPT是针对对话任务进行微调的GPT模型变体。与传统的单向语言模型不同,ChatGPT被设计用于生成有上下文依赖的回复,使其更适合进行对话和聊天交互。通过与用户的迭代交互,ChatGPT可以理解用户输入并产生连贯的响应。

需要注意的是,作为一个AI模型,ChatGPT具有其局限性。它的回答是基于已有的训练数据和模型的理解,可能存在错误或不准确的情况。此外,ChatGPT没有真实的理解能力,它只是根据模式匹配和训练数据生成回答。
在这里插入图片描述

ChatGPT的原理

因为ChatGPT具备检索信息和智能生成人类语言的能力,再加上它内部有庞大的知识资料库。所以,当人们需要查找某些信息时,可以直接问ChatGPT询问,而无法像过去一样通过网络搜索,查找文献等方式得到答案,这很可能会颠覆当前的搜索引擎,成为人们获取信息的新方式
下面同样用 ChatGPT来了解一下自身的实现原理

ChatGPT是一种基于深度学习的自然语言处理模型,其原理主要基于一种称为转换器(Transformer)的神经网络架构。下面是ChatGPT的主要原理:

  1. 转换器(Transformer)架构:ChatGPT使用了转换器作为其核心模型架构。转换器主要由编码器和解码器组成,它们都由多个堆叠的自注意力机制与前馈神经网络层组成。

  2. 自注意力机制(Self-Attention):自注意力机制是转换器中的关键组件。它允许模型在输入序列中的每个位置上对其他位置进行加权聚合,以获取全局上下文信息。通过计算查询、键和值之间的相关性来实现这种加权聚合。

  3. 预训练与微调:ChatGPT使用了预训练和微调两个阶段。在预训练阶段,模型通过大规模的无监督数据集进行训练,以学习语言的统计模式和语义信息。在微调阶段,模型会在特定的任务上进行有监督的训练,如对话生成,以使模型更好地适应特定任务的要求。

  4. 生成策略:ChatGPT使用了基于概率分布的采样方法来生成响应。常见的方法包括贪婪搜索(选择概率最高的单词)和束搜索(保留几个最有可能的候选词)。这些生成策略可以平衡生成的多样性和准确性。

  5. 序列到序列学习:ChatGPT将对话生成任务建模为一个序列到序列学习问题,其中输入是对话历史(包括先前的对话内容和系统提示),输出是生成的响应。训练过程中使用的目标函数通常是交叉熵损失函数。

  6. 上下文编码:为了处理上下文信息,ChatGPT通过将对话历史进行编码来获得表示。可以使用不同的编码策略,如简单的拼接或使用特定的分隔符进行分割。

总的来说,ChatGPT利用深度学习技术和转换器架构来从大规模数据中学习语言模式,并通过预训练和微调来适应特定的对话生成任务。它通过自注意力机制实现全局上下文建模,并使用生成策略来生成适当的响应。
在这里插入图片描述

ChatGPT能做什么

我们来问问ChatGPT自身能做些什么呢

ChatGPT 可以应用于多种场景,包括但不限于以下几个方面:

  1. 客户服务:ChatGPT 可以扮演虚拟客服代表的角色,回答用户的问题、提供支持和解决常见问题。它可以处理一系列常见的客户询问,为用户提供即时帮助。

  2. 智能助理:ChatGPT 可以被用作个人助理,回答日常生活中的问题,例如天气查询、日历安排、提醒事项等。它可以与用户进行对话,并提供所需的信息和指导。

  3. 教育辅助:ChatGPT 可以用于教育领域,作为学习伙伴和知识咨询工具。它可以回答学生的问题,解释概念,提供学习资源和建议。

  4. 内容生成:ChatGPT 可以用于生成各种类型的内容,如新闻文章、博客帖子、故事情节等。它可以根据用户的输入或特定要求来生成相关的文本内容。

  5. 社交互动:ChatGPT 可以在社交媒体平台上与用户进行互动,回答问题、提供建议、参与讨论等。它可以模拟人类对话,增加用户参与度和互动体验。

请注意,尽管 ChatGPT 可以在许多场景中发挥作用,但它仍然是一个 AI
模型,存在一些限制。在处理重要或敏感信息时,确保适当的安全措施和人工审核过程是至关重要的。
在这里插入图片描述

用ChatGPT学Python

ChatGPT的能力远不止对于语言文字的处理,它甚至可以对代码进行理解和生成,这得益于它丰富的知识库和它背后强大的神经网络系统

讲解知识点

是用ChatGPT辅助Python学习的最直接的方式,就是让它对Python的知识点进行讲解

示例一

讲解python的基础语法

  1. 注释:
    在Python中,使用井号(#)表示单行注释,用于在代码中添加注释说明。例如:

    # 这是一个单行注释
    

    若要添加多行注释,可以使用三引号(‘’’ ‘’')或三个双引号(“”" “”")。例如:

    '''
    这是一个多行注释
    可以写入多行内容
    '''
    
  2. 变量与数据类型:
    在Python中,您可以直接声明变量并为其赋值,不需要指定其数据类型。

    # 声明变量并赋值
    message = "Hello, World!"
    number = 42
    pi = 3.14
    
    # 打印变量的值
    print(message)
    print(number)
    print(pi)
    
  3. 输入与输出:
    使用print()函数可以将数据输出到终端。使用input()函数获取用户输入。

    # 获取用户输入
    name = input("请输入您的名字: ")
    
    # 输出欢迎消息
    print("你好," + name + "!")
    
  4. 条件语句:
    使用if语句执行条件判断。根据条件的真假,决定执行不同的代码块。

    # 条件判断示例
    x = 10
    
    if x > 0:
        print("x 是正数")
    elif x < 0:
        print("x 是负数")
    else:
        print("x 是零")
    
  5. 循环语句:
    使用for循环和while循环可以重复执行一段代码块。

    # for 循环示例
    fruits = ["apple", "banana", "orange"]
    
    for fruit in fruits:
        print(fruit)
    
    # while 循环示例
    count = 0
    
    while count < 5:
        print("Count:", count)
        count += 1
    
  6. 函数:
    使用def关键字定义函数,并在需要时调用函数。

    # 定义函数
    def greet(name):
        print("Hello, " + name + "!")
    
    # 调用函数
    greet("Alice")
    greet("Bob")
    
示例二

讲解python的正则表达式

下面是一些常用的正则表达式操作:

  1. 导入re模块:
import re
  1. 匹配模式:
  • re.match(pattern, string):尝试从字符串的起始位置匹配模式。
  • re.search(pattern, string):扫描整个字符串查找匹配模式。
  • re.findall(pattern, string):返回字符串中所有匹配模式的非重叠列表。
  • re.finditer(pattern, string):返回一个迭代器,包含所有匹配模式的迭代对象。

例如,以下是一个简单的例子,演示如何使用正则表达式来查找数字:

import re

string = "I have 3 apples and 5 oranges."
pattern = r'\d+'

result = re.findall(pattern, string)
print(result)  # 输出: ['3', '5']
  1. 替换模式:
  • re.sub(pattern, replacement, string):将匹配模式的所有出现替换为指定的字符串。

以下是一个替换的例子,将字符串中的所有空格替换为逗号:

import re

string = "Hello   World!"
pattern = r'\s+'
replacement = ','

result = re.sub(pattern, replacement, string)
print(result)  # 输出: "Hello,World!"
  1. 分割字符串:
  • re.split(pattern, string):根据匹配模式分割字符串,并返回分割后的子字符串列表。

以下是一个例子,使用正则表达式将字符串按照非字母字符分割为单词列表:

import re

string = "Hello, World! How are you?"
pattern = r'\W+'  # 非字母字符

result = re.split(pattern, string)
print(result)  # 输出: ['Hello', 'World', 'How', 'are', 'you']

编写代码

除了讲解知识点以外,ChatGPT可以直接提供代码片段帮助我们学习
下面让ChatGPT给出“猜数字”的游戏pythono代码

import random

def guess_number():
    secret_number = random.randint(1, 100)
    attempts = 0

    while True:
        user_guess = int(input("请输入一个数字(1-100):"))
        attempts += 1

        if user_guess < secret_number:
            print("太小了,请再试一次!")
        elif user_guess > secret_number:
            print("太大了,请再试一次!")
        else:
            print(f"恭喜你,你猜对了!答案是{secret_number}。你用了{attempts}次尝试。")
            break

guess_number()

运行一下:完全正确
在这里插入图片描述

调试debug

我们在学习过程中,会遇到许多无法发现的debug,我们可以交给ChatGPT进行改正或者优化,这时我们就要准备一段错误代码,并交给ChatGPT进行优化改正
例如

好的,以下是一个常见的 Python 错误代码和对应的修正方法:

错误代码: python print("Hello, World!'

错误信息: SyntaxError: EOL while scanning string literal

修正方法: 上述错误是因为 print 语句中的字符串没有正确关闭引号。在这种情况下,您可以通过添加缺失的引号来修复该错误。

修正后的代码: python print("Hello, World!")

修正后的代码中,我补全了最后一个引号,确保字符串被正确地闭合。这样就解决了 SyntaxError 错误。

小结

通过以上例子可以看出,ChatGPT可以在学习python中起到很大辅助作用,相当于有了一个专属的智能助教,让学习者事半功倍,因为特殊原因,很多人可能无法访问ChatGPT,我给出一个AI网站镜像让大家体验一下更好的学习python
点击链接
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

ChatGPT学python——制作自己的AI模型(一)初步了解 的相关文章

  • 如何在Python中选择要写入(.csv)的列

    import csv f csv reader open lmt csv r open input file for reading Date Open Hihh mLow Close Volume zip f s plit it into
  • 使用 OpenCV 和/或 Numpy 对两个图像进行 Alpha 混合 [重复]

    这个问题在这里已经有答案了 我想将一个填充纯色的半透明矩形添加到已加载的半透明 PNG 中 这是我正在使用的输入图像示例 该图像加载了标准cv2 IMREAD UNCHANGED标志 以便完美保留 alpha 通道 该输入图像存储在imag
  • pandas Wide_to_long 后缀参数

    我对在 pandas 中使用 Wide to long 时的参数有疑问 有一个参数叫suffix我不明白 在文档中它说 后缀 str 默认 d 捕获所需后缀的正则表达式 d 捕获数字后缀 没有数字的后缀可以用否定字符类 D 指定 您还可以进
  • 如何使用 Python 裁剪图像中的矩形

    谁能给我关于如何裁剪两个矩形框并保存它的建议 我已经尝试过这段代码 但效果不佳 import cv2 import numpy as np Run the code with the image name keep pressing spa
  • 如何让python优雅地失败?

    我只是想知道如何让 python 在所有可能的错误中以用户定义的方式失败 例如 我正在编写一个处理 大 项目列表的程序 并且某些项目可能不符合我定义的格式 如果 python 检测到错误 它目前只会输出一条丑陋的错误消息并停止整个过程 但是
  • 无法使用 BeautifulSoup 和 Requests 抓取下拉菜单

    我想抓取百年灵网站上的产品页面以获取各种信息 示例页面 https www breitling com gb en watches navitimer b01 chronograph 46 AB0127211C1A1 https www b
  • Tipfy:如何在模板中显示blob?

    鉴于在 gae 上使用tipfy http www tipfy org python 以下模型 greeting avatar db Blob avatar 显示 blob 此处为图像 的模板标签是什么 在这种情况下 斑点是一个图像 这很棒
  • 使用 pandas 将字符串对象转换为 int/float

    import pandas as pd path1 home supertramp Desktop 100 life 180 data csv mydf pd read csv path1 numcigar Never 0 1 5 Ciga
  • 使用多级解决方案计算二维网格中的最近邻

    我有一个问题 在 x y 大小的网格中 我提供了一个点 并且我需要找到最近的邻居 在实践中 我试图在 pygame 中找到距离光标最近的点 该点跨越颜色距离阈值 计算如下 sqrt rgb1 0 rgb2 0 2 rgb1 1 rgb2 1
  • 将一维数组转换为下三角矩阵

    我想将一维数组转换为较低的零对角矩阵 同时保留所有数字 我知道numpy tril函数 但它用零替换了一些元素 我需要扩展矩阵以包含所有原始数字 例如 10 20 40 46 33 14 12 46 52 30 59 18 11 22 30
  • 如何使用 i18n 切换器将“LANGUAGE_CODE”保存到数据库,以便在 Django 中的不同浏览器中语言不会更改?

    有什么办法可以改变它的值LANGUAGE CODE单击按钮 发送请求 时 settings py 中的变量会动态变化吗 我希望用户设置自己的 默认语言 他们的帐户 现在 用户可以使用下拉列表选择他们的首选语言 并且网站会得到完美的翻译 并且
  • 对于相同的查询,MySQL Workbench 比 Python 快得多

    MySQL Workbench 中的以下查询需要 0 156 秒才能完成 SELECT date time minute price id FROM minute prices WHERE contract id 673 AND TIMES
  • 为什么 __instancecheck__ 没有被调用?

    我有以下 python3 代码 class BaseTypeClass type def new cls name bases namespace kwd result type new cls name bases namespace p
  • 根据列索引重命名 Dataframe 列

    是否有内置函数可以按索引重命名 pandas 数据框 我以为我知道列标题的名称 但事实证明第二列中有一些十六进制字符 根据我接收数据的方式 我将来可能会在第 2 列中遇到这个问题 因此我无法将这些特定的十六进制字符硬编码到 datafram
  • Django Rest Framework POST 更新(如果存在或创建)

    我是 DRF 的新手 我阅读了 API 文档 也许这是显而易见的 但我找不到一个方便的方法来做到这一点 我有一个Answer与 a 具有一对一关系的对象Question 在前端 我曾经使用 POST 方法来创建发送到的答案api answe
  • 更换壳牌管道[重复]

    这个问题在这里已经有答案了 在 subprocess 模块的 Python 2 7 文档中 我找到了以下片段 p1 Popen dmesg stdout PIPE p2 Popen grep hda stdin p1 stdout stdo
  • 更新 SQLAlchemy 中的特定行

    我将 SQLAlchemy 与 python 一起使用 我想更新表中等于此查询的特定行 UPDATE User SET name user WHERE id 3 我通过 sql alchemy 编写了这段代码 但它不起作用 session
  • 沿轴 0 重复 scipy csr 稀疏矩阵

    我想重复 scipy csr 稀疏矩阵的行 但是当我尝试调用 numpy 的重复方法时 它只是将稀疏矩阵视为对象 并且只会将其作为 ndarray 中的对象重复 我浏览了文档 但找不到任何实用程序来重复 scipy csr 稀疏矩阵的行 我
  • Pip 无法在 Windows 上安装 Twisted

    我正在尝试在 Windows 8 计算机上安装 Twisted 在 Twisted 官方网站上 只有一个 Windows 版的 Wheel 文件 https twistedmatrix com trac wiki Downloads htt
  • Python 中的字符串slugification

    我正在寻找 slugify 字符串的最佳方法 蛞蝓 是什么 https stackoverflow com questions 427102 in django what is a slug 我当前的解决方案基于这个食谱 http code

随机推荐

  • Flink学习20:算子介绍reduce

    1 reduce简介 按照指定的方式 把每个元素进行累计执行 比如实现累加计算 示例 import keyByNameTest StockPrice import org apache flink api scala createTypeI
  • C++ 类学习总结(三) 类的拷贝赋值操作

    拷贝赋值操作 基本概念 拷贝构造函数 是一种构造函数 用同类型的对象初始化本对象的操作 即将新对象初始化为同类型另一个对象的副本 拷贝赋值运算符 接收一个本类型对象的赋值运算符版本 返回本对象的引用 类的默认函数 默认合成函数 当我们定义了
  • STM32F103 实验 PWM输出

    目录 本文 在上一章的基础上 将介绍如下内容 PWM输出实验 上一篇 STM32F103实验定时器 https blog csdn net qq 40318498 article details 96436994 正文 实验目的 使用TIM
  • Bridge:桥接模式

    将抽象部分与它的实现分离 使他们都可以独立地变化 抽象与实现的分离方法 是借助耦合 对于一个派生类而言 其从基类继承了抽象函数 并对抽象函数进行实现 这是常规的抽象与实现耦合的情况 而 若将函数实现的功能代码抽出 放到一个特定的实现类里 并
  • 设计模式(适配器模式)

    这里写目录标题 一 应用 1 1 概念 1 2 应用场景 二 实现 2 1 Python实现 2 2 Java实现 2 3 Golang实现 一 应用 1 1 概念 适配器是一种结构化的设计模式 主要是为了让不兼容的对象能够相互兼容 1 2
  • shell脚本——循环语句、sed、函数、数组、免交互expect

    目录 循环语句 for while 与 until sed 基本用法 sed脚本格式 函数 注意事项 定义函数和调用函数 脚本中函数的位置 查看函数 删除函数 函数返回值 函数的传参操作 使用函数文件 递归函数 数组 声明数组 数组切片 免
  • 记录 BL-604 环境配置

    与两个朋友组队参加个比赛 第一次正经的参加比赛 弥补之前一些遗憾吧 随便记录一下 下载博流的开发包 https gitee com bouffalolab bl mcu sdk 注册平头哥 https occ t head cn auth
  • NandFlash介绍、操作流程分析以及S5PV210的NandFlash控制器介绍

    1 NandFlash的型号与命名 注 本文以S5PV210芯片和K9F2G08芯片做分析 1 Nand的型号命名都有含义 拿K9F2G08来示例分析一下 K9F表示是三星公司的NandFlash系列 2G表示Nand的大小是2Gbit 2
  • Tomcat 各安装包选择及使用情景。

    本文参考 Apache Tomcat 8 5 51 官方 README 文件 当我们进入 Tomcat 主页下载 Tomcat 时 会看到各种安装包的选择 Binary Distributions 二进制发行包 Core zip pgp s
  • QT/C++ 多线程时,工作界面的样式频繁改变导致程序奔溃的问题

    QT C 多线程时 工作界面的样式频繁改变导致程序奔溃的问题 一 错误现象与原因 最近在学习QT 遇到了一点问题 是关于工作线程与UI线程的 其主要问题为 我的工作线程是一个死循环 当我点击按钮进入工作线程 我的工作线程用emit发送一个信
  • IDEA使用JUnit时@Test无效以及无法导入org.junit包的一系列问题

    先找到idea的安装位置 进入lib文件夹 然后打开idea File gt Project Structure 选择Project Settings中的Libraries 点击如图 号 然后添加以下两个包 点击OK 添加成功就可以了 ht
  • 3.java 基础if语句测评题-答案

    知识点 java 基础if语句测评题 答案 题目1 训练 李雷想买一个价值7988元的新手机 她的旧手机在二手市场能卖1500元 而手机专卖店推出以旧换新的优惠 把她的旧手机交给店家 新手机就能够打8折优惠 为了更省钱 李雷要不要以旧换新
  • SQL-更新和删除数据

    如何使用UPDATE和DELETE语句进一步操作表数据 1 更新数据 更新 修改 表中的数据 使用UPDATE语句 更新表中的特定行 更新表中的所有行 注 不要省略WHERE子句 在使用UPDATE时一定要细心 因为稍微不注意 就会更新表中
  • ArcGIS教程:面积制表

    摘要 计算两个数据集之间交叉制表的区域并输出表 插图 使用方法 区域定义为输入中具有同样值的全部区 各区无需相连 栅格和要素数据集都可用于区域输入 假设区域输入和类输入均为具有同样分辨率的栅格 则可直接使用它们 假设分辨率不同 则可先应用内
  • AT指令(中文详解版)

    AT命令最常见的应用场景 1 智能手机 一般智能手机都是一个主芯片控制一个通信模块 这个通信模块就是一个完整的 简单的手机 包括手机应该有的射频 基带等部分 还有GSM协议栈 完全可以独立打电话 发短信 用GPRS上网等 主芯片实现复杂的应
  • 【GD32篇】新建KEIL工程

    以GD32f103C8T6芯片为例 一 下载MDK5 软件包 下载地址 https www keil com dd2 pack 1 选择工程所需的软件包 2 打开软件包 安装在KEIL5同路径下 3 安装成功后打开keil软件 可查看到自己
  • 经典Hive-SQL面试题及答案

    目录 第一题 求分区累加值 第二题 UV和每个店铺访问量top3信息 Hive sql解答 第一题 求分区累加值 我们有如下的用户访问数据 userId visitDate visitCount u01 2017 1 21 5 u02 20
  • 单片机C语言基础知识-指针篇

    引言 指针是变量在计算机或单片机内所占有的存储区域的地址 C51语言中广泛使用的指针概念是从C语言中继承下来的 利用指针变量不但可以操作各种基本的数据类型 而且能使C51语言像汇编语言一样 具有处理单片机内存地址的能力 地址 指针 指针变量
  • Paramiko远程操作Linux服务器

    在日常工作中我们经常会跟Linux打交道 对于测试同学来说 使用Linux的场景还是比较多的 比如 搭建测试环境 查看日志信息 修改配置文件 监控服务资源等 本篇将介绍一个Python的第三方库Paramiko 使用Paramiko 我们可
  • ChatGPT学python——制作自己的AI模型(一)初步了解

    前言 作者主页 雪碧有白泡泡 个人网站 雪碧的个人网站 推荐专栏 java一站式服务 前端炫酷代码分享 uniapp 从构建到提升 从0到英雄 vue成神之路 解决算法 一个专栏就够了 架构咱们从0说 数据流通的精妙之道 文章目录 前言 引