Textbooks Are All You Need II: phi-1.5 technical report

2023-11-12

本文是LLM系列文章，针对《Textbooks Are All You Need II: phi-1.5 technical report》的翻译。

教科书是你所需要的一切：phi-1.5技术报告

摘要
1 引言
2 技术规范
3 基准结果
4 解决毒性和偏见
5 我们的模型的使用
6 讨论

摘要

我们继续调查TinyStories发起的基于Transformer的较小语言模型的威力，TinyStoris是一个1000万参数的模型，可以生成连贯的英语，phi-1是一个13亿参数的模型。后一项工作建议使用现有的大型语言模型（LLM）来生成“教科书质量”的数据，作为与传统网络数据相比增强学习过程的一种方式。我们遵循“教科书就是你所需要的一切”的方法，这次重点关注自然语言中的常识推理，并创建了一个名为phi-1.5的13亿参数的新模型，在自然语言任务上的性能可与5倍大的模型相媲美，在更复杂的推理任务（如小学数学和基本编码）上超过了大多数非前沿LLM。更普遍地说，phi-1.5表现出了大得多的LLM的许多特征，既有好的——比如“一步一步思考”或进行一些基本的上下文学习的能力——也有坏的，包括幻觉和潜在的有毒和有偏见的世代——尽管令人鼓舞的是，由于缺乏网络数据，我们看到了这方面的改进。我们开源了phi-1.5，以促进对这些紧迫主题的进一步研究。

1 引言

2 技术规范

3 基准结果

4 解决毒性和偏见

5 我们的模型的使用

6 讨论

我们引入了phi-1.5，这是一个13亿参数的LLM，主要在专门策划的“textbookquality”合成数据集上进行训练。我们的研究结果表明，该模型的性能与具有数量级以上参数的模型相似，甚至在推理任务（常识或逻辑推理）方面超过了它们。这一结果挑战了LLM的能力完全由其规模决定的主流观点，表明数据质量发挥着比以前认为的更重要的作用。
phi-1.5的开源旨在促进对LLM相关紧急问题的进一步研究，如上下文学习、偏见缓解和幻觉。尽管该模型的能力与最大的LLM相比仍有很大差距，但它表现出了以前只在更大的模型中看到的几个特征，使其成为广泛研究的理想平台。
我们的工作表明，在较小的LLM中实现高水平能力的可行性，可能为更高效和环境可持续的人工智能系统铺平道路。未来的方向包括扩展我们的合成数据集，以涵盖更广泛的主题，并针对更具体的任务微调phi-1.5。也许在10亿参数规模上实现ChatGPT的能力水平实际上是可以实现的？

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

LLM

语言模型

人工智能

Textbooks Are All You Need II: phi-1.5 technical report 的相关文章

【信道估计】【MIMO】【FBMC】未来移动通信的滤波器组多载波调制方案（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
【固定翼飞机】基于最优控制的固定翼飞机着陆控制器设计研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
深度好文：最全的大模型 RAG 技术概览

本文是对检索增强生成 Retrieval Augmented Generation RAG 技术和算法的全面研究对各种方法进行了系统性的梳理涉及了 RAG 流程中的数据拆分向量化查询重写查询路由等等在做 RAG 的小伙伴一定知道
【多源数据融合】基于Dempster-Shafer理论的信念对数相似度测量及其在多源数据融合中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
什么是充放电振子理论？

CHAT回复充放电振子模型 Charging Reversal Oscillator Model 是一种解释ENSO现象的理论模型这个模型把ENSO现象比喻成一个热力学振荡系统在这个模型中 ENSO现象由三个组成部分充电 Char
链上繁荣,合作不断,外媒热议波场 TRON 2023 年度成绩

近日权威外媒Theblock 美联社和Decrypt等就波场 TRON 2023大事件进行了年度盘点报道指出波场TRON网络在2023年取得了一系列的发展和合作提升了其在Web3领域的地位其中波场TRON网络账户数量增加了 54
明日 15:00 | NeurIPS 2023 Spotlight 论文

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入哔哩哔哩直播通道扫码关注AITIME哔哩哔哩官方账号预约直播 1月17日 15 00 16 00 讲者介绍黄若孜腾讯AI LAB游戏AI研究员 2020年复旦大学硕士毕业后
毕业设计：基于深度学习的微博谣言检测系统人工智能

目录前言设计思路一课题背景与意义二算法理论原理三检测的实现最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有
无人机视角、多模态、模型剪枝、国产AI芯片部署

无人机视角多模态模型剪枝国产AI芯片部署是当前无人机技术领域的重要研究方向其原理和应用价值在以下几个方面进行详细讲述一无人机视角无人机视角是指在无人机上搭载摄像头等设备通过航拍图像获取环境信息并进行图像处理和分析这种技术
台积电再被坑，2纳米光刻机优先给Intel和三星，美国太霸道了

外媒指出今年ASML的10台2纳米光刻机分配已经基本确定了 Intel拿到6台三星获得3台台积电只能得到一台考虑到美国对ASML的强大影响力外媒的这些消息应该有较高的可信性 Intel在先进工艺制程方面自从2014年量产14纳米之
2024 人工智能与大数据专业毕业设计(论文)选题指导

目录前言毕设选题选题迷茫选题的重要性更多选题指导最后前言大四是整个大学期间最忙碌的时光一边要忙着备考或实习为毕业后面临的就业升学做准备一边要为毕业设计耗费大量精力近几年各个学校要求的毕设项目越来越难有不少课题是研究生
做大模型也有1年多了，聊聊这段时间的感悟！

自ChatGPT问世以来做大模型也有1年多了今天给大家分享这一年后的感悟过去一年应该是AI圈最万千瞩目的一年了大家对大模型 OpenAI ChatGPT AI Native Agent这些词投入了太多的关注以至于有一年的时间好像经
机器学习算法实战案例：时间序列数据最全的预处理方法总结

文章目录 1 缺失值处理 1 1 统计缺失值 1 2 删除缺失值 1 3 指定值填充 1 4 均值中位数众数填充
AI在保护环境、应对气候变化中的作用

对于AI生命周期数据领域的全球领导者而言暂时搁置我们惯常的AI见解和AI生命周期数据内容产出来认识诸如世界地球日这样的自然环境类活动日似乎是个奇怪的事情我们想要知道数据是否真的会影响我们的地球环境简而言之是确实如此但作为一
AI帮助终结全球饥饿问题

全球饥饿问题是牵动人心的头等大事 5月28日是世界饥饿日这一问题更值得关注让人人都能吃饱的想法不仅令人向往而且很快就会变成现实与大多数新事物引进一样对于在控制世界粮食供应这样复杂的任务中AI究竟应该发挥多大的作用人们还踟蹰不前
AI-基于Langchain-Chatchat和chatglm3-6b部署私有本地知识库

目录参考概述部署安装环境准备原理和流程图一键启动启动WebAPI 服务启动WebUI服务 Docker部署
【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 有无策略奖励 2 2 训练结果1
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
基于节点电价的电网对电动汽车接纳能力评估模型研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据
Making Large Language Models Perform Better in Knowledge Graph Completion论文阅读

文章目录摘要 1 问题的提出引出当前研究的不足与问题 KGC方法 LLM幻觉现象解决方案 2 数据集和模型构建

随机推荐

FISCO BCOS 2.0使用教程：群组架构实操演练

FISCO BCOS 2 0系列课程启动我们将交叉推出 FISCO BCOS 2 0原理解析 FISCO BCOS 2 0使用教程 FISCO BCOS 2 0源码分析等文章系列本文主讲群组架构的实操攻略我将以搭建仲裁链为例并演示
C++表达式语句实训对 26 个大写英文字母进行循环加密，输入一个大写英文字母（明文）和一个整数秘钥，输出用秘钥对该大写英文字母加密后的结果（密文）。

include
Android-模块化通信-简单实用的android spi机制

目录前言一 spi是什么二 ServiceLoader 1 ExportTableLoader 2 ExportTable 3 LazyLoader 4 ServiceLoader 三应用四总结前言为了实现Android 模
网站开发之HTML基础表格Table和表单Form（三）

前面两篇文章主要介绍了HTML的基础知识详见网站开发之HTML入门知识及常用标记符一网站开发之HTML基础知识及超链接二这篇文章主要介绍HTML两个比较重要的基础知识表格Table及简单的网页布局表单Form及Input控件
Linux多线程C++版（二）线程创建 pthread_create()函数

目录 1 线程创建 pthread create 1 线程创建 pthread create include
Vite创建Vue项目常用的vite.config.ts配置

import fileURLToPath URL from node url import defineConfig loadEnv from vite import vue from vitejs plugin vue import ba
我来了，在这里起航

五一过后这济南的天全然没有了泉城该有的灵秀夜里恼人的大风总是肆无忌惮的闹一晚上而这忽冷忽热的交替却是让好些人陷入了穿秋裤脱秋裤的噩梦中别看这几日热的紧好歹有个晴朗的天空据说过几日又是大雨倾盆的节奏这济南的春啊总是让人
后台添加cookie，前端jsp获取不到

在开发中遇到问题后台 Cookie c new Cookie Cookie 11111111111111111111 c setPath response addCookie c 在前端jsp获取不到方法 Cookie cc reques
laravel8 实现签到功能案例

本文是个案例先来数据库用户表 CREATE TABLE users id bigint 20 unsigned NOT NULL AUTO INCREMENT name varchar 255 COLLATE utf8mb4 unico
javascript的类型

Javascript的类型分为两类原始类型和对象类型原始类型包括数字字符串布尔值 null和undefined ES6新增了symbol 数字字符串和布尔值这三种原始类型可以转成包装对象其中只有字符串的包装对象会产生可枚举的实义
【iMovie】Error: RequestCVPixelBufferForFrame returned: 3 for absolute frame

解决方案删掉黑屏部分
关于C语言中的重点转义字符详解

一了解有哪些常见的转义字符首先我们知道在C语言中有许多转义字符接下来我将一些常见的转义字符罗列下来 a n t ddd xdd 二依次介绍一下每个转义字符的具体作用在书写连续多个问号后防止他们被解析成三字母词看代码 prin
Typora + PicGo + Gitee 搭建免费图床

搭建准备本次搭建过程需要以下介质 Typora PicGo Gitee GitHub 免费 Typora Typora 是一款 markdown 编辑器支持几乎所有的 markdown 格式神器支持 macOS Windows Li
matlab74汉明码纠错,基于MATLAB汉明码设计与实现

实验报告书汉明码设计与实现汉明码编译码器系统班级姓名学号一实验原理描述 1 1汉明码编码原理一般来说若汉明码长为n 信息位数为k 则监督位数r n k 若希望用r 个监督位构造出r 个监督关系式来指示一位错码的n 种可能位
数据结构笔记——第三章栈和队列

3 1 栈 3 1 1 栈的逻辑结构 1 栈栈是限定仅在表尾进行插入和删除操作的线性表允许插入和删除的一端称为栈顶另一端称为栈底不含任何数据元素的栈称为空栈栈中元素除了具有线性关系外还具有后进先出的特性 2 栈的抽象数据类型定义
宝塔重置密码 mysql_linux宝塔面板安装宝塔重置密码等常用命令

安装宝塔 Centos安装脚本 yum install y wget wget O install sh http download bt cn install install sh sh install sh Ubuntu Deepin安
Unity 使用 Visual Studio 调试 Android 真机

开始之前保证自己能够build 出apk 一 Build Settings 设置二点击Build And Run 三利用vs 调试代码我就是想调试代码但是就是这个AndroidPlayer 一直出不来卡了很久我是这么解决的
ifconfig命令及详细介绍

在实体机上 ifconfig 命令用于显示或配置网络设备网络接口卡或修改以CentOS 7为例 ifconfig a 所有网卡信息一显示内容分析 1 ens33 以太网接口 virbr0 virbr nic类似 ens33 f
灰度发布、蓝绿部署、金丝雀都是啥？

目录滚动部署蓝绿发布为什么还需要蓝绿金丝雀发布 canary 金丝雀和蓝绿的对比灰度发布 A B Test 实现 kubernetes istio spring cloud 网关参考滚动部署在滚动部署中应用的新版本逐步替换
Textbooks Are All You Need II: phi-1.5 technical report

本文是LLM系列文章针对 Textbooks Are All You Need II phi 1 5 technical report 的翻译教科书是你所需要的一切 phi 1 5技术报告摘要 1 引言 2 技术规范 3 基准结果 4

热门标签