Code Llama: Open Foundation Models for Code

2023-11-01

本文是LLM系列文章,针对《Code Llama: Open Foundation Models for Code》的翻译。

摘要

我们发布了Code Llama,这是一个基于Llama 2的大型代码语言模型系列,提供了开放模型中最先进的性能、填充功能、对大型输入上下文的支持,以及编程任务的零样本指令跟随能力。我们提供多种风格以涵盖广泛的应用程序:基础模型(Code-Lama)、Python专业化(Code-LAMA-Python),以及分别具有7B、13B和34B参数的指令遵循模型(CodeLlama-Directive)。所有模型都是在16k个token的序列上训练的,并在高达10万个token的输入上显示出改进。7B和13B代码Llama和代码Llama-指令变体支持基于周围内容的填充。Code Llama在几个代码基准测试中达到了开放模型中最先进的性能,在HumanEval和MBPP上的得分分别高达53%和55%。值得注意的是,Code Llama-Python 7B在HumanEval和MBPP上的性能优于Llama 2 70B,我们所有的模型在MultiPL-E上的性能都优于其他所有公开可用的模型。我们在允许研究和商业使用的许可证下发布Code Llama。

1 引言

2 Code Llama:专业化Llama2用于代码

3 结果

4 负责任的人工智能与安全

5 相关工作

6 讨论

我们发布了一系列代码专用的Llama 2模型,称为code-Lama,其中有三个主要变体,我们发布了三种大小(7B、13B和34B参数):code-Lama、code-Lama-Python和code-Lama-Directive。考虑到现实世界的应用,我们训练了7B和13B模型来支持填充,并训练了所有模型来利用大型上下文。我们测试了它们在高达10万个token的推理中的稳定性(图4a)。大型上下文微调和填充是以标准基准从左到右的代码生成基准为代价的(表10),这些基准都是基于短序列(即函数级别)。尽管如此,我们的30B模型在标准python完成基准测试的公共模型中是最先进的,与参数数量相似的模型相比,我们的其他模型具有竞争力。在多语言基准测试中,即使是我们最小的模型(Code Llama 7B)也优于其他所有公共模型。
Code Llama-instruction模型经过训练,可为Code Llama提供零样本指令能力。在这次进一步的微调中,我们在一定程度上提炼了Llama 2-Chat,我们不仅专注于更直接的帮助(图5c),还试图提供一个更安全的模型来使用和部署(第4节)。如图14所示,遵循指令和过于安全可能会在评估中花费一些分数(例如,表2中34B模型的HumanEval)。LLM需要进一步的工作来理解其指令中的上下文和细微差别。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Code Llama: Open Foundation Models for Code 的相关文章

随机推荐

  • 罗技驱动检测不到设备?解决方法

    罗技旗下的鼠标是很多用户都在使用的设备 需要用户安装驱动程序才能够运行 而近期有些小伙伴遇到了罗技驱动检测不到设备的情况 这该如何处理 纯净之家 win7纯净版系统 win7 ghost 纯净版 方法一 1 检测不到设备也有可能不是驱动的问
  • Linux的正则表达式

    目录 正则简介 正则三剑客一 grep 正则三剑客二 sed 正则三剑客三 awk 1 正则简介 什么是正则表达式 简单的说 正则表达式就是为处理大量的字符串而定义的一套规则和方法 通过定义的这些特殊符号的辅助 系统管理员就可以快速过滤 替
  • Linux命令 chmod -R 755

    linux 命令chmod 755的意思 chmod是Linux下设置文件权限的命令 后面的数字表示不同用户或用户组的权限 一般是三个数字 第一个数字表示文件所有者的权限 第二个数字表示与文件所有者同属一个用户组的其他用户的权限 第三个数字
  • 【django】Forbidden (CSRF cookie not set.)

    CSRF 表示django全局发送post请求均需要字符串验证 功能 防止跨站请求伪造的功能 工作原理 客户端访问服务器端 在服务器端正常返回给客户端数据的时候 而外返回给客户端一段字符串 等到客户端下次访问服务器端时 服务器端会到客户端查
  • 面试——Unity Animation和Animator的区别

    两者都是控制动画播放的 Animation控制一个动画播放的各类方法和数据 当然你可以通过修改目标动画进行动画切换 Animator则可以实现控制多个动画的播放 切换 叠加等一级对骨骼动画控制等更复杂的效果 是一个动画状态机 除却必要的动画
  • nmon命令

    启动nmon监控命令 日志保存到 log 路径下 nmon16g x86 sles12 s0 5 c14400 f m log 对nmon文件赋权 chmod 777 file name s 采集时间 c 采集次数 f 文件类型 不填写为标
  • 线程池 (通俗易懂)

    线程池 一 线程池是什么 二 标准库中的线程池 三 线程池的执行流程 四 实现线程池 3 1 思路与细节 3 2 完整代码 五 标准库里的构造方法 六 延伸问题 一 线程池是什么 之前我们已经认识过 池 String 字符串常量池 MySQ
  • Java并发编程

    发一定比串行快么 这个问题肯定是错的 并发比串行慢的原因在于 线程有创建和上下文切换的开销 上下文切换 即使是单核处理器也支持多线程执行代码 CPU通过给每个线程分配CPU时间片来实现这个机制 CPU通过时间片分配的算法来循环执行任务 当前
  • SpringBoot入门

    目录 一 微服务 什么是微服务 发展历程 单体应用程序 垂直应用架构 分布式架构 SOA架构 微服务架构 单体应用程序 垂直应用架构 分布式架构 SOA架构 微服务架构 二 构建SpringBoot项目 三 基于配置文件的注入 四 多环境配
  • 三方协议接收节点不存在_【汇总】缴款失败找不到原因?申报姐带你解读“神秘”代码!...

    然后 我们来看看缴款失败的提示页面 页面中有错误代码和中文的错误信息 申报姐根据这两个信息对缴款失败的情况总结如下 1 错误代码为F02 错误信息为与国库通讯超时通讯故障 解决方法 请稍后再尝试 重新缴款 2 错误代码为FG1 错误信息为征
  • 使用SOAtest进行功能回归测试,作为持续集成过程的一部分

    实现速度 同时保护您的应用程序不受退步影响 持续集成 CI 是一种广为人知且 在这一点上 被广泛采用的实践 它是显著提高应用交付速度的必要第一步 持续集成允许开发人员将他们的变更推送到源代码的 主 分支中 一个开发人员可能在一天内向主分支推
  • 电路仿真软件LTspice 使用教程

    目录 一 LTspice 特点 二 获取方式 三 运行演示电路 四 自绘电路 五 操作要点 六 相关链接 一 LTspice 特点 1 免费 2 电源快速仿真 3 涵盖大量ADI产品模型 二 获取方式 LTspice信息中心 亚德诺半导体
  • 前端如何调用后端接口?有哪几种方式?

    一般来讲 前端不会给后端接口 而是后端给前端接口的情况比较普遍 一些人可能不理解接口和前端开发的关系 其实不合适的接口设计会极大地影响用户的页面体验 那么今天就跟着我一起来看看 前端如何调用后端接口 有哪几种方式 首先 要弄清楚前端提供一个
  • Leetcode 09/04 每日一题 (257. 二叉树的所有路径 )

    给定一个二叉树 返回所有从根节点到叶子节点的路径 说明 叶子节点是指没有子节点的节点 示例 输入 1 2 3 5 输出 1 gt 2 gt 5 1 gt 3 解释 所有根节点到叶子节点的路径为 1 gt 2 gt 5 1 gt 3 思路与算
  • android mtk分析,MTK android平台LCD 驱动的代码分析与讲解

    http blog csdn net sunweizhong1024 article details 8447915 MTK LCD Driver 代码的路是在 mediatek source kernel driver vedio mtk
  • static、const、volatile

    4 关键字static的作用是什么 解答 在C语言中 关键字static有三个明显的作用 在函数体中 一个被声明为静态的变量在这一函数被调用过程中只会被分配一次内存 且整个运行期间不会重新分配 在函数体外 某个源文件内 一个被声明为静态的变
  • BSP概念总结

    嵌入式计算机系统主要由硬件层 中间层 系统软件层和应用软件层四层组成 硬件层 包含CPU 存储器 SDRAM ROM Flash等 通用设备接口和 I O接口 A D D A I O等 其中操作系统和应用程序都可以固化在ROM中 中间层 硬
  • DVWA stored 中级

    跟reflected没啥区别 大写绕过
  • 【 C++ 】函数模板进阶

    目录 1 非类型模板参数 2 模板的特化 2 1 概念 2 2 函数模板特化 2 3 类模板特化 全特化 偏特化 类模板特化示例 3 总结 1 非类型模板参数 模板参数分类类型形参与非类型形参 类型模板参数 出现在模板参数列表中 跟在cla
  • Code Llama: Open Foundation Models for Code

    本文是LLM系列文章 针对 Code Llama Open Foundation Models for Code 的翻译 Code Llama 代码的开放基础模型 摘要 1 引言 2 Code Llama 专业化Llama2用于代码 3 结