活动报名:首个「创造式任务」基准,Creative Agents创造式任务和具有想象力的智能体...

2023-12-16

1181ef81a0fc19d594a3b8ff0bfb79c8.png

报告主题: Creative Agents创造式任务和具有想象力的智能体

报告日期:12月18日(周一)11:00-12:00

aa35e1f5e3c11ba4d28370f1de42b350.gif

主题简介:

北京大学和清华大学等机构组成的团队提出了一类解决创造式任务的智能体——Creative Agents,并推出了首个创造式任务的测试基准。

如何设计具有创造力的智能体,让它能够在现实世界中做各种开放式的复杂任务?这是我们迈向通用决策智能的重要一步。现有的很多工作构建了能够根据语言指令做任务的开放式智能体,但它们设计的语言指令往往清晰明确地描述了任务,没有让智能体表现出创造力。

本文考虑一类更具挑战性的创造式任务,要求智能体从抽象的语言指令中创造出新颖多样的任务解决方案,进而进行多步的规划完成复杂的任务。受人类借助想象力来创造性地完成任务启发,本文提出了一个具有创造力的智能体的框架Creative Agents。其中,智能体被分解为想象模块和控制器两个部分:想象模块能够根据给定的任务指令,以文本或图像的形式构思任务的细节,为完成任务提供具体的目标;控制器根据想象的任务细节进行规划,并在环境中执行动作序列。

本文对想象模块和控制器模块分别提出了两种实现方式,构建了Creative Agents的多个变种。作者在Minecraft游戏中设计了20个创造式任务作为测试基准,提出了多种任务评测指标,对Creative Agents做了详细的实验分析。本文还提出了基于视觉-语言模型GPT-4V的评测指标,并与现有的人工评价方法进行对比实验,显示GPT-4V与人工评测的结果具有一致性。

Creative Agents是对在开放世界中构建具有创造力的智能体的第一步尝试;同时,作者开源了Minecraft创造式任务的测试环境、评价指标、数据集,为后续相关领域的研究提供了基准。

论文链接:https://arxiv.org/pdf/2312.02519.pdf

代码链接:https://github.com/PKU-RL/Creative-Agents

项目主页:https://sites.google.com/view/creative-agents

报告嘉宾:

蔡鹏霖,北京大学元培学院本科生,研究兴趣主要包括强化学习、开放环境下智能体的构建及其协作等。他也对大语言模型、视觉-语言模型在任务分解和目标规划等方面的应用有浓厚的兴趣。

袁昊琦,北京大学计算机学院博士生,研究方向是设计高效的决策算法和模型,涉及强化学习、生成模型和表示学习。目前的研究工作有:结合大语言模型和强化学习的开放世界智能体,离线的多任务强化学习,预训练决策模型。

扫描下方二维码

e4f0c327a2ebfdd375ff446789a4cf78.png

或点击「阅读原文」报名

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

活动报名:首个「创造式任务」基准,Creative Agents创造式任务和具有想象力的智能体... 的相关文章

  • 什么是主动学习(Active Learning)?定义,原理,以及主要方法

    数据是训练任何机器学习模型的关键 但是 对于研究人工智能的企业和团队而言 数据仍是实现成功的最大障碍之一 首先 您需要大量数据来创建高性能模型 更重要的是 您需要标注准确的数据 虽然许多团队一开始都是手动标注数据集 但更多团队已逐渐实现数据
  • java服务调用mysql报错

    一 前言 前端服务调用后端服务时出现以下报错 原因是使用mysql5 7版本数据库中存在ONLY FULL GROUP BY这个配置项导致的不兼容 MySQLSyntaxErrorException Expression 32 of SEL
  • Linux新建一个服务

    新建一个服务 你可以创建一个Systemd服务单元 以便在系统启动时运行特定的脚本或程序 首先 创建一个 service 文件 例如my service service 并将其放在 etc systemd system 目录下 在这个文件中
  • 鸿蒙开发入门:应用配置文件概述(二)

    应用配置文件概述 Stage模型 每个应用项目必须在项目的代码目录下加入配置文件 这些配置文件会向编译工具 操作系统和应用市场提供应用的基本信息 在基于Stage模型开发的应用项目代码下 都存在一个app json5及一个或多个module
  • linux设置两个文件权限完全相同方法

    linux设置两个文件权限完全相同方法 第二个文件设置为具有与第一个文件完全相同的权限 1 使用stat命令查看第一个文件的权限 stat c a 文件1 2 使用chmod命令将第二个文件设置为与第一个文件相同的权限 chmod refe
  • go-zero 开发入门-加法客服端示例

    定义 RPC 接口文件 接口文件 add proto 的内容如下 syntax proto3 package add 当 protoc gen go 版本大于 1 4 0 时需加上 go package 否则编译报错 unable to d
  • 智能配音在线怎么弄?教你配音好方法

    想象一下 你有一个精彩的故事 需要给它进行配音 让故事更加生动立体 现在 有许多文字配音App可以帮助你实现这个愿望 无需专业录音设备 只需一款文字配音App 就能轻松实现文字转语音 为故事增添声音 接下来 就为你带来文字配音app推荐免费
  • 自动机器学习是什么?概念及应用

    自动机器学习 Auto Machine Learning 的应用和方法 随着众多企业在大量场景中开始采用机器学习 前后期处理和优化的数据量及规模指数级增长 企业很难雇用充足的人手来完成与高级机器学习模型相关的所有工作 因此机器学习自动化工具
  • 2024备战春招Java面试八股文合集

    Java就业大环境仍然根基稳定 市场上有很多机会 技术好的人前景就好 就看你有多大本事了 小编得到了一份很不错的资源 建议大家可以认真地来看看以下的资料 来提升一下自己的核心竞争力 在面试中轻松应对面试官拿下offer 本文分享 Java后
  • 2023 Java 面试题精选40道,包含答案

    Java中什么是重载 什么是覆盖 它们有什么区别 重载是指在同一个类中 方法名相同但参数类型 个数或顺序不同的情况下 编译器会根据参数列表的不同自动调用不同的方法 覆盖是指子类重写父类的同名方法 使得子类在调用该方法时执行子类的实现而不是父
  • 2024java面试看完这篇笔记薪资和offer稳了!

    新的一年抓住机会 不管跳槽涨薪 还是学习提升 这篇笔记你都不应该错过 为了帮大家节约时间 整理了这篇 Java面试 核心知识点整理 以及 金三银四高频面试合集 希望大家在新的一年都能拿到理想的薪资和offer 内容涵盖 计算机基础 Java
  • Java面试题及答案整理( 2023年12月最新版,持续更新)

    秋招金九银十快到了 发现网上很多Java面试题都没有答案 所以花了很长时间搜集整理出来了这套Java面试题大全 这套互联网 Java 工程师面试题包括了 MyBatis ZK Dubbo EL Redis MySQL 并发编程 Java面试
  • 面试官:什么是JWT?为什么要用JWT?

    目前传统的后台管理系统 以及不使用第三方登录的系统 使用 JWT 技术的还是挺多的 因此在面试中被问到的频率也比较高 所以今天我们就来看一下 什么是 JWT 为什么要用 JWT 1 什么是 JWT JWT JSON Web Token 是一
  • 浅析特征增强&个性化在CTR预估中的经典方法和效果对比

    在CTR预估中 主流都采用特征embedding MLP的方式 其中特征非常关键 然而对于相同的特征 在不同的样本中 表征是相同的 这种方式输入到下游模型 会限制模型的表达能力 为了解决这个问题 CTR预估领域提出了一系列相关工作 被称为特
  • 总有人说鸿蒙是安卓套壳?鸿蒙5.0之后彻底摆脱安卓

    鸿蒙系统的操作逻辑与安卓基本上差不多 这和安卓系统没啥区别 是不是就是安卓系统套了一个壳啊 为什么到今天还是有不少人在争论它到底是不是安卓套壳 这与鸿蒙早期 完全自主研发 的 过激 宣传不无关系 其次就是鸿蒙生态环境上的不足 确实 华为一开
  • 鸿蒙系统的崛起对程序员来说是机遇、还是挑战呢?

    前言 最近 一个话题在程序员圈子里激起了热烈讨论 那就是鸿蒙系统的崛起是否会影响程序员的就业和发展 我该转去学鸿蒙开发吗 鸿蒙前景如何 值不值得投入时间研究 对此 程序员们表达了各种疑虑和困惑 的确 一个全新的操作系统的出现确实让人眼花缭乱
  • go-zero 开发之安装 etcd

    本文只涉及 Linux 上的安装 二进制安装 下载二进制安装包 ETCD VER v3 4 28 ETCD VER v3 5 10 DOWNLOAD URL https github com etcd io etcd releases do
  • Quartz定时任务运行时,能够否对某个任务重新调度呢?

    背景 quartz 是一个功能丰富 开源 分布式的任务调用框架 我参与的很多项目都用它来实现定时调度功能 关于定时任务 有一个常见的需求是 由 Web 应用来控制定时任务的启动 停止 调度周期等 本文探讨的是 对于当前正在 调度的 耗时较长
  • go-zero开发入门之网关往rpc服务传递数据2

    go zero 的网关服务实际是个 go zero 的 API 服务 也就是一个 http 服务 或者说 rest 服务 http 转 grpc 使用了开源的 grpcurl 库 当网关需要往 rpc 服务传递额外的数据 比如鉴权数据的时候
  • 一呼百应!腾讯、阿里等全都支持鸿蒙了,安卓该担心了

    前言 众所周知 目前华为鸿蒙系统 已经是全球第三大智能手机系统 仅次于安卓 iOS 不过大家也都清楚 这个第三 实际上还是有水份的 因为鸿蒙其实并没有自己的生态 靠的是兼容安卓生态 真正的纯血鸿蒙APP 仅几十个 如果靠着这几十个APP 完

随机推荐

  • 短视频制作:从构思到发布的全方位指南

    在当今数字化时代 短视频已成为备受欢迎的媒体形式 凭借其简洁有趣的内容 短视频成功吸引了大量观众的关注 然而 制作一部引人入胜的短视频并非易事 本文将为你提供从目标设定到平台发布的全面指导 帮助你制作出令人难以忘怀的短视频 第一步 明确目标
  • 有哪些PDF转图片工具好用?PDF转图片免费软件推荐

    在一个阳光明媚的下午 你正在翻阅着一份重要的PDF文件 想要快速将其中的内容以图片形式分享给朋友 然而 复制粘贴不仅繁琐 还会失去原本的排版和格式 那么 如何将PDF文件转换成图片呢 今天就来介绍两款可以实现这一功能的免费软件 如果你也想知
  • 你知道ai写作工具哪个好吗?教你用AI写年终总结

    又是一年的十二月到了 每年到这个时候 朋友圈都总会出现一首常驻歌曲 十二月的奇迹 身为打工人的大家应该都希望 在忙碌了一年的最后一个月被奇迹眷顾吧 不过俗话说得好 靠人不如靠己 与其把自己交给命运的奇迹 那不如自己也努力争取一下 在老板面前
  • 鸿蒙开发入门:快速修复命令行调试开发指导

    快速修复命令行调试开发指导 当前阶段 HarmonyOS为开发者提供了命令行的调试开发工具可供使用 比如 包名为com ohos quickfix的示例应用 版本号为1000000 该应用的当前版本运行中有某问题需要修复 此时 开发者可参考
  • 主动学习与弱监督学习

    人工智能数据的获取没有想象中的那么简单 虽然我们早已身处大数据的浪潮下 很多公司在获取数据的大浪中翻滚却始终没有找到一个合适的获取数据的渠道 很多情况下 获取高质量的人工智能数据需要消耗大量的人力 时间 金钱 但是对于未来世界 以 人机协同
  • Java处理SSH-免密登录

    前提 需要测试主机之间能够免密 配置ssh请自行百度 jar包 旧版 com jcraft jsch 仅支持老版的密钥格式 旧版本 RSA
  • go-zero开发入门-API网关开发示例

    开发一个 API 网关 代理 https blog csdn net Aquester article details 134856271 中的 RPC 服务 网关完整源代码 file main go package main import
  • 设计之妙,理解Android动画流程

    本文基于Android 12进行学习研究 参考 深入理解Android内核源码 思路学习总结 如有理解不对 望各位朋友指正 另外可能留存一些疑问 留后续再探索 输出只是为了分享和提升自己 动画初始化 按照窗口管理策略类中的定义 动画应该被分
  • 创建个人网站(一)从零开始配置环境,搭建项目

    目录 前言 配置环境 前端 后端 遇到的问题 1 安装了nvm和node vscode没反应 2 安装完脚手架之后vue指令不存在
  • docker配置连接harbor私有仓库

    一 前言 以下分为两种情况说明docker对harbor私有仓库的访问配置 一种是harbor使用自建证书配置https 一种是使用公有证书配置https 二 docker配置 harbor使用自建证书的情况 使用自建证书对harbor进行
  • 不看后悔系列!Android面试经验分享,附经典题库+答案解析

    前言 近期 许多同学向我咨询关于Android技术岗位的招聘事宜 希望能够在求职过程中更好地准备 以冲击大厂 拿到高薪 作为首批Android开发者 我十余年来一直深耕Android及移动互联网开发领域 拥有丰富的面试和实战经验 在此 我想
  • 活动报名|马普脑研究所主任Moritz Helmstaedter:Connectomics连接组学

    报告主题 Connectomics连接组学 报告日期 12月08日 周五 15 30 16 30 主题简介 大脑是由数百万至数十亿神经元组成的高度互联的网络 一个世纪以来 我们一直无法在突触分辨率上绘制这些连通性网络的图谱 只是最近 利用新
  • 协程与互斥锁: Kotlin Mutex的终极指南

    引言 今天我们将深入研究Kotlin中的Mutex 互斥锁 原理以及在实际开发中的使用技巧 Mutex是多线程编程中的关键工具 它可以有效地解决多线程访问共享资源时可能发生的竞态条件问题 Mutex的基本原理 Mutex是互斥锁的缩写 它是
  • USB-C口快充数据线背后的技术奥秘

    自从苹果iPhone 15也用上了USB C口后 市场上销售的快充数据线也日益增多 近日 有小伙伴向我反馈 使用苹果iPhone 15的USB C口原装数据线 无法给其他手机提供PD 120W快充 他们尝试更换其他数据线 有些可以激发120
  • mybatis plus 常见问题Invalid bound statement (not found)解决方法汇总

    我用的若依框架 将mybatis改为mybatis plus 在重启项目时报错Invalid bound statement not found 百思不得其解 百度回答各种mapper xml配置路径啥的 但是springboot项目需要配
  • 30天精通Nodejs--第十四天:MongoDB

    这里写目录标题 前言 什么是 MongoDB 安装 MongoDB 驱动 连接到 MongoDB 数据库 执行基本操作 插入文档 查询文档 更新文档 删除文档
  • Java的ThreadLocal

    ThreadLocal ThreadLocal 是 Java 中一个非常有用的类 它允许你创建线程局部变量 线程局部变量是指每个线程都有自己独立的变量副本 互不干扰 ThreadLocal 主要用于解决多线程环境下共享数据的线程安全性问题
  • 天猫交易rpa机器人轻松上架商品,助力提高电商效率!

    作为网店店主 你可能被困在电商运营各种繁琐的环节中已多时 当你每次上新都手忙脚乱 错漏百出 想节约人力成本而不知如何下手的时候 你可能需要了解一下RPA电商自动化解决方案中的商品自动上架机器人 只需一键点击 RPA机器人就能节约你80 的时
  • Android Tab吸顶 嵌套滚动通用实现方案✅

    很多应用的首页都会有一些嵌套滚动 Tab吸顶的布局 尤其是一些生鲜类应用 例如 朴朴超市 大润发优鲜 盒马等等 在 Android 里面 滚动吸顶方式通常可以通过 CoordinatorLayout AppBarLayout Collaps
  • 活动报名:首个「创造式任务」基准,Creative Agents创造式任务和具有想象力的智能体...

    报告主题 Creative Agents创造式任务和具有想象力的智能体 报告日期 12月18日 周一 11 00 12 00 主题简介 北京大学和清华大学等机构组成的团队提出了一类解决创造式任务的智能体 Creative Agents 并推