您的位置：首页 >财经 >

思想克隆！前OpenAI研究员让AI模仿人类思维，现实版「机械姬」降临-焦点播报

来源：创业邦时间：2023-06-17 00:03:45

编者按：本文来自微信公众号新智元（ID：AI_era），作者：新智元，创业邦经授权转载。

(资料图)

当AI有了自主意识会如何？

「机械姬」中，艾娃利用人类的同情心，以欺骗的方式诱导人类获得自由，最终杀了自己的「造物主」Nathan。

近来，在众多网友的力荐下，Sam Altman终于看了这部电影。

并表示，「很好的电影，但我不明白为什么每个人都让我看它。」

许多人或许想警示，这就是让人工智能有了意识，通过图灵测试的结果。

但我们离「机械姬」上映的那一幕还很遥远，GPT-5可能在秘密研发中，让AI有智慧仍是科学家集洪荒之力最想做的事。

这不，来自不列颠哥伦比亚大学的2位研究人员发现，智能体能够像人类一样思考有很多的优势。

最新论文中，他们研究了智能体的「思想克隆」（TC）。

论文地址：https://arxiv.org/pdf/2306.00323.pdf

这里，人工智能通过模仿人类，学会像人类一样「思考」和「行动」。

当AI有了思想

要知道，语言是区分人类和其他生物的关键。

因此，研究人员设想，如果智能体能够理解语言，便会有很多的好处。

比如，帮助人类概括、推断、适应新的情况、将新的方式结合已有的知识，探索、计划、并在必要时重新计划。

尽管有这些益处，但AI智能体却很少思考，至少不是用人类语言去思考。

虽然神经网络可以被认为是思考的内部向量激活，但许多人假设，以离散的、符号的语言进行思考具有特定的好处。

这意味着能够用语言思考的智能体，可能比不用语言的智能体学习得更快，表现、概括得更好。

基于所有这些原因，增强AI智能体用语言思考的能力可以产生许多显著的优势。

Jeff Clune和Shengran Hu认为实现这一目标的最有效的方法是「让AI模仿人类思考」。

他们发现，人类不会孤立地获得思维技能，相反，他们一部分技能的获得是通过他人示范和教师提供的反馈来学习的。

因此，一个有效的方法是，让智能体从人类在行动时把想法说出的演示中进行学习。

这一方法不同于现有的用预训练LLMs进行规划的工作，因为这些LLMs没有受过人类在行动时说出想法的数据进行训练，即「思想数据」。

至于「思想数据」的来源，研究者选取了YouTube视频和文字录音，有大约数百万小时，包含了人们行动、计划、决定和重新规划背后的思想。

论文中，研究人员提出了一个新颖的模仿学习框架「思想克隆」。其中，智能体不仅学习人类的示范行为，如行为克隆，而且学习人类行动同时的思考方式。

在思想克隆训练框架中，智能体学习在每个时间步中产生思想，并随后根据这些思想调整行动。

整体框架如图所示，TC智能体是一个双层架构：上层和下层组件。

在每个时间步中，智能体接收一个观察、一个任务和一段思维历史作为输入。上层组件负责思想生成，下层组件产生以这些思想为条件执行操作。

然后，将生成的想法和行动与演示数据集中的基本事实进行比较，以计算损失。

虽然对于上层和下层组件的条件可能有不同的选择，但在这项工作中，对于思维数据集中长度t的特定轨迹，研究人员将其最小化：

对于更复杂或大规模的场景，上层组件可以使用预训练视觉语言模型（VLM）来实现，或者零样本、微调。

而下层组件可以从头开始训练，或者从目标域中现有的语言条件控制器中改编。

论文中，研究人员基于BabyAI 1.1模型体系结构的两个组件进行了研究。

该模型利用内存增强架构LSTM来解决部分可观测性的挑战。此外，它还采用FiLM进行模态融合，有效地结合了视觉和文本输入。

这里，作者特别强调，本文中的所有模型都是从头开始训练的，但在复杂领域中还是使用预训练模型更强。

如下图，是BabyAI环境示例，左图中包含了各种颜色的物品（球、钥匙、盒子、门）。

智能体可以拿起、放下、移动物体或者开门和关门，而锁住的门只能用颜色匹配的钥匙打开。

智能体可以看到它前面的7×7的网格单元，这些网格单元是被墙壁和关闭的门阻挡。

「思想克隆」智能体的任务是，到达紫色的盒子（高亮显示），并开始规划了路线。

但是当它打开蓝色的门时，准备完成任务，却发现一个紫色的球挡住了去路。于是，思想克隆智能体再重新规划。

由此可以看出，智能体的想法和行动表明，当遇到障碍时，先将其移除，并在继续之前的目标前，重新计划路线。

这一过程，就特别像艾娃如何一步一步策划，让人类最终相信并帮助自己，逃出囚禁已久的玻璃牢笼。

实验结果

研究结果表明，「思想克隆」优于行为克隆。

此外，在零样本和微调设置中，思想克隆在分布外的任务中比行为克隆优势更大。

有趣的是，研究人员还开发了「预犯罪干预」，允许用户在模型训练后仍能定义不安全行为。

当检测到危险的想法时，就能终止智能体。测试中，「预犯罪干预」的效果近乎完美，显示了它在人工智能安全方面的潜力。

「思想克隆」不仅使人工智能更聪明，而且更安全，更容易理解。

就是说，当AI犯罪前，一切还有得救。

在Jeff Clune看来，「思想克隆」有助于人工智能的安全。

因为我们可以观察到智能体的思想：（1）可以更容易地诊断出事情出错的原因，（2）通过纠正智能体的思想来引导它，（3）或者阻止它做所计划的不安全的事情。

作者介绍

Jeff Clune

目前，Jeff Clune是不列颠哥伦比亚大学计算机科学副教授。他主要研究深度学习，包括深度强化学习。

此前，他还是OpenAI研究团队负责人，Uber人工智能实验室的高级研究经理和创始成员。

此前，他和OpenAI团队发布了视频预训练模型——VPT，让AI在我的世界中从视频数据中学习造石镐。

Shengran Hu

目前是不列颠哥伦比亚大学的博士生，对深度学习，人工智能生成算法感兴趣。

参考资料：

https://twitter.com/ericjang11/status/1665453341789536256

本文为专栏作者授权创业邦发表，版权归原作者所有。文章系作者个人观点，不代表创业邦立场，转载请联系原作者。如有任何疑问，请联系

标签：

热门资讯

淄川税务：乡村振兴“添动能” 绘就最美“税务蓝” 为切实保障涉农企业稳定发展，近日...
视频|辅警一边飞奔一边甩脱衣服，跳入洪泽湖救人当前最新 扬子晚报网6月16日讯(通讯员李小珍...
媳妇是怎样炼成的剧情（媳妇是怎样炼成的全集） 1、该剧剧情围绕着彭俏俏和范亮两...
大摩：予恒隆地产增持评级目标价17.5港元 大摩发布研究报告称，5月中国奢侈...

观察

图片新闻

热文：赓续未来携手共进∣2023年NEC商教机区域渠道会暨新品发布会首站启动 仲夏之际，夏普恩益禧视频科技（中...
世界新资讯：外媒：日本拟制定新法禁止应用商店垄断 据日本共同社报道，围绕智能手机应...
A股三大指数集体收涨：深证成指七连阳北向资金净买入超百亿元资讯推荐 A股三大指数今日集体收涨，沪指涨0...
工业和信息化部：组织电力企业、充电桩建设运营企业协同下乡加强充电基础设施建... 据工业和信息化部6月16日消息，今...

精彩新闻

今日热文：我，95后，不买阿迪达斯 作者|唐飞编辑|林比利近年来，阿...
国足大胜！中国队4:0胜缅甸 今晚，国际足球友谊赛，中国队在大...
瞄准诱惑巨大的减肥市场，外资巨头和国内药企开始较量 《中国经济周刊》记者侯隽|北京...
环球最资讯丨榆阳区：雁飞千里靠“头雁” 农民致富“主心骨” 乡村要振兴，人才必先行。全面推进...
再加息1%才能让美股跌！富国银行：AI巨头将迎来“互联网时代式”热潮 富国银行称，除非美联储再至少加息...
快消息！交通运输部部长李小鹏会见蒙古国交通运输发展部部长宾巴朝格特 据交通运输部6月16日消息，今日，...
绵竹市公安局交警大队参加“安全生产月”宣传活动 为切实开展“安全生产月”活动，增...
淄川税务：乡村振兴“添动能” 绘就最美“税务蓝” 为切实保障涉农企业稳定发展，近日...
娱乐圈最干净的三大女星，至今没有男朋友，也没人敢娶她们_世界新视野 都说娱乐圈太乱，娱乐圈的女星没有...
2023新手如何选择靠谱的互联网项目？ 2023新手如何选择靠谱的互联网项目...
德约科维奇成为网坛GOAT，费德勒怎么看？诺瓦克还能继续创造历史环球今热点 塞尔维亚超级巨星、网坛GOAT德约科...
新疆天业2万吨/年氯化高聚物项目顺利通过竣工验收 6月15日，记者从新疆天业集团获悉...
天天视讯！银川市兴庆区检察院多举措办理知识产权案件 民主与法制网讯（记者惠晓锋）自20...
观天下！乖戾少女暗恋邻家哥哥，赵露思陈哲远《偷偷藏不住》定档 今（16）日，由赵露思、陈哲远领衔...
何小鹏：不怕输！三季度走入正循环_天天视讯 在十五届中国汽车蓝皮书论坛上，小...
国家反诈中心公布 : 十大高发诈骗类型 1月18日，江苏南京市民方女士接到...
长光华芯：是客户验证阶段，Q3、Q4会有收入 长光华芯68804806月16日在投资者关...
国家金融监督管理总局：同意解散天津物产集团财务有限公司全球实时 国家金融监督管理总局关于天津物产...
观热点：三年频繁换帅，江铃福特营销断档，刘继升能否扳回一局？ 企业为谋求更好地发展，人事变动很...
普京：俄罗斯2023年4月GDP同比增长3.3% 据央视新闻，当地时间6月16日，第2...
谭木匠梳子官方旗舰店（谭木匠）-环球快播报 当前大家对于谭木匠都是颇为感兴趣...
全球速讯：奇文共赏：“只火了一个月的《原神》，对比其他手游到底差在哪里？” 网上冲浪的时候不小心看到这篇稿子...
乌鲁木齐经开区（头区）“大盘菜”培训班开到家门口用技术赋能就业_全球新动态 为进一步提高居民技能水平和就业能...
高考出分前的“关键14天”：志愿填报选择权增加，生涯规划既突然又迫切 2023年高考已经结束，迎接1291万考...
bt首发转_bt首发地址世界今日讯 1、钉钉是一款很好用的办公学习软...
【世界播资讯】“亮剑浦江·消费领域个人信息权益保护专项执法行动”启动 当前互联网+服务的场景日益丰富，...
焦点精选！碧桂园文商旅签约濮阳南乐大乐城将打造为碧乐汇 南乐大乐城项目位于濮阳市南乐县，...
信用卡逾期还不上会被判刑吗？信用卡怎么申请停息挂账？ 信用卡逾期还不上会被判刑吗若是确...
小鹏汽车法务部晒立案告知书已掌握数位造谣人身份新资讯 易车讯6月16日，小鹏汽车法务部在...
环球新资讯：同演陆雪琪，杨紫演技，李沁气质，看到唐嫣，才知什么叫书中走出 陆雪琪，是《诛仙》的女主角，是诛...
成都大运会官方门票发布！实名购票、实名入场焦点报道 6月16日下午，第31届世界大学生夏...
关注：包装纸TOP10排行榜：2023年第一季度股票净利率排名一览 包装纸TOP10排行榜：2023年第一季...
中国著名出版社联合发布学术图书英译成果力推中国学术走向世界 中新网北京6月16日电 (记者应妮...
今日辟谣（2023年6月16日） 今日辟谣（2023年6月16日）
平安健康(01833)重磅成立数智新体检研究院跑出企业健康发展加速度天天看热讯 6月16日，由平安健康(01833)主办，...
日本上半年流行语排行榜出炉！“蛙化”“蛇化”啥意思？中国网友不理解 6月16日电据日本头条网报道，近日...
安芯网盾北京科技有限公司-天天快消息 1、安芯网盾（北京）科技有限公司...
状元大热！陈国豪19中11砍全场最高25分外加10板5帽3断-世界看热讯 CUBAL全国赛半决赛，广东工业大学8...
阿里巴巴总裁谈马云近况：他在东京教书，很有活力很开心，将有更多时间待在中国！ 每经编辑：李泽东据澎湃新闻援引路...
天津小学学位控制政策汇总（持续更新）速读 天津小学学位控制政策汇总➤和平区...
世界银行新行长彭安杰：中国不是竞争对手 世界银行新行长彭安杰：中国不是竞...
自动驾驶出租车要来了？深圳将错位打造智能网联汽车商用场景 南都讯记者张艳丽2023全球智能网联...
校企合作产教融合——三亚理工职业学院“三亚亚特兰蒂斯现代旅游产业学院”正式揭牌 此次三亚亚特兰蒂斯现代旅游产业学...
成都有几个飞机场和火车站_成都有几个飞机场-重点聚焦 1、民用的当然是双流机场抄了军用...
每日焦点！许海东：汽车开发，欧洲要4年，我们仅要1年半 6月16日，在2023年新能源汽车下乡...
德国5月批发价格同比下降2.6% 为近三年来最大降幅|观察 中新社柏林6月14日电根据德国联邦...
思锐N-2205 1、思锐N-2205产品类型是专业脚架+...
世界今热点：公司电脑没声音怎么调出来_我电脑没声音了怎么调出来 1、从硬件方面来判断电脑没有声音...
全球今日报丨《梦中的那片海》最强“渣男”：歌手出道，剧中盼孩，剧外已当爹 陈宏军曾是肖春生最忠实的小弟，性...
天天新动态：今麦郎董事长范现国：我们最有机会与农夫山泉掰手腕 据中研普华报告，国内瓶装水行业划...