我们正在向Meta 创建的人工智能代理“ Cicero ”教授棋盘游戏。该计划是教授一切内容,从对话、说服和背叛的概念到如何通过棋盘游戏学习制定策略。
ⓒ 盖蒂图片银行
根据Meta在学术期刊《科学》上发表的 一篇研究论文,人工智能特工西塞罗是第一个能够成功玩战略棋盘游戏“外交”的人工智能。西塞罗与 82 名人类参与者进行了 40 场比赛,结果他展示了一次参加比赛的前 10% 的人的技能。Meta预计西塞罗从游戏中学到的能力可以应用于自然语言处理(NLP)和策略推理等技术,然后可以用来开发智能虚拟助手。
是一款七名玩家争夺欧洲地图控制权的游戏
游戏参与者必须互相协商以获 土耳其电话号码数据 得外部支持,没有其他参与者的支持,他们就无法移动到他们想去的地方。
根据 Meta 的说法,这些游戏对于人工智能代理来说很难学习。这是因为你必须弄清楚对方是否正在计划赢得比赛的策略,或者他们是否在撒谎。人工智能必须表现出一定程度的同理心,以便在玩游戏时与其他玩家形成协作关系,而在玩国际象棋等游戏时则不需要这种能力,而这些游戏以前广泛用于人工智能学习。
同时,AI代理的策略博弈能力稳步提升。1997年,IBM的深蓝软件击败了世界象棋冠军加里·卡斯帕罗夫,2016年,DeepMind的AlphaGo击败了世界级围棋选手李世石。Facebook 还开发了另一种人工智能代理,可以在扑克游戏中超越人类。
Cicero 建立在两个要素之上:策略推理和自然语言处理 (NLP)。根据研究人员的解释,战略推理引擎预测其他玩家的数量,并利用该信息来制定自己的策略,而自然语言处理引擎则在与其他玩家的对话中生成消息,分析反应并协商达成协议。
为了帮助 AI 代理生成适当的对话 研究人员使用了一个自然语言生成模型
该模型具有 27 亿个参数,根 数字列表 据来自互联网的文本进行了预训练,通过 Web DeployMacy.net 玩了超过 40,000 次游戏,并在游戏过程中与人类参与者进行 过程也用于学习。
研究人员在博客文章中表示:“我们开发了一种自动注释训练数据的技术。因此,可以控制对话生成,以讨论智能体及其对话者在推理时间内的具体期望动作。”
Meta 将源代码作为开源发布,以便其他研究人员可以利用 Cicero。此外,Meta 有一个单独的页面,以便任何对使用外交和 NLP 感兴趣的人都可以提出研究建议。准备好了。提交截止日期为1月23日。
微软、谷歌、亚马逊等大型科技公司正在竞相开发更智能的虚拟助手。这些技术有多种用途,从呼叫中心到情感分析和教育。根据财富商业洞察报告,包括虚拟助理在内的全球自然语言处理 (NLP) 市场预计将从 2022 年的 264 亿美元增长到 2029 年的 1618 亿美元。
Meta研究人员预计Cicero可以取代其他虚拟助手,因为Cicero成功地玩了与Diplomacy相同的游戏并表现出了很高的性能。目前的人工智能助手可以完成简单的问答任务,例如告诉你天气,但西塞罗在为了教授新技能而进行长期对话时更有用。
然而,西塞罗的推理水平只能在简短的对话中才能实现,而在长时间的对话中可能无法理解上下文。Meta 研究人员在论文中表示:“从战略角度来看,西塞罗纯粹通过观察玩家当前的行动来推断对话。” “从长远来看,我们没有模拟这些对话将如何影响我们与其他玩家的关系。