Meta人工智能研究实验室创建了一个先进的聊天机器人,如今向公众推出以收集功能反馈。该机器人名为BlenderBot 3,它可回应你的一般聊天请求,有时候也可以担任数字助理一类的角色。美国地区用户可通过以下网址访问:http://blenderbot.ai/
BlenderBot 3建立于Meta之前所使用的大型语言模型或LLMS基础之上,是一款功能强大但存在缺陷的文本生成软件,旗下同类型原型还有OpenAI和GPT-3等。BlenderBot在庞大的文本数据集上进行训练,通过挖掘统计模式以生成语言。
一些对话示例,图源:Meta
这类系统已被证明是非常灵活的,并且已经在很多地方有所应用,如为程序员生成代码、帮助作者写一本畅销书等。然而,这些模型也有严重的缺陷:它们会在训练数据中出现regurgitate biases(反刍偏见)、对用户的问题编造答案等问题(如果它们要成为有用的数字助理,这是一个大问题),而后一个问题是Meta特别想用BlenderBot进行测试的。
通过向公众发布聊天机器人,Meta希望收集有关大型语言模型面临的各种问题的反馈。与BlenderBot聊天的用户将能够标记来自系统的任何可疑响应,Meta表示,它正在努力“尽量减少机器人使用粗俗语言、诽谤和文化上不敏感的评论”。使用前,用户必须允许系统收集他们的使用数据,他们的对话和反馈将被存储记录并发布出来,以供一般AI研究社区使用。
从历史来看,向公众发布原型AI聊天机器人是一个冒险的举动,2016年,微软在推特发布了一款名为Tay的聊天机器人,它可以在与用户互动过程中进行学习。不过,它很快就被用户灌输种族主义、反犹太主义等不良言论,最后微软被迫在24小时内把它下线。
Meta表示,自从Tay事件后,人工智能的世界发生了很大变化,BlenderBot拥有各种各样的安全栏,可以阻止Meta重蹈覆辙。
Facebook AI Research (FAIR) 的研究工程经理Mary Williamson指出,Tay从用户的交互中实时学习,而BlenderBot是一个静态模型,这意味着它能够记住用户在对话中所说的内容(有时候甚至会通过浏览器cookie保留数据),但这些数据只会用于进一步改进系统。
Williamson表示,当今使用的大多数聊天机器人都是狭隘且面向特定任务的,比如常见的客服机器人通常只是向用户展示一个预先编程的对话树以减少用户的查询范围,剩下的再交由人工进行处理。而他们设想建立一个可以像人类一样进行自由和自然对话的系统。
除了BlenderBot 3以外,Meta还发布了底层代码、训练数据集和更小的模型变体。研究人员可以通过Meta相关链接访问拥有1750亿个参数的最大化模型。
来源:TheVerge