科学家警告:用AI生成内容训练AI 将在几代内开始产生"垃圾"
2023-06-20 08:05:12 来源: 网易科技报道
6月20日消息,人工智能领域的专家预测,随着越来越多的人工智能生成的内容在网上发布,未来接受这些数据训练的人工智能最终将陷入混乱。
一群英国和加拿大的科学家在5月发表了一篇论文,试图了解几代AI相互训练后会发生什么。在一个例子中,经过九次迭代的人工智能系统会喋喋不休地谈论野兔,而最初的原始材料是关于中世纪建筑的。
该研究的作者之一、剑桥大学教授罗斯·安德森(Ross Anderson)在阐述关于研究结果的博客文章中写道,数据表明,“经过几次迭代后,人工智能输出的文字就变成了垃圾,图像也会变得无法理解”。这些科学家们的论文尚未经过同行评审,他们称这种现象为“模型崩溃”。
(相关资料图)
聊天机器人ChatGPT背后的大语言模型(LLM)通常需要从互联网上抓取大量数据进行训练,这些数据多为人类生成。但随着人们对这些工具的使用越来越多,人工智能生成的内容正被大量添加到在线数据池中,未来的LLM将从中学习。
科学家们说,利用人工智能生成内容对人工智能系统进行迭代训练,意味着错误和无意义的例子会不断增加,使后来的人工智能无法区分事实和虚构内容。他们担忧道,人工智能将“通过强化自己的信念,开始曲解他们认为是真实的东西”。
安德森用莫扎特(Mozart)和另一位音乐家安东尼奥·萨列里(Antonio Salieri)的作品来阐释这个问题。
他写道:“如果你用莫扎特的作品来训练某个音乐模型,你可以期待输出的音乐风格有点像莫扎特,但不会有太多亮点,我们可以称之为‘萨列里’。然后再利用‘萨列里’训练下一代人工智能系统,如此反复下去,第五代或第六代模型会是什么样子?”
这项研究的第一作者、牛津大学教授伊利亚·舒马伊洛夫(Ilia Shumailov)说,问题在于人工智能在接受早期人工智能生成内容的训练后对概率的感知。不太可能发生的事件越来越不可能反映在它的输出中,从而缩小了下一代人工智能(根据这种输出进行训练)所能理解的可能性。
在论文中给出的一个例子中,人类生成的关于中世纪建筑的文本通过人工智能语言模型输入,然后该模型的输出用于训练下一代人工智能。最初的文本巧妙地处理了相互竞争的建筑理论,并经过了多次这样的循环。
到了第九次迭代,这些文字就变成了毫无意义的胡言乱语。上面写着:“建筑是世界上最大的黑长耳大野兔、白长耳大野兔、蓝长耳大野兔、红长耳大野兔、黄长耳大野兔的家园。 ”
安德森将“模型崩溃”比作大规模污染,他写道:“就像我们在海洋里撒满了塑料垃圾,在大气中放满了二氧化碳,我们即将让互联网上充满胡言乱语。”
人工智能生成的内容已经在网上大规模出现。今年5月,在线虚假信息监管机构NewsGuard警告称,它发现49个新闻网站似乎完全由人工智能撰写内容。
据报道,市场营销和公关机构越来越多地将文案外包给聊天机器人,从而抢走了人类创作者的工作。但是,根据舒马伊洛夫和安德森的发现,希望不被人工智能打败的人类创作者还不应该开香槟庆祝。
舒马伊洛夫说,对于训练人工智能来说,人工生成的数据并不是绝对必要的,它之所以有用,是因为我们的语言产生了大量的自然变化、错误和不可预测的结果。
“所以,人类肯定会提供帮助,”他说。“与此同时,这也表明,在训练人工智能时,人类数据的需求不会非常庞大。”(小小)
标签:
为您推荐
精彩放送
热门文章
-
科大讯飞:讯飞星火大模型推动AI智能硬件销售增长 世界视讯
-
小米集团:斥资约2399万港元回购220万股
-
券商投资者教育工作评估结果出炉 33家获评A类 当前头条
-
圆通速递:5月快递产品收入同比增长6.43%
-
当前时讯:泰坦股份:拟收购新疆扬子江纺织100%股权
-
韵达股份:5月快递服务业务收入同比增长1.43%
-
今日快讯:威龙股份:由无实控人变更为实控人闫鹏飞
-
上海点钢电子商务编造、传播铁矿等期货交易有关的虚假信息 遭证监会行政处罚 -世界球精选
-
君实生物:注射用JS207药物临床试验申请获受理 |环球观速讯
-
国内首家5G聚合平台应用中心在深成立
-
世界快报:新潮能源:收到公安机关《立案告知书》
-
国办:建设便捷高效的城际充电网络和互联互通的城市群都市圈充电网络 _世界快消息
精彩图片
-
成本大减!新一轮的旗舰大战也将在即将到来的9月正式拉开帷幕
-
博览会开幕 中国首款具有自主知识产权的国产通用型科学计算软件正式发布
-
技术下降!Intel独立显卡驱动一次评测就发现43个Bug
-
高性能的台式机彻底告别“光污染” 雷克沙推出简洁纯白外观设计
-
韩国媒体率先报道:三星电子236层NAND闪存预计年内开始生产 市场竞争更激烈
-
新科技!苹果正在积极研发某种形式的AR/VR头显或智能眼镜
-
谷歌测试开展新功能 向用户展示哪些云流媒体服务拥有特定的视频游戏
-
支付宝积极响应国家为小微降费的政策号召 一年降费让利近80亿
-
京东汽车就与浦林成山旗下新能源车轮胎品牌浦林达成战略合作 助力轮胎“电动化转型”
-
苹果新专利公布:暗示未来 iPhone手机或许有陶瓷材质版
-
盖茨和韩国能源供应商SK共同牵头 其中SK投资2.5亿美元
-
海底捞早已经捞不动了 据统计上半年最高亏损达2.97亿
热文
-
环球快看点丨520你跟他过吧我没借到钱梗介绍
-
当前时讯:泰坦股份:拟收购新疆扬子江纺织100%股权
-
今日快讯:威龙股份:由无实控人变更为实控人闫鹏飞
-
券商投资者教育工作评估结果出炉 33家获评A类 当前头条
-
圆通速递:5月快递产品收入同比增长6.43%
-
韵达股份:5月快递服务业务收入同比增长1.43%
-
今日看点:遗传编码荧光RNA探针研究获新进展
-
步长制药:子公司获得于四价流感病毒裂解疫苗(MDCK细胞)临床试验批准通知书
-
环球观热点:告别高温,市民雨中逛京城
-
放榜在即:已有26省份明确将于6月23至26日间公布高考成绩|天天视讯
-
618增速超预期 京东云每秒用户访问峰值同比提升119%-全球今亮点
-
海口一特斯拉高速行驶撞飞小车 官方通报:致一死一伤 环球快资讯
-
当前焦点!做人、做戏、度人生 濮存昕:我和我的角色
-
上海点钢电子商务编造、传播铁矿等期货交易有关的虚假信息 遭证监会行政处罚 -世界球精选
-
君实生物:注射用JS207药物临床试验申请获受理 |环球观速讯
-
国办:建设便捷高效的城际充电网络和互联互通的城市群都市圈充电网络 _世界快消息
-
每日讯息!联想a820t移动版(联想A820t 移动版)
-
国内首家5G聚合平台应用中心在深成立
-
世界快报:新潮能源:收到公安机关《立案告知书》
-
全球快看点丨又有基金募集失败,年内已是第六起!还有上百只基金延长募集期
-
世界今亮点!卡通充值卡号和密码 4399卡通充值卡免费
-
厦门电力与清水进岛隧道土建工程海域段盾构顺利始发
-
借和贷哪个是进账
-
精选!地铁同站进出也收费?记者亲测:10分钟内可至服务中心进行人工退款
-
天天观点:马飞宇航员原型_马飞宇航员是真实的吗
-
乌克兰对阵马耳他的主场居然设置在斯洛伐克?
-
报道:新能源产业集聚度50强排名生变,哪些城市再进一步?
-
为夜生活注入新活力!瀍河区将新增多个街头艺术场景
-
今日观点!国家药监局5月批准注册175个医疗器械产品
-
小商品城:拟发行可转债募资不超过40亿元 _每日热点
-
速递!中际旭创出现4.29亿元大宗交易
-
【环球新要闻】城建发展:34.5亿元竞得北京市朝阳区部分地块
-
每日看点!阿里巴巴出售5000万股商汤-W 持股比例下降至5.91%
-
如何破解旅游高峰期厕所管理难题?文旅部支招:建设男女通用厕间,加强无障碍厕位和家庭卫生间建设-世界热资讯
-
商务部:前五月我国企业承接服务外包合同额同比增长12.3%
-
世界观察:上汽集团:拟60亿元投资上汽芯聚创业投资合伙企业
-
最资讯丨从收单结算到搭建企业级跨境金融解决方案 跨境支付服务机构如何“破局”
-
“十九年十九城”上交所ETF高峰论坛招商基金专场成功举办 全球看点
-
吉林养老金调整方案2023今日公布没?吉林企退人员工资如何调整计算?
-
6天5板华西股份:公司间接持有索尔思光电28.17%的股权
-
Synthetix创始人:建议在V3版本中引入新的SNX质押模块-天天观热点
-
我国近年平均气温波动式上升,未来五年每年全球都可能是“史上最热”_今日快讯
-
西藏矿业:子公司与倍杰特签订合作协议
-
朗姿股份:拟3800万元参与设立医美创投基金 前沿资讯
-
精工科技:拟1200万元收购智杰科技持有的精功机器人40%股权
-
文旅部进一步加强旅游厕所建设管理 电子地图标注率应达95%以上
-
我是一条幸福的蚯蚓作文_关于我是一条幸福的蚯蚓的作文 天天新动态
-
世界新动态:华海药业:氨磺必利片获药品注册证书
-
热头条丨海鸥股份: 江苏海鸥冷却塔股份有限公司关于为子公司提供担保的进展公告
-
拼多多:“6·18”县域市场手机新品订单量同比增长130%_全球观察