首页 > 汽车生活 > 汽车生活 > 致幻的AI Overviews,谷歌再次翻了车

致幻的AI Overviews,谷歌再次翻了车

发布时间:2024-05-28 22:45:18来源: 15210273549

继将马斯克画成黑人后,谷歌再次翻了车。(虎嗅注:今年2月份,谷歌的Gemini在推出文生图功能几周的时间内,被用户发现该平台刻意拒绝生成白人形象。对此谷歌方面表示加快改进,暂停人物图片的生成功能。)

此次谷歌又犯了前科。在5月15日推出这一AI搜索引擎功能后,有不少用户在使用过程中发现谷歌的AI Overviews会“胡言乱语”,对搜索的问题给出有违常识的、荒谬的解决方案。比如,兔子曾经作为密尔沃基鹰队的后卫在NBA打过球、金毛犬可以生下奶牛、建议人们每天至少吃一块小石头……

此外,谷歌的人工智能搜索系统有时会难以解决基本的数学问题和方程式。例如,询问2000年美元的相对价值,会返回一个荒谬的答案,即“2000 年至 2023 年期间价格累计上涨 -43.49%”(根据谷歌自己引用的通胀计算器,当时价格实际上涨了77% );又或是认为2024年10月至2025年1月之间有 738,523 天。

AI Overviews是谷歌在5月15日的I/O大会上高调推出的新型AI搜索引擎,由Gemini大模型驱动,展示在谷歌搜索的页面顶部,可总结提炼用户查询内容的概要。在I/O大会上,谷歌称该功能将“重新定义搜索体验”。由于这一功能的推出,一些专家甚至将这一天称为 Google 搜索的“零日”。 2023年5月推出的Search Generative Experience是AI Overviews的测试版。CEO 桑达尔・皮查伊曾表示,在测试版推出后谷歌已经处理了超过 10 亿次查询。

之所以会犯这样的错误,最直接原因是Reddit网站网友评论的错误数据。谷歌的大模型以Reddit上的帖子作为学习资料,在数据清洗与训练环节出现纰漏,因而出现了“大模型致幻”。

事实上,谷歌这样“满纸荒唐言”并非个例。

谷歌之外,OpenAI、Perplexity、You.com等无一幸免,均出现过不同程度的失误。为了增强对话的拟真性和数据的全面性,这些AI搜索功能都将Reddit等社交平台作为模型训练的数据库,甚至奥特曼本身便是Reddit的投资人。

但Reddit等社区上的发言良莠不齐,显然AI在内容真实性和可靠度方面的判断力还未成熟。在常规的搜索中,这些来自随机互联网用户的恶作剧帖子可能不会成为人们点击网络链接列表时看到的首个答案。但有了AI Overviews后,这些恶作剧帖子就被整合到结果页面顶部显示的权威数据摘要中。

本质上,AI Overviews此次出现的问题是人工智能幻觉的一种新变体,当生成式人工智能模型提供虚假或误导性信息并将其呈现为事实时,就会出现幻觉。幻觉是由有缺陷的训练数据、算法错误或对上下文的误解造成的。

HITCon安全会议上的相关研究成果显示,仅仅需要“污染”不到0.7%的数据集,就能有效规避防御机制,导致大模型输出的内容准确性大幅下降。当大模型被投喂的数据集含有误导性信息时,其给出的结果必然同样失真。

对此,纽约大学的AI专家和神经科学荣誉教授加里・马库斯(Gary Marcus)曾表示,AI模型天生无法对自己的工作进行理性检查,而这正是这个行业的致命伤。

而谷歌发言人梅根・法恩斯沃斯则表示,“用户展示的事例都是不常见的查询,并不代表大多数人的经历,我们也看到了一些被篡改或我们无法复现的例子”“绝大多数 AI 概览查询都产生了高质量信息,并提供了深入挖掘网络的链接”。谷歌将使用有问题答案的“孤立例子”来完善其系统。

汽车生活更多>>

风云A8降2万 如今这个价格是怎样做到越级之选的 家门口享受原厂服务,北京现代联手京东养车,车主修车更方便了! 智领未来!北京现代携手京东养车,开启数字化养车全新时代 4月多款新车上市 方程豹钛3预计小订单轻松破万!订单数据和用户画像如何? 12.98万元搭配激光雷达智驾!零跑B10的预售成绩火爆 奇瑞“不客气”,混动技术如何智领全球? 吉利银河星耀8预售开启:中国豪华电混轿车的“破局者”来了! 国民车红旗H5 PHEV 国车级超规格全维安 比亚迪腾势Z9 GT交付破万,创新能源豪华GT车型最快纪录 小姐姐最爱买的电动车:小鹏MONA M03累计交付超6万台 方程豹豹8交付破万,国产硬派SUV新速度 smart品牌全球销量增长7%,2025年拓展超10个海外市场 虞美人花在废墟上绽放:加拿大的战争纪念 甘会斌|人间已无格尔茨 秉持国匠担当,天津城投·时代之城引领城市更新迭代 理解贵州|红色IP,何以鲜亮如新——解码贵州红色之旅的现代表达 上海春运办:对外客运量呈快速增长趋势,明天将发送63万人次 《国色芳华》:花开应傲骨 我要去长安探秘,长安汽车黑科技体验营免费开放 比亚迪全新跑车曝光,对标保时捷911,老百姓买得起不? 丰田MR2有望重生,Celica及旗舰超跑也在路上 自动驾驶新时代即将到来?中美两地对比测试小鹏特斯拉智驾系统 比亚迪唐L霸气来袭,提供无人机舱,1月17日正式发布,剑指理想L6 捷尼赛思GV60 Magma能否凭借650马力刷新高性能电动车市场格局? 37年聚焦中国用户需求,一汽奥迪以“56789” 体系再现王者实力 6.2L V8机增+720Ps马力,4秒内破百,美式SUV顶流,油门给我踩踩踩! 2025年舟山市定海区民政局招聘社会救助专职社工公告 2025年温州市苍南县人武部招聘民兵教练员驾驶员公告 2025年绍兴科技馆招聘工作人员公告