【現(xiàn)象】使用人工智能大模型時,不少人或許都遇到過類似問題:它們有時會捏造細節(jié),甚至“一本正經(jīng)地胡說八道”。比如,讓它推薦書,給出的卻是一堆壓根不存在的書名;人物身份張冠李戴,還能給出一些并不準確的鏈接……這些現(xiàn)象都可以歸為AI幻覺。
【點評】
所謂AI幻覺,可以通俗地理解為AI也會像人產(chǎn)生心理幻覺一樣,遇到不熟悉或超出“知識儲備”的問題時,編造一些并不存在的細節(jié),生成與事實相悖的答案。一項調(diào)研顯示,對于“公眾認為使用AI應用過程中有哪些突出問題”,反饋最多的是“內(nèi)容不準確,或含虛假信息”,占比高達42.2%。
AI幻覺從何而來?可能得從源頭尋找答案。
大模型的工作原理,是基于概率生成內(nèi)容。給它上半句,它就根據(jù)自己“學”過的海量知識,“算出”下半句該說什么。比如,當用戶輸入“今天天氣非?!?,它大概率會接“不錯”“熱”“潮濕”等答案,而不會出現(xiàn)“甜”。同時,大模型又不是簡單地儲存所有事實,而會像人腦記東西那樣,進行大量壓縮和泛化——也就是“抓概要、找規(guī)律”。因此,當“喂給”大模型的訓練數(shù)據(jù)包含虛假信息時,它就會產(chǎn)生“幻覺”、給出錯誤答案。
有報告顯示,我國生成式人工智能產(chǎn)品用戶規(guī)模達2.49億人。用戶規(guī)??焖僭鲩L,AI幻覺潛藏的風險也隨之增加。比如,如果一些看似合理卻與現(xiàn)實相去甚遠的內(nèi)容被AI反復學習,會形成“數(shù)據(jù)污染—算法吸收—再污染”的惡性循環(huán)。有效防范由此帶來的虛假信息泛濫,已成為不容回避的課題。
不過也有觀點認為,AI幻覺可被視作一種“發(fā)散思維”和“想象力”。理論上,如果把訓練一個大模型看作信息“壓縮”的過程,那么大模型經(jīng)過推理、輸出答案就是一個信息“解壓”的過程。這種處理信息的方式,可能會出現(xiàn)謬誤,也可能觸發(fā)新的創(chuàng)造。對發(fā)展尚未定型的新事物,要保持開放心態(tài),辯證看待其利與弊,在有效防范弊端的同時,給予足夠空間使之朝好的方向成長。
短時間內(nèi),AI幻覺問題難以被解決。各方都在努力降低其負面影響,相關部門也加大了對違規(guī)AI產(chǎn)品的處置力度,推動生成合成內(nèi)容標識加速落地。一些大模型廠商在積極行動,比如文心大模型利用檢索到的信息來指導文本或答案的生成,提高了內(nèi)容的質(zhì)量和準確性;通義大模型加強訓練語料管理,通過“紅藍對抗”機制提升對虛假信息的識別能力。對廣大用戶而言,則要加快提升AI素養(yǎng),學會“智慧”地運用“智慧工具”,既借助大模型破除思維定式、啟發(fā)創(chuàng)新思路,又提高自身有效獲取、理解、評估和使用信息的能力。
人類塑造工具,工具也影響人類生活。應對AI幻覺等問題挑戰(zhàn)的過程,既促使人們思考改進工作方法,也為AI不斷進化提供了源動力。激發(fā)新技術的正向價值,讓AI更好融入生產(chǎn)生活、賦能千行百業(yè),我們邁向智慧時代之路才能走得更加穩(wěn)當、更加順暢。(谷業(yè)凱)