【文/觀察者網(wǎng) 陳思佳】澳大利亞政府去年與知名會計事務所德勤(Deloitte)簽訂一份價值44萬澳元(約合人民幣206.4萬元)的合同,委托該公司編寫一份獨立評估報告。然而,專家發(fā)現(xiàn),德勤今年早些時候發(fā)布的報告錯誤百出,還引用了一些根本不存在的參考文獻,很可能是生成式人工智能的“幻覺”問題導致的。
據(jù)澳大利亞《金融評論報》10月5日報道,報告內(nèi)容遭到質(zhì)疑后,德勤承認在編寫報告時使用了生成式AI工具,同意向澳大利亞政府退還部分費用。德勤已修改報告中出現(xiàn)的紕漏,但沒有說明錯誤與AI有關,并堅稱“報告中的實質(zhì)性內(nèi)容、結果和建議不受影響”。
德勤在今年7月發(fā)布了第一版報告,內(nèi)容涉及對澳大利亞福利系統(tǒng)中自動實施處罰的信息技術系統(tǒng)的評估。但不到一個月后,悉尼大學學者克里斯托弗·拉奇注意到,報告中存在多個錯誤,包括引用了不存在的學術參考文獻和虛構的法院判決。
拉奇推測,這些錯誤可能是生成式AI的“幻覺”導致的。德勤最初拒絕對這一問題發(fā)表評論,但在當?shù)貢r間10月3日,該公司悄悄更新了發(fā)布在澳大利亞就業(yè)和勞資關系部(DEWR)網(wǎng)站上的報告,刪除了虛構的參考文獻列表,并更正了多處筆誤。
德勤在澳大利亞墨爾本的辦公室 視覺中國
德勤沒有說明錯誤與AI有關,但在報告附錄中承認使用了“DEWR許可的生成式AI大語言模型(Azure OpenAI GPT-4o)工具鏈”。德勤堅稱,報告的更新“不會影響報告中的實質(zhì)性內(nèi)容、調(diào)查結果和建議”,“此事已直接與客戶解決”。
DEWR發(fā)言人表示,德勤已同意向澳大利亞政府退還合同的最后一期費用,但拒絕透露具體金額。這名發(fā)言人也拒絕回答該部門是否認為報告的錯誤與德勤員工使用AI有關,僅表示“獨立審查的實質(zhì)性內(nèi)容將被保留,建議沒有發(fā)生變化”。
《金融評論報》指出,這起事件將德勤置于尷尬境地,因為該公司正在向客戶和企業(yè)高管提供有關AI的咨詢和培訓服務。目前德勤每年全球收入達705億美元,有關AI的咨詢在其中的占比越來越高。德勤還多次強調(diào),所有AI生成的內(nèi)容都必須經(jīng)過人工審查。
盡管德勤和澳大利亞政府堅稱報告的“實質(zhì)性內(nèi)容”不受影響,但最先發(fā)現(xiàn)問題的拉奇表示,德勤一開始沒有說明使用了AI完成核心分析任務,這降低了報告的可信度。
拉奇認為:“當報告的基礎建立在有缺陷的、最初未公開的且非專業(yè)的方法之上時,你就不能再相信這些建議?!?/p>
英國《金融時報》稱,包括德勤在內(nèi),全球知名的四大會計事務所已為AI研發(fā)投入巨額資金,他們希望利用這項技術來加快向客戶提供建議和審計的速度。但德勤這起尷尬的事件,反映出咨詢公司在使用AI技術時存在的風險,特別是AI“幻覺”問題的風險。
英國會計監(jiān)管機構6月曾警告說,四大會計事務所日益依賴AI和自動化工具來進行風險評估,但這些公司并未有效追蹤此類技術對審計質(zhì)量的影響。
澳大利亞《金融評論報》認為,AI技術的好壞取決于其使用者,如果德勤能夠指派員工對報告的內(nèi)容和參考文獻的準確性進行充分的審查,本可以避免這起尷尬的事件。該報評論稱:“AI在現(xiàn)代職場中無處不在,但它還無法完美替代人的智慧和判斷?!?/p>
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權,不得轉(zhuǎn)載。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.