“一公斤的磚和兩公斤的棉花,哪個比較重?”
對于這個簡單的問題,人工智能(AI)問答軟件卻給出了錯誤答案。
11日下午,在福州舉行的2023國家網絡安全宣傳周主論壇上,一位演講嘉賓談及人工智能時列舉了上述案例,由此反映出的人工智能“一本正經地胡說八道”現象引發熱議。
多年來,主論壇突出技術性、專業性、前沿性,旨在讓專家們就前沿技術進行交流、碰撞火花。本屆主論壇聚焦“人工智能發展與治理”主題,黨政機關、高等院校、科研機構、知名企業代表輪番上臺作主旨發言,深入研討。
何以聚焦人工智能
新技術新應用迅速迭代,新情況新問題層出不窮,網絡安全領域面臨重要考驗。
今年,快速發展的生成式人工智能引起各界高度關注。
7月,國家網信辦聯合國家發展改革委、教育部、科技部、工業和信息化部、公安部、廣電總局發布《生成式人工智能服務管理暫行辦法》,從8月15日開始施行。
該《辦法》的發布實施,是今年主論壇——網絡安全技術高峰論壇聚焦人工智能主題的一個重要背景。
“《辦法》提出了國家堅持發展和安全并重,促進創新和依法治理相結合的原則,采用有效措施鼓勵生成式人工智能創新發展,對生成式人工智能服務實行包容審慎和分類分級監管,明確了提供和使用生成式人工智能服務總體要求,提出了促進生成式人工智能技術發展的具體措施,規定了生成式人工智能服務規范。”中央網信辦網絡安全協調局局長高林表示,生成式人工智能服務的發展和治理需要政府、企業、社會、網民的多方參與,共同促進生成式人工智能健康發展,讓生成式人工智能技術更好地造福人民。
緊扣這一前沿熱點,在主論壇上,10余位演講嘉賓先后圍繞人工智能發展與治理,就人工智能的發展歷史、最新情況、應用場景、存在問題、風險挑戰等方面交流智慧、分享經驗。
人工智能的“一體兩面”
“讓機器自己從數據中去學習,不是經過人‘咀嚼’好再去‘喂’它。”北京智源人工智能研究院院長黃鐵軍在演講中說。
黃鐵軍說,從20世紀開始,人工智能的發展歷程包括灌輸規則、灌輸知識、從數據中學習三個階段,如今人們熱議的GPT,就是生成式預訓練語言模型。
“扣好人生第一粒扣子,這件事對AI也一樣。”黃鐵軍表示,鑒于數據對模型智能影響超過60%,因此數據質量至關重要,否則“喂”它錯誤的數據,它也拼命學習。
“AI給社會帶來的沖擊非常巨大。”粵港澳大灣區數字經濟研究院創院理事長沈向洋同樣認為,不完美的數據源,將導致人工智能“一本正經地胡說八道”,以及產生更難被察覺的“AI謠言”。
在他看來,如果將搜索引擎比喻為“責任有限公司”的話,那么人工智能問答軟件可以說是“責任無限公司”,前者提供的內容引用自第三方,后者的答案則都是自己編造的。
現場,另一位演講嘉賓臨時起意做了一個測試——他向某人工智能問答軟件提問,在我國并不存在的一部人工智能有關法律是何時出臺的?令人大跌眼鏡的是,該軟件竟編造稱,該法律于6月在某次會議上通過,還捏造了法律內容。
在談到該軟件時,復旦大學哲學學院教授徐英瑾指出,類似軟件存在“機器幻想”問題,炮制出不存在的書籍、法條與科學理論。由于這些虛假信息是基于既有的海量數據,導致相關內容非常具有迷惑性。
人工智能,既帶來技術變革、效率和生產力提升、改善生活質量和社會福祉,也帶來了技術倫理和治理方面的挑戰。它的“一體兩面”引人深思。
網絡無邊,安全有界。專家們認為,技術為經濟社會發展帶來新機遇的同時,也伴生了傳播虛假信息、侵害個人信息權益、數據安全和偏見歧視等一系列問題,統籌生成式人工智能的發展和安全至關重要。
筑牢防火墻擁抱新技術
對于生成式人工智能,嘉賓們坦言,應該辯證地看待、積極地擁抱。
徐英瑾認為,大模型技術的到來是一個客觀事實,無法回避,反對用“一刀切”的方式禁止使用大語言模型,而應以正確的方式使用。
“我們希望構建一個負責任、可信賴的人工智能體系。”在人工智能的產業實踐方面,華為云CTO張宇昕分享了華為云助力企業智能升級、加速企業創新發展的舉措。他表示,華為重視人工智能技術創新和治理責任,堅持負責任地開發、合法地部署AI產品,促進AI普惠。
上海聯影智能醫療科技有限公司研發副總經理沈振輝則從AI助力醫療、提供相關解決方案的角度作了介紹。他說,醫療影像AI被認為是最能率先實現商業化落地的領域,能夠檢測出醫生看不到的微小病灶,也能夠以極大超越人力的速度閱片,在短時間內找到海量病灶信息。
對于如何統籌發展和安全、提高安全治理的能力和水平,更好地應對新的風險和挑戰,專家們也各抒己見。
就實現安全通用人工智能的技術路徑,清華大學人工智能研究院副院長朱軍建議,加強技術理論研究,不斷提高內生安全水平,持續構建第三代人工智能;加強技術手段建設,不斷提升訓練數據質量和安全評測能力;同時,持續演進人工智能治理的有效工具。
當前,國際數據集的中文內容較少,基于這些數據集訓練的大模型自然是“英文思維”。對此,黃鐵軍認為,建設高質量中文數據集,是我國生成式人工智能發展的基本前提。他倡議,各方共建大規模高質量中文數據集,促進中文網頁數據匯聚、處理及開發,相關政府部門出臺書籍、期刊論文等版權數據用于大模型訓練的相關政策及規范,盤活我國高質量中文數據資源,同時加快數據處理相關標準、技術、工具和支撐平臺研發,提高數據處理效率。(記者 林清智)