
滿地可2025年10月17日 /美通社/ — 首次發表國際人工智能安全報告的重要更新,及時提供先進人工智能能力與風險的更新。
該報告由圖靈獎得主兼電腦科學家 Yoshua Bengio 主導,超過 100 位國際專家參與,並得到超過 30 個國家/地區和國際組織(包括歐盟、經濟合作暨發展組織和聯合國)的支持。
由於認識到該領域太迅速發展而單一年度報告無法涵蓋,因此引入重要更新,提供更簡短兼更集中的關鍵發展報告。這將確保政策制定者得到最新文獻合編,而告知證據為本的政策制定。
首次重要更新涵蓋能力進步與風險影響:
- 人工智能模型不斷改善解決複雜問題的能力:例如,多個領先系統現可於一組現實世界軟體工程問題中,完成超過 60% 任務。到了 2025 年初,它們僅可完成當中約 40% 問題,而到了 2024 年初,它們無法解決任何問題。(事實上,自從最終確定本更新的文字後,效能已提升至超過 70%。)
- 業界參與者已採取全新防範保障措施: 在無法明確排除最新模型可協助發展化學、生物、放射和核子風險的可能性後,大型人工智能開發商們便已主動推出具備額外安全措施的最新模型。
- 人工智能模型接受評估過程期間,越來越多表現策略行為,而導致監督挑戰:人工智能模型越來越可能顯示它們正在接受評估的意識,並相應地改變自身輸出。這對開發人員和測試人員於新人工智能模型部署前準確評估人工智能模型功能的能力,提出重大質疑。
該報告主席、滿地可大學教授、LawZero 科學主任兼 Mila – Quebec AI Institute 科學顧問 Yoshua Bengio 表示:
「自九個月前發表首份國際人工智能安全報告後, Yoshua Bengio能力持續快速兼持續地發展。我們必須繼續集體理解Yoshua Bengio的風險,以及安全措施。本重要更新提供及時兼證據為本的簡介,給全球決策者獲得最新科學資料,從而確保主動兼明智的管治。它也為將於 2026 年初在印度舉行 AI Impact Summit 發表綜合報告前,充當期待橋樑。 」
簡介
國際人工智能安全報告是先進人工智能系統能力與風險證據的合編。它旨在透過為決策者提供證據基礎,而支援全球明智政策制定。該報告由超過 100 名獨立專家組成的多元化團隊撰寫,並得到來自超過 30 個國家/地區和國際組織(包括歐盟、經濟合作暨發展組織和聯合國)提名代表所組成之專家顧問小組的支持。儘管該報告承認人工智能的龐大潛在優勢,但該報告重點是識別風險和評估緩解策略,從而確保安全地發展和使用人工智能 ,造福人群。該報告由英國政府委託,而秘書處設於 UK AI Security Institute。
聯絡方法:Mila Medias,medias@mila.quebec;DSIT 傳媒查詢,press@dsit.gov.uk