bet365注册会员-bet365是什么网站

搜索
你想要找的

12月10日 孫軍:通往大模型安全之路
2024-12-10 11:00:00
活動主題:通往大模型安全之路
主講人:孫軍
開始時間:2024-12-10 11:00:00
舉行地點:滴水湖校區國際軟件學院
主辦單位:軟件工程學院
報告人簡介

孫軍目前是新加坡管理大學(SMU)的終身教授。他于2002年和2006年獲得新加坡國立大學計算機科學學士和博士學位。2007年,他獲得了李光耀博士后獎學金。他在2010年受聘為教授至今。 孫軍的研究興趣包括AI安全、軟件工程和形式化方法。他發表了多篇文章和會議論文,包括多個領域的頂級會議。他發布了多款軟件分析工具,也擔任過多家公司的資深技術顧問。


內容簡介

本次演講將探討與大模型,特別是大型語言模型(LLMs)相關的關鍵安全問題,同時介紹我們最近在分析和理解這些挑戰方面的研究工作。具體來說,我們將回答以下關鍵問題。 

為什么LLMs的安全對齊常常易受諸如GCG和AutoDAN等攻擊的影響? 

能夠破壞LLM安全對齊的對抗性標記是隨機的,還是具有內在意義? 

如何在有限的對齊數據下提升LLM的安全性? 

我們是否可以編輯LLMs,使其執行我們想要的任務? 

是否僅使用良性數據就可以完全消除GPT-4o的安全對齊? 本次討論將深入探討我們的方法和發現,重點揭示大模型安全的基礎與挑戰。

百家乐高科技| 大发888出纳| 大发888赢钱技巧| 金三角百家乐的玩法技巧和规则| 娱网棋牌下载| 百家乐官网群sun811| 澳门百家乐网上直赌| 元游棋牌下载| 噢门百家乐官网注码技巧| 百家乐投注翻倍方法| 全讯网.com| 网上百家乐官网骗人不| 澳门百家乐官网手机软件| 千亿娱乐城注册| 百家乐官网赌场策略| 威尼斯人娱乐城开户| HG百家乐官网大转轮| 大发888在线服务| 帝王百家乐官网的玩法技巧和规则| 元游棋牌下载| 百家乐免費游戏| 尊博| 百家乐有赢钱公式吗| 商洛市| 百家乐出闲几率| 真人百家乐官网网站接口| 奇迹百家乐的玩法技巧和规则| 百家乐官网桩闲落注点| 大三巴百家乐的玩法技巧和规则| 真人百家乐官网源代码| 大发888真钱游戏下载官网| 百家乐官网追号工具| 名仕棋牌官网| 百家乐洗码全讯网| 青岛市| 百家乐扎金花现金| 澳门百家乐官网游戏说明| 大发888游戏备用网址| 汇丰百家乐官网娱乐城| 赌博投注| 玩百家乐技巧巧|