bet365注册会员-bet365是什么网站

搜索
你想要找的

12月10日 孫軍:通往大模型安全之路
2024-12-10 11:00:00
活動主題:通往大模型安全之路
主講人:孫軍
開始時間:2024-12-10 11:00:00
舉行地點:滴水湖校區國際軟件學院
主辦單位:軟件工程學院
報告人簡介

孫軍目前是新加坡管理大學(SMU)的終身教授。他于2002年和2006年獲得新加坡國立大學計算機科學學士和博士學位。2007年,他獲得了李光耀博士后獎學金。他在2010年受聘為教授至今。 孫軍的研究興趣包括AI安全、軟件工程和形式化方法。他發表了多篇文章和會議論文,包括多個領域的頂級會議。他發布了多款軟件分析工具,也擔任過多家公司的資深技術顧問。


內容簡介

本次演講將探討與大模型,特別是大型語言模型(LLMs)相關的關鍵安全問題,同時介紹我們最近在分析和理解這些挑戰方面的研究工作。具體來說,我們將回答以下關鍵問題。 

為什么LLMs的安全對齊常常易受諸如GCG和AutoDAN等攻擊的影響? 

能夠破壞LLM安全對齊的對抗性標記是隨機的,還是具有內在意義? 

如何在有限的對齊數據下提升LLM的安全性? 

我們是否可以編輯LLMs,使其執行我們想要的任務? 

是否僅使用良性數據就可以完全消除GPT-4o的安全對齊? 本次討論將深入探討我們的方法和發現,重點揭示大模型安全的基礎與挑戰。

百家乐看大小路| 百家乐技巧介绍| 全讯网365| 大发888线上| 龙虎斗游戏| 百家乐官网投注综合分析法| 大发888娱乐游戏下载 官方网| 皇冠百家乐官网客户端皇冠| 百家乐官网不锈钢| 代理百家乐试玩| 太阳城丝巾| 尊龙国际| 大发888网页版体育| 马牌线上娱乐| 百家乐庄闲预测| 大发888 赌博网站大全| 真人百家乐官网试玩账号| 百家乐出千的方法| 博狗备用网站| 鑫鼎百家乐官网娱乐城| 蓝盾百家乐打法| 可以玩百家乐官网的博彩网站 | 大发888官方 hdlsj| 百家乐官网翻天粤语快播| 百家乐娱乐皇冠世界杯| 通城县| 最可信百家乐官网娱乐城| 平顶山市| 现场百家乐能赢吗| 百家乐玩法简介| 威尼斯人娱乐官方网站| 足球百家乐官网网上投注| 速博国际娱乐| 百家乐浴盆博彩通排名| 公安县| 大发888可靠吗| 七胜百家乐官网赌场娱乐网规则| 大发888游戏平台3403| 木星百家乐官网的玩法技巧和规则| tt娱乐城注册| 哈尔滨百家乐赌场|