希尔顿娱乐城722hh,京都棋牌可以提现吗,龙亨线上(中国)·官方网站

中文

首頁
學校概況

學校章程

校情簡介

學校領導

機構設置

院系設置

校史沿革

學校標識

黨務公開

信息公開
招生就業

學生就業

本科生招生

研究生招生

繼續教育

International Students
學術研究

學術組織

研究機構

學科建設

學報

學術期刊

學術文化
教育教學

大夏學堂

本科生教育

研究生教育
師資隊伍

高層次人才

教師名錄

人才招聘
合作交流

國際交流

港澳臺交流

國際中文教育

上海紐約大學

國際本科教育

教育基金會

校友會
校園生活

學生工作部

學生資助管理中心

心理健康教育與咨詢中心

學生校長助理

校歷

班車時刻表

12月10日孫軍：通往大模型安全之路

2024-12-10 11:00:00

活動主題：通往大模型安全之路
主講人：孫軍
開始時間：2024-12-10 11:00:00
舉行地點：滴水湖校區國際軟件學院
主辦單位：軟件工程學院

報告人簡介

孫軍目前是新加坡管理大學（SMU）的終身教授。他于2002年和2006年獲得新加坡國立大學計算機科學學士和博士學位。2007年，他獲得了李光耀博士后獎學金。他在2010年受聘為教授至今。孫軍的研究興趣包括AI安全、軟件工程和形式化方法。他發表了多篇文章和會議論文，包括多個領域的頂級會議。他發布了多款軟件分析工具，也擔任過多家公司的資深技術顧問。

內容簡介

本次演講將探討與大模型，特別是大型語言模型（LLMs）相關的關鍵安全問題，同時介紹我們最近在分析和理解這些挑戰方面的研究工作。具體來說，我們將回答以下關鍵問題。

為什么LLMs的安全對齊常常易受諸如GCG和AutoDAN等攻擊的影響？

能夠破壞LLM安全對齊的對抗性標記是隨機的，還是具有內在意義？

如何在有限的對齊數據下提升LLM的安全性？

我們是否可以編輯LLMs，使其執行我們想要的任務？

是否僅使用良性數據就可以完全消除GPT-4o的安全對齊？本次討論將深入探討我們的方法和發現，重點揭示大模型安全的基礎與挑戰。

bet365注册会员-bet365是什么网站

搜索
你想要找的

報告人簡介

內容簡介

bet365注册会员-bet365是什么网站

搜索你想要找的

報告人簡介

內容簡介

搜索
你想要找的