2024年10月26日,由中国航天系统科学与工程研究院《网络空间安全科学学报》主办,浙江大学网络空间安全学院承办的《网络空间安全科学学报》2024年网络空间安全学术会议——“大模型安全前沿技术”专题会议在杭州顺利举行。
本次会议由浙江大学计算机科学与技术学院院长、《网络空间安全科学学报》编委任奎担任会议主席,清华大学英诺讲席教授、计算机系副主任徐恪,上海人工智能实验室的领军科学家成宇,阿里巴巴集团安全部、高级算法专家陈岳峰,浙江大学百人计划研究员、网络空间安全学院副院长秦湛,以及国内相关高校和科研院所的老师、同学们出席了此次专题会议,会议由秦湛教授主持。
徐恪教授分享了题为“大模型系统安全:威胁与防御”的主旨报告,他从系统视角出发,阐述大模型系统的安全问题,深入探索了大模型技术面临的系统安全、模型安全、衍生安全威胁,并梳理了安全防御手段,分享了团队突破的大模型供应链安全、流量大模型、幻觉检测、大模型安全评测等多项关键技术,形成了人工智能安全国家标准、大模型安全实践行业白皮书等重要成果。
▼
成宇副教授分享了题为“大模型安全:从评测基准,模型架构,到幻觉消除的探索”的主旨报告,他从立评测基准、探索模型结构的影响和改进模型幻觉3个方面介绍团队在大模型幻觉方面开展的工作,具体讨论了如何构建语言/多模态大模型的可信安全评测集,分享了模型结构对模型可信和安全性的影响,以及利用数据增强和生成CoT的蒸馏来减轻模型幻觉等工作。
▼
陈岳峰研究员分享了题为“大模型安全挑战与防控体系建设探索”的主旨报告,他提出了大模型安全的防控体系建设实践,包括如何发现大模型的安全缺陷,如何构建大模型的安全护栏,如何让大模型生成的内容更加安全等,通过大模型全生命周期的安全防护,从而保障基于大模型的AIGC应用的安全发展。
▼
秦湛教授分享了题为“人工智能安全前沿技术与应用”的主旨报告,他通过聚焦人工智能安全领域的前沿技术与实践应用,重点介绍了示范应用平台:人工智能安全评测平台AIcert,他指出,该平台致力于全方位评估AI系统安全状况,以提升威胁监测与加固能力,未来可推动人工智能技术在安全、可控的环境下健康发展,为构建安全的AI生态系统贡献力量。
此次专题聚焦大模型安全的基础理论、核心技术和前沿应用,通过邀请业内专家分享最新的研究成果,以期促进大模型安全技术的革新与应用,为生成式人工智能的安全和可持续发展贡献力量。后续,《网络空间安全科学学报》将继续致力搭建网络空间安全领域的学术交流与知识传播平台,为国家网络空间安全事业发展贡献力量。
电话:010-89061756/ 89061778