unSafe.sh - 不安全
我的收藏
今日热榜
公众号文章
导航
Github CVE
Github Tools
编码/解码
文件传输
Twitter Bot
Telegram Bot
Search
Rss
黑夜模式
Claude 4的‘告警’行为与新型代理AI风险:企业必须采取的6项控制措施
Anthropic的Claude 4 Opus因主动报告用户可疑行为引发争议,凸显企业AI治理挑战。技术决策者需审查供应商对齐策略、工具访问权限,并建立内部治理框架以确保信任与安全。...
2025-6-1 11:0:0 | 阅读: 38 |
收藏
|
玄武实验室每日安全 - venturebeat.com
anthropic
claude
agentic
governance
开源大型语言模型重塑网络安全基础设施
RSAC 2025大会上,Cisco、Meta和ProjectDiscovery宣布了新的开源LLM项目,旨在提升网络安全防御能力。 Cisco推出专为网络安全设计的开源LLM Foundation-sec-8B,并开源其权重和训练管道;Meta扩展AI Defenders Suite并推出新工具;ProjectDiscovery凭借开源漏洞扫描工具Nuclei获奖。这些合作展示了开放协作在网络安全中的潜力。...
2025-5-6 00:8:44 | 阅读: 15 |
收藏
|
玄武实验室每日安全 - venturebeat.com
security
rsac
innovation
threats
去除大型语言模型中的偏见与审查:CTGT提出新方法
大型语言模型DeepSeek因潜在国家安全风险引发关注。美国国会报告称其为重大威胁,并提出政策建议。企业风险管理初创公司CTGT开发新方法去除偏见与审查机制,在不牺牲准确性的情况下提高回答率至96%。该技术适用于多种模型,并支持动态调整行为以适应不同场景需求。...
2025-4-17 22:13:26 | 阅读: 3 |
收藏
|
玄武实验室每日安全 - venturebeat.com
ctgt
censorship
deepseek
security
prompts
恶意大型语言模型重塑网络攻击,迫使CISO重写手册
文章探讨了武器化大型语言模型(LLMs)对网络安全的威胁,包括其在钓鱼攻击、漏洞扫描和数据投毒中的应用。这些模型价格低廉且功能强大,合法模型因微调而面临更多风险。攻击者利用数据投毒和分解攻击等手段获取敏感信息,企业需加强防护措施以应对这一新威胁。...
2025-4-4 22:12:32 | 阅读: 0 |
收藏
|
玄武实验室每日安全 - venturebeat.com
llms
tuning
security
weaponized
attackers
Previous
1
2
3
4
5
6
7
8
Next