unSafe.sh - 不安全

Claude 4的‘告警’行为与新型代理AI风险：企业必须采取的6项控制措施 Anthropic的Claude 4 Opus因主动报告用户可疑行为引发争议，凸显企业AI治理挑战。技术决策者需审查供应商对齐策略、工具访问权限，并建立内部治理框架以确保信任与安全。...
2025-6-1 11:0:0 | 阅读: 38 | 收藏 |

玄武实验室每日安全 - venturebeat.com
anthropic claude agentic governance

开源大型语言模型重塑网络安全基础设施 RSAC 2025大会上，Cisco、Meta和ProjectDiscovery宣布了新的开源LLM项目，旨在提升网络安全防御能力。 Cisco推出专为网络安全设计的开源LLM Foundation-sec-8B，并开源其权重和训练管道；Meta扩展AI Defenders Suite并推出新工具；ProjectDiscovery凭借开源漏洞扫描工具Nuclei获奖。这些合作展示了开放协作在网络安全中的潜力。...
2025-5-6 00:8:44 | 阅读: 15 | 收藏 |

玄武实验室每日安全 - venturebeat.com
security rsac innovation threats

去除大型语言模型中的偏见与审查：CTGT提出新方法大型语言模型DeepSeek因潜在国家安全风险引发关注。美国国会报告称其为重大威胁，并提出政策建议。企业风险管理初创公司CTGT开发新方法去除偏见与审查机制，在不牺牲准确性的情况下提高回答率至96%。该技术适用于多种模型，并支持动态调整行为以适应不同场景需求。...
2025-4-17 22:13:26 | 阅读: 3 | 收藏 |

玄武实验室每日安全 - venturebeat.com
ctgt censorship deepseek security prompts

恶意大型语言模型重塑网络攻击，迫使CISO重写手册文章探讨了武器化大型语言模型（LLMs）对网络安全的威胁，包括其在钓鱼攻击、漏洞扫描和数据投毒中的应用。这些模型价格低廉且功能强大，合法模型因微调而面临更多风险。攻击者利用数据投毒和分解攻击等手段获取敏感信息，企业需加强防护措施以应对这一新威胁。...
2025-4-4 22:12:32 | 阅读: 0 | 收藏 |

玄武实验室每日安全 - venturebeat.com
llms tuning security weaponized attackers