关于 "AI安全" 的最新相关报道
本期科技早报聚焦AI与硬件前沿:小模型发现安全漏洞、AI Agent基准被突破、原子级存储技术取得进展,同时汇总了GitHub热门AI技能项目及OpenAI、Google等大厂最新动态。
Anthropic于2026年2月25日发布Constitutional AI 2.0框架,这是AI安全对齐领域的里程碑式突破。该框架通过多层价值观约束、动态伦理评估和可解释性增强,解决了大语言模型价值观对齐的核心难题,为可信AI发展提供了技术基础。