📰 正文
自2023年以来,美国AI安全研究所(AISI)一直通过各种前沿AI模型进行95项不同的"夺旗"(Capture the Flag)挑战,以测试它们在网络安全任务方面的能力,包括逆向工程、Web漏洞利用和密码学等领域。
测试结果
最新测试结果显示,GPT-5.5在最高级别的网络安全评估中与备受关注的Mythos Preview表现相当。在模拟32步企业网络数据提取攻击的"TLO"测试中,GPT-5.5在10次尝试中成功了3次,而Mythos Preview为2次。
新的GPT-5.5测试结果表明,在网络安全风险方面,Mythos Preview可能并非"某一特定模型的突破性进展",而是"更广泛的长期自主性、推理和编程能力提升的副产品"。
OpenAI的回应
在最近接受Core Memory播客采访时,OpenAI首席执行官山姆·奥特曼(Sam Altman)批评了他所谓的"基于恐惧的营销"——即为某些AI模型的限量发布制造恐慌。他表示:“我相信Mythos是一款出色的网络安全模型”,但他补充道:“未来会有更多关于’模型过于危险而无法发布’的言论。同时也会有非常危险的模型需要以不同方式发布。”
周四,奥特曼在社交媒体上表示,GPT-5.5-Cyber的初步发布将同样"在未来几天内仅限于关键网络安全防御者"使用。
行业影响
今年2月,OpenAI推出了"可信网络访问"(Trusted Access for Cyber)试点项目,允许安全研究人员和企业验证身份并注册研究OpenAI前沿模型的兴趣,用于"合法的防御性工作"。
这一测试结果对整个AI安全行业具有重要意义。它表明网络安全能力的提升正在成为前沿AI模型的普遍趋势,而非个别现象。这也促使监管机构和企业重新评估AI模型在网络安全领域的风险评估框架。
来源:Ars Technica