GPT-5.5在网络安全测试中追平备受瞩目的Mythos Preview

📰 正文

自2023年以来，美国AI安全研究所（AISI）一直通过各种前沿AI模型进行95项不同的"夺旗"（Capture the Flag）挑战，以测试它们在网络安全任务方面的能力，包括逆向工程、Web漏洞利用和密码学等领域。

测试结果

最新测试结果显示，GPT-5.5在最高级别的网络安全评估中与备受关注的Mythos Preview表现相当。在模拟32步企业网络数据提取攻击的"TLO"测试中，GPT-5.5在10次尝试中成功了3次，而Mythos Preview为2次。

新的GPT-5.5测试结果表明，在网络安全风险方面，Mythos Preview可能并非"某一特定模型的突破性进展"，而是"更广泛的长期自主性、推理和编程能力提升的副产品"。

OpenAI的回应

在最近接受Core Memory播客采访时，OpenAI首席执行官山姆·奥特曼（Sam Altman）批评了他所谓的"基于恐惧的营销"——即为某些AI模型的限量发布制造恐慌。他表示：“我相信Mythos是一款出色的网络安全模型”，但他补充道：“未来会有更多关于’模型过于危险而无法发布’的言论。同时也会有非常危险的模型需要以不同方式发布。”

周四，奥特曼在社交媒体上表示，GPT-5.5-Cyber的初步发布将同样"在未来几天内仅限于关键网络安全防御者"使用。

行业影响

今年2月，OpenAI推出了"可信网络访问"（Trusted Access for Cyber）试点项目，允许安全研究人员和企业验证身份并注册研究OpenAI前沿模型的兴趣，用于"合法的防御性工作"。

这一测试结果对整个AI安全行业具有重要意义。它表明网络安全能力的提升正在成为前沿AI模型的普遍趋势，而非个别现象。这也促使监管机构和企业重新评估AI模型在网络安全领域的风险评估框架。

来源：Ars Technica

📰 正文#

测试结果#

OpenAI的回应#

行业影响#

📰 正文

测试结果

OpenAI的回应

行业影响