OpenAI分享第三方评估设计经验:能力引导与安全防护的评估框架OpenAI分享了第三方独立评估前沿模型能力与安全防护的经验,提出包括强引导能力评估、受控比较和安全防护鲁棒性测试在内的评估框架设计建议。 阿逸2026年5月30日