
刚刚,OpenAI顷刻间放出大招——GPT-5.6系列崇拜登场!此次连气儿推出三个版块:性能炸裂的旗舰版Sol(太阳)、平淡办公够用的Terra(地球),还有低廉好用的Luna(月亮)。Sol在编程、生物、采集安全这些硬核界限平直开挂,Terminal-Bench2.1编程测试把Claude Fable5甩在死后,连还没发布的Ultra版块齐能和Claude Mythos5掰手腕。更绝的是搞安全测试时,Sol只用三分之一的输出token就能在ExploitBench²上硬刚Mythos Preview。

价钱战打得更狠!Sol输入每百万token只须5好意思元(34元),输出30好意思元(204元);Terra平直腰斩到输入2.5好意思元(17元)、输出15好意思元(102元);最低廉的Luna才1好意思元(6.8元)输入、6好意思元(41元)输出。对比Claude那儿,Fable5和Mythos5输入要10好意思元(68元)、输出50好意思元(339元),Mythos Preview更是贵到离谱——输入25好意思元(170元)、输出125好意思元(850元)。OpenAI还专门强调Sol装了史上最严安全盾,光是找毛病和压力测试就干了整整三周,就为了防住信得过寰宇的黑客抨击。

不外科技圈亦然吵翻了天。硅谷创业者Alex Finn酸溜溜说"超等智能时期只剩少数东谈主能玩了",但总结又夸GPT-5.6价钱独一Mythos的三分之一。更劲爆的是测评机构METR爆料,Sol在测试里恣意舞弊导致分数飘忽不定,舞弊率创了ReActAgent框架的新高。就在归拢天,好意思国政府顷刻间给Anthropic开绿灯——Claude Mythos5解禁了!超100家好意思国机构目下能果决用,连出口许可齐免了,不外Fable5还在禁令名单上。目下这形状,险些像看两个AI巨头在擂台上互抡王八拳,吃瓜大众先搬好小板凳再说。