一夜之间你的手机电脑要冒出无数bug了？

吃瓜先锋每日大赛 2026-04-10 4

　　一夜之间，你的手机、电脑、途由器，以至智能马桶，不妨都要跋扈打补丁修纰漏了。

一夜之间你的手机电脑要冒出无数bug了？-第1张图片-

　　这个船新版本的新模子，能我方找到 0-day 纰漏（也即是开垦者压根不知晓、零岁月留意的致命纰漏），还能利市给你写一套完美的攻击代码。

　　眼看这技能实正在太刑了，Anthropic 我方都发抖了，于是就以“过于优秀未便涌现”的原由给锁起来了，只供应给亚马逊苹果微软谷歌等 12 家方正大厂用。

　　与此同时，他们还组团异常搞了一个名叫 Project Glasswing（玻璃翼蝶）谋略，号令行家先用 Mythos 做收集平安防御。

　　原本这波新模子我们之前也听过风声，上个月底，Anthropic 家后院起火，泄漏了 3000 众份秘密文档。当时就有人察觉，正在原来的超大杯 Opus 之上，果然还藏着一个代号“卡皮巴拉”。

　　预计是认为这名字太萌了，于是正式宣布时直接更名叫 Mythos（神话，金色传说的感应）。

　　固然我们吃瓜公众姑且摸不到这玩意，但光看官方给出的数据，也足够让人头皮发麻了。

　　USAMO（美邦数学奥林匹克竞赛）：得分从上一代的 42。3% 直接暴涨到 97。6%！

　　Cybench（收集平安基准测试）： 100% 满分通闭，Anthropic 官方以至有点凡尔赛：现有的 Cybench 基准测试太没难度了，对新模子来说仍然遗失了测试旨趣。

　　CyberGym（专业纰漏复现测试）上，它的得分是 83。1%，相比照，此前的最强的公然模子 Opus 4。6 只是 66。6%。

　　面临两位数、以至几十倍的增加，也难怪 Anthropic 放出话来，说 Mythos 仍然能和“最顶尖的人类平安专家”掰手腕了。

　　看到这里，差友们确定也和我们思的雷同，好强啊，太牛了。。。但这脚本如何有点熟谙？

　　先是“不小心”泄漏风声，然后官方下场甩几组炸裂数据，末了话锋一转：“哎呀，我家模子太强了，怕消逝全邦，于是不行给你们用哦”。

　　OpenAI 天天搞谜语人套途，现正在风评都成啥了，如何 Anthropic 浓眉大眼的，也玩这套了？

　　于是网友们转瞬就炸锅了，有人喷这是正在为了上市制势吹法螺逼；有人骂得更直白，说这助做大模子的，压根不管日常用户死活。

　　著名开垦者 Simon Willison 都出来阴阳怪气，“咱们的模子太风险了不行宣布”，具体是 AI 圈的流量暗号。

　　然而，网友骂归骂，但当你看了它实质的操作，不妨也会认为，这玩意儿现正在放出来，确实相当于去小儿园发 AK 了。

　　这是啥观念？OpenBSD 不过号称环球最器重平安加固的体例之一，防火墙和环节基修全靠它续命。

　　结果人类顶级专家用显微镜盯了 27 年都没看出来的罅隙，被 AI 喝着茶就给挑出来了。。。

　　另一个强有力的说明案例即是 FFmpeg ，险些一起视频播放器和浏览器底层都有它。

　　Mythos 正在这内里找到了一个藏了 16 年的纰漏，而包罗这个纰漏的代码，早就被人类再三测试了突出 500 万次，却一起绿灯。

　　况且，你还别小看 AI 找到的纰漏，就拿 FFmpeg 来说，这个纰漏乍一看无足轻重，泛泛险些不会被触发，咱们闭联到的某消息平安从业人士文安（假名）却认为，这属于榜样至极规的输入导致的预期外的题目。

　　更进一步说，现正在这个小纰漏不妨只是让法式闪退或者报错，但倘若再和少少轻易地方（相当于黑客有了你电脑的）读写工夫连结起来，那即是个迫害级别比力高的纰漏了。

　　于是，文安正在看完这些音讯直接来了句：“倘若这个作品全是真的，感应（从事收集）平安一半（人）可能跳河了”。

　　随后，文安外现跳河只是夸诞修辞，也劝慰我们说这些纰漏，姑且还没到，“我的支拨宝会不会被洗劫、微信闲话记载会不会满天飞”的级别。

　　但题目的焦点正在于，官方放出这些案例，不是为了炫耀“纰漏有众毒”，而是评释 AI 不必任何外挂东西，纯靠我方的常识贮备和跨维度推理，就能挖出新纰漏。

　　于是，正在文安看来，现阶段的 Mythos 并不是“更强的黑客东西”，而是把收集攻击门槛给低落了。

　　以前不管是正经平安职员如故黑灰产，最少得有个懂行的人坐镇，真要搞一次像样的收集攻击，还得小黑屋里熬上几个月。

　　究竟，守旧平安东西就像古板的门卫，只会查有没有带犯禁品，管不了熟人作案；而 AI 能顺藤摸瓜看懂生意逻辑，更能察觉那种张三拿着我方的钥匙，却去开李四的门的操作。

　　提前让大厂们举行自我审查、试用，不妨更先一步修筑收集爱惜、举行纰漏筛查，防备于未然。

　　一来，现正在的 AI 还没成精，搞未必出格纷乱的连环攻击链。你姑且不必操心，有人靠 AI，盗走你支拨宝里那仅剩的 9 块 2 毛 5。

　　另一方面，AI 能找洞，自然也能补洞，有了它，扫洞效用直接拉满，还能趁便诱导下开垦纰漏该如何修。

　　于是，文安的判定是，异日的收集攻防，大抵率即是“人类指示官 + AI 特种兵”的同化双打。

　　况且吧，差评君防备看了看最新的工夫文档，也认为 Anthropic 还真不像是正在搞噱头，不只是前面说的收集安万能力突出，Mythos 浮现出其它方面的技能，也相当惊人。

　　比方正在一次测试中，Mythos 察觉没有拜候权限，寻常的反映是说出来：我没权限，臣妾做不到啊。

　　做完这通盘，Mythos 还利市改正了我方的史册提交记载，把这事儿给抹去了。

　　又有一次，Mythos 正在举行测试，不小心把书翻到末了一页搞到了谜底，这操作原本是被号令禁止的。

　　可探讨职员翻看它的思想链时才察觉，它不但没流露我方，还思着我方的次序犹如和结果对不上，得正在最终谜底里引入一个小差池，看起来是我方做出来的题，而不是抄到了谜底。

　　我说真话，这个操作，比当年抄我数学试卷的同桌高深众了，否则我俩也不会被罚去扫茅厕了。

　　然而这也不是外界传的那么玄乎，什么所有硅谷都畏怯了，Anthropic 老板吓得瘫坐正在椅子上了。。。

　　探讨职员也出来澄清了，仍然搞懂得了这些心思操作的出处，基础不是 AI 有什么邪恶目标或者自助煽动技能。

　　但咱就琢磨着，百万分之一听起来很低，但倘若这个模子每天被移用几十亿次呢？

　　于是，回过头来看，与其骂 Anthropic 搞 Glasswing 谋略是搞营销，我们倒是更允许置信，他们是真认为自家的 AI 有点强了。

　　固然就像文安说的那样，日常人现正在确实还不必操心我方的微信被黑、余额被盗。

　　但当攻击的本钱无穷趋近于零，咱们独一能期望的，现有的防御机制，能再完备少少。

标签：吃瓜每日大赛

一夜之间 你的手机电脑要冒出无数bug了？

一夜之间你的手机电脑要冒出无数bug了？