拜拜Claude!阿里最强万亿模型编程秒了Opus4，实测在此-技术文章-蓝布编程网

“1万亿”这三个字真把编辑部吵炸了——不是美元，是参数。

周五晚上刷手机，Qwen3-Max-Preview忽然冒出来，直接把自家上代235B模型一脚踹飞四倍，还把刚吵完的ClaudeOpus 4按在地面摩擦。

我第一反应：这玩意儿到底好用还是好吹？

连夜翻墙、借号、开电脑，两小时里干了两件事：用它做了份AIME真题，顺便生成了一个扫雷小游戏。

先说结论：数学确实猛，一道几何题，它边写计算边解释“为什么延长这条边能凑出三角函数”，最后吐出答案204，比我手算快三倍。

但让我愣神的是扫雷。

我让它“来个小游戏，别搞教程、也别加奇怪贴图”，它不到十秒甩出一条p5.js，鼠标左键翻格、右键插旗，一个像素都没错。

我把代码拷进vscode，F5——秒开，连console都没红。

那一刻我脑子里蹦出一个词：省心。

再聊幻觉。

之前用别的模型做产品调研，它能把“用户画像”里的25岁写成1988年生人（你品品）。

我故意把一张满是表格的财报截图扔给Qwen3，让它抠数字。

它没给我编“营收增长2300%”这种离谱答案，反倒老老实实抄出一串带小数的数字，还提醒我“最后一行单位不一致，要不要统一”。

这算进步吗？

算，尤其对做数据新闻的人，少熬夜。

编程到底有多卷，看价格更直观。

百炼开价按token阶梯走，我粗略算了下：

写个普通页面大概两百来行，加起来一万出头token，一顿外卖钱搞定。

真做复杂需求，比如把整份PRD扔进去让它生成前端+接口，上下文拉到128K也没炸，费用和雇一个外包半天差不多。

对独立开发者来说，这算盘可以打得噼啪响。

有人催开源，我说别急。

阿里搞过一回深夜突袭：今年3月，235B非推理版上线四天，开源推理版就跟着放仓库。

这次大概率剧情复刻——毕竟林俊旸自己都发了个“最有趣模型”的暗号，翻译成人话就是“快来了”。

最后插一嘴体验通道：

web直接用 chat.qwen.ai，想上API就去百炼。

不用翻墙，中文界面，我爹都能点。

你要是玩出新花样，回来讲讲，我想看它还能折腾出什么离谱活。

蓝布编程网