蓝布编程网

分享编程技术文章,编程语言教程与实战经验

拜拜Claude!阿里最强万亿模型编程秒了Opus4,实测在此

“1万亿”这三个字真把编辑部吵炸了——不是美元,是参数。

周五晚上刷手机,Qwen3-Max-Preview忽然冒出来,直接把自家上代235B模型一脚踹飞四倍,还把刚吵完的ClaudeOpus 4按在地面摩擦。

我第一反应:这玩意儿到底好用还是好吹?

连夜翻墙、借号、开电脑,两小时里干了两件事:用它做了份AIME真题,顺便生成了一个扫雷小游戏。

先说结论:数学确实猛,一道几何题,它边写计算边解释“为什么延长这条边能凑出三角函数”,最后吐出答案204,比我手算快三倍。

但让我愣神的是扫雷。

我让它“来个小游戏,别搞教程、也别加奇怪贴图”,它不到十秒甩出一条p5.js,鼠标左键翻格、右键插旗,一个像素都没错。

我把代码拷进vscode,F5——秒开,连console都没红。

那一刻我脑子里蹦出一个词:省心。

再聊幻觉。

之前用别的模型做产品调研,它能把“用户画像”里的25岁写成1988年生人(你品品)。

我故意把一张满是表格的财报截图扔给Qwen3,让它抠数字。

它没给我编“营收增长2300%”这种离谱答案,反倒老老实实抄出一串带小数的数字,还提醒我“最后一行单位不一致,要不要统一”。

这算进步吗?

算,尤其对做数据新闻的人,少熬夜。

编程到底有多卷,看价格更直观。

百炼开价按token阶梯走,我粗略算了下:

写个普通页面大概两百来行,加起来一万出头token,一顿外卖钱搞定。

真做复杂需求,比如把整份PRD扔进去让它生成前端+接口,上下文拉到128K也没炸,费用和雇一个外包半天差不多。

对独立开发者来说,这算盘可以打得噼啪响。

有人催开源,我说别急。

阿里搞过一回深夜突袭:今年3月,235B非推理版上线四天,开源推理版就跟着放仓库。

这次大概率剧情复刻——毕竟林俊旸自己都发了个“最有趣模型”的暗号,翻译成人话就是“快来了”。

最后插一嘴体验通道:

web直接用 chat.qwen.ai,想上API就去百炼。

不用翻墙,中文界面,我爹都能点。

你要是玩出新花样,回来讲讲,我想看它还能折腾出什么离谱活。

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言