米兰体育MILAN中国官网 后OpenClaw时期! 国产Agent模子凭「高配廉价」叫板Opus 4.6


裁剪|+0、杜伟
本年最出圈的 AI 讹诈是什么?OpenClaw 一定是绕不开的谜底。
回偏激看二三月份,「养虾」一度成为流行的应付货币。但它的道理道理远不啻是一款爆款讹诈:OpenClaw 真确将智能体宗旨从开发者圈层推向了大家视线,让无为用户第一次直不雅感受到 Agent 到底能作念什么。
当更多东说念主启动认知 Agent 的价值之后,行业的焦点也当然插足到了下一阶段:谁家的 Agent 作念得更好、上手起来更容易以及更能背负得起。这些才是决定 Agent 生态走向的流毒变量。
谁能在这一节点完成转型,就能在「后 OpenClaw 时期」霸占先机。事实上,国内一经有玩家率先落子。
就在本日,昆仑万维旗下的天工 AI(Skywork)全新发布了 SkyClaw-v1.0 智能体模子,成为其永恒深耕云表助理的又一里程碑,也启动了从助手形态向智能体基座模子的架构升级。
算作一款专为 OpenClaw、Claude Code、Hermes、Nanobot 等主流智能体框架深度优化的基座模子,SkyClaw-v1.0 模子在底层能力上达成了质的擢升,用具调用精度更准、多轮任务履行更稳、长链路推理更优,大略更好地适配实在场景中复杂、动态的智能体责任流。
与此同期,Skywork 还同步上线了 SkyClaw-v1.0-lite。这一轻量化版块对准了高频调用和老本敏锐场景,在保持中枢智能体能力的同期,大幅优化了推理速率与资源支出,为开发者提供了一个更活泼的部署聘任。
两款模子在 X 上抢先亮相以来,热度不时走高。

Nanobot 官方发文,「很繁荣能与 Skywork 联袂推出 SkyClaw-v1.0!期待看到列位开发者用它创造出无穷可能。」

不少国外活跃 AI 博主对它评价颇高,「SkyClaw-v1.0 的历练任务开始于用户的本体操作场景,而不是通用的实验室数据。它在基准测试上突出了 DeepSeek V4 Flash 等模子,踏实性经过了屡次考据。这才是打造真确能在本体场景中好用模子的方式。」

「基准测试之争扫尾了。SkyClaw-v1.0 登场,干净利落地赢下了统统。」

咫尺,SkyClaw-v1.0 两款模子限时免费通达体验,并已在 5 月 22 日接入到了 Skywork 平台。

天工地址:tiangong.cn
SkyClaw-v1.0 技俩地址:https://skyworkai.github.io/skyclaw/
apifree.ai API 地址:https://www.apifree.ai/model/skywork-ai/skyclaw-v1?tab=api
打出这三张牌
很难不聘任它
从居品层面来看,SkyClaw-v1.0 如实拿出了有劝服力的东西,具体不错拆成三个维度来看:Agent 能力、使用门槛和性价比。
率先,Agent 能力要强。
字据 Skywork 的官方斥逐,在主流智能体基准以及里面开发的 Claw 任务评估中,包括 PinchBench、Claw-Eval Pass^3 和 Skywork-Claw-Bench(基于 OpenClaw 构建的里面智能体评估套件),SkyClaw-v1.0 和 SkyClaw-v1.0-lite 的发达均优于 Minimax 2.7、DeepSeek V4 Flash 和 Qwen 3.6 35B A3B/27B 模子。
另外,在 OpenClaw 计划任务上,SkyClaw-v1.0 的性能靠近更大边界的开闭源模子,包括 DeepSeek V4 Pro、Claude Opus 4.6 和 Qwen 3.6 Plus。

跑分亮眼以外,SkyClaw-v1.0 在本体讹诈场景中发达惊艳。
在交互式网页与游戏生成方面,它大略输出功能都全的网页讹诈,从物理模拟到齐备的游戏。斥逐不仅渲染正确、动画运动,用户交互处理得也恰到克己。

宾果消消乐
在深度磋商与数据可视化方面,SkyClaw-v1.0 展现出了突出单纯代码生成的轮廓能力:它大略自主磋商实际全国课题,从多个开始辘集并交叉考据数据,最终将分析斥逐整合为交互式、达到出书级质料的面孔盘和讲解。
不错说,SkyClaw-v1.0 不仅仅在评测榜单上跑出了好收成,也在实在场景中证实了我方算作坐褥力用具的本体价值。
其次,门槛要低。
关于用户来说,上手 SkyClaw-v1.0 竟然莫得非凡的学习老本,按需聘任使用渠说念。在 Skywork 平台,一键聘任模子即可使用。另外,通过 AI 模子团聚劳动平台 apifree.ai 注册账号并创建 APIKey,就能免费调用。
生态适配也很完善。Nanobot 一经率先完成对 SkyClaw-v1.0 的适配,后续还将上线 OpenRouter。跟着更多平台的接入,开发者将大略在我方熟练的用具链中径直调用模子,无需从头搭建一套责任流。

在 nanobot 中,只需填入 API 密钥即可使用 SkyClaw-v1.0。
终末,性价比要高。
SkyClaw-v1.0 的订价显耀低于现时主流 Agent 模子。与 Minimax 2.7 和 Qwen 3.6 系列模子比较,订价仅为它们的一半以致更低。

SkyClaw-v1.0 打出的这几张牌,直指现时 Agent 模子市集的中枢矛盾:性能强的用不起,用得起的不够强,好用的生态顽固。它同期从能力、老本和易用性三个层面给出了一个相对平衡的解,这恰正是现时市集最稀缺的选项。
一手实测
拿持住了「快与准」
接下来,咱们通过 Claude Code 来调用这次的 SkyClaw-v1.0,上手进行了一些测试。接入过程极端丝滑,树立好 API Key 就能径直跑。
先来作念一个小游戏:饕餮蛇。

SkyClaw-v1.0 仅用时 33s 就完成了单文献网页版的基础开发,不仅包含了齐备的游戏逻辑、计分系统,何况运走时动。

再追加进阶需求:「在游戏中加多就地奖励,吃到蛇身边长三格」

依然极端快速,系统在无为食品的基础上加多了一个有 25% 概率掉落的金色星星奖励。
接下来,让 SkyClaw-v1.0 把这个游戏打包成 Windows 桌面可独处运行的 EXE 讹诈,并附带条款:「色系改成多巴胺色」。这一阶段的测试大略很好地响应 Agent 在濒临触及环境依赖的复杂工程以及排错时的实在能力。
在 UI 需求上,自主界说了包含 12 种高饱和颜色的 CSS 变量,落实了「多巴胺色系」的想象。
在打包要道,选定了 Electron 有野心,完成了工程脚手架搭建及依赖装配。
在极端处理方面,遭受报错不堕入死轮回,能读懂报错日记,米兰体育MILAN并尝试更正树立(从一个打包器换到另一个)来绕过环境限制。

接下来换一个实在办公场景,这时需求不是单一口头的,这就进修到了模子能不行同期输出文档、PPT 和视频,以及履行任务过程中的全局规画与跨口头互助能力。
这一次,咱们径直在 Skywork 中调用 SkyClaw-v1.0,给它一个有难度的复合任务。
让它「制作诀别先容地球四大洋的海底生态视频(每个 10 秒),视频生成后将其算作中间素材,构建一份全球海洋科普专题 PPT。条款将这 4 段视频镶嵌到对应的 PPT 页面中,并在视频旁配上基于视频内容自动生成的专科讲明词。」
在通盘履行链路中,模子需要先生成四段作风调治的视频素材,再把视频算作输入反哺到 PPT 制作中,终末字据视频内容自动撰写讲明词。前后面重脚轻紊,任何一顺次行不到位可能都会导致最终斥逐不可用。

从斥逐来看,包括视频生成质料、PPT 排版完成度以及讲明词与视频画面的匹配进度,SkyClaw-v1.0 都发达得面面俱圆。
放上一段生成的「太平洋海底珊瑚生态」视频,全球感受一下效果:

齐备 PPT 效果如下:

两个案例测下来,咱们发现,从认知需求、调用用具、遇错自修以及齐备跑通多技艺任务等能力来看,SkyClaw-v1.0 以远低于行业的价钱,请托出了接近顶流的 Agent 体验。
本领拆解
三步练出一个顶级 Agent
SkyClaw-v1.0 之是以能在评测与实战中交出亮眼收成,离不开一套系统化的历练进程。通盘过程涵盖环境构建、中期历练与监督微调、强化学习三个阶段,层层递进,组成了一条齐备的能力链路。
率先是搭建高质料的历练环境。
团队构建了一个高复杂度的模拟 OpenClaw 环境,其中内置了丰富的高质料用具和手段,以供模子探索调用。
不仅如斯,团队还深切分析了实在用户在类 OpenClaw 环境下的本体任务活动,并集结线上高频手段的使用数据和反馈,梳理出用具之间的关系图谱。基于这张图谱,合成无数贴近实在用户需求的复杂任务,确保模子从历练阶段就战争到敷裕实在与复杂的场景。
有了环境基础,接下来是大边界的中期历练与监督微调。
依托上头经过充分考据的历练环境,团队合成了海量高质料历练数据。而为了把控数据质料,团队建立了严格的过滤和评估机制,在捕快最终谜底正确性的同期,还会回溯评估模子完成任务的齐备轨迹,确保解题过程自身亦然合理高效的。
另外,团队进行了无数数据配比实验,找到智能体任务历练数据的最优组合。
终末,团队通过强化学习进一步打磨模子的泛化能力。
由于自建的 OpenClaw 环境自然复旧端到端的探索与反馈,模子大略在其中进行充分的强化学习历练。这一阶段的核神思议,除了确保模子在特定任务上发达出色,其在不同智能体框架和生分任务场景下也要保持踏实的泛化能力。
举座来看,SkyClaw-v1.0 选定的这套本瓦解径,莫得依赖单点冲破,而是围绕「实在智能体场景下的可用性」这一规画,达成了数据、历练与优化的相识。
环境构建管制「用什么数据来练」,中期历练和 SFT 管制「怎样练出基础能力」,强化学习管制「怎样进一步擢升性能上限和泛化性」。
写在终末
如同此前统统 AI 热门一样,OpenClaw 履历了泛泛的波动转动。诚然热度会消退,但趋势不会。Agent 算作现时 AI 发展最进军的所在之一,其地位在短时刻内不会更正。
上周的谷歌 I/O 大会是很好的例证,智能体成为勾搭全场的主角,Gemini Spark 的亮相更是径直对标 OpenClaw。这开释出了一个了了的信号:巨头们正在加快 Agent 本领的蓦然级落地。
在这么的行业配景下,「一个真确值用且用得起的 Agent」例必将成为市集的香饽饽。但实际是,顶级 Agent 能力竟然被国外御三家(Anthropic、OpenAI 和谷歌)的少数闭源模子把持,腾贵的调用老本导致无数中小开发者和企业令人咋舌。
换句话说,Agent 的瓶颈不在本领天花板,在于落地门槛。SkyClaw-v1.0 的发布,切中了这一痛点。
它以接近 Claude Opus 4.6 等闭源顶流的 Agent 性能,订价却只好主流模子的一半。斥逐即是,一个此前因预算有限只可用轻量模子「拼凑跑」的开发者,咫尺不错用通常的老本调用到接近顶级水平的 Agent 能力。
回偏激看,这次新发布是昆仑万维在 AI 领域永恒布局的又一阶段性遵守。自 2022 年竖立「All in AGI 与 AIGC」政策以来,昆仑万维基于自主研发的全球高出大模子基座,已构建起短剧和 A I 短剧平台、AI 音乐、AI 游戏、AI SuperAgent、AI 应付五大中枢居品矩阵。
其中在 Agent 领域,昆仑万维在本年一、二月先后发布了 Skywork Super Agents Video v1.0、天工 Skywork 桌面版及 SkyClaw 云表智能体。桌面版达周密土产货化运行,无需上传数据即可处理多口头内容;SkyClaw 集成 70 余项手段,复旧跨开荒多端监控。
SkyClaw-v1.0 大略作念到高性能与低老本兼顾,与昆仑万维在模子、讹诈和生态层面的永恒积贮密不可分。
当 Agent 赛说念从狂欢期插足闲散期,终末能留在牌桌上的,一定是把基本功作念得最塌实的那一个。SkyClaw-v1.0 交出的这份答卷,正是昆仑万维对这一判断最有劲的回复。
文中视频连结:https://mp.weixin.qq.com/s/SSfxXcx8Sr0XQH04rcASrg米兰体育MILAN中国官网