#GLM我的编程搭子 #GLM-4.6

AI Coding 今年厮杀的异常激烈,相信大家都感受到了AI演化的速度。

“一句话生成官网”、“5分钟写出APP”……最近,我的朋友圈被各种 AI 编程的“神迹”刷屏了。Gemini 3 Pro 刚刚霸榜,Grok 4.1 紧随其后,作为一名开发者,这种技术迭代速度让人既兴奋又焦虑:难道我们真的离“下岗”只差一个提示词了吗?

我决定做一个小小的测试:不写一行代码,仅凭一句话,让三大顶流模型复刻 Google 刚刚发布的 Antigravity 官网粒子特效!

三大模型对比任务

对比的对象是以下三家模型

  • 国产智谱 GLM 4.6,发布于 2025年9月30日,使用 Claude code 配置 glm 4.6 模型测试
  • Google Gemini 3 Pro(Preview),发布于 2025年11月18日,使用  Google AI Studio 测试
  • Grok4.1,发布于 2025年11月18日,使用 Grok 官网测试

任务目标

高仿 Google 近日发布的 Antigravity 主页上的粒子效果

Antigravity 主页的粒子效果

这个效果看起来非常的谷歌味道,简练又特别有质感,像是随着海浪涌动的水母追随着鼠标漂游。

以下测试都基于相同的提示词。

第一轮:总结产品特性及粒子效果

提示词

google 新发布的 antigravity 产品官网:https://antigravity.google/,背景是流畅的粒子动画,简要介绍下antigravity这款产品,并解释下官网背景粒子动画的寓意、特点。

这一步是首先让各模型对当前要模拟的效果页面有个全面的背景信息了解,让它自己去访问页面地址,自己总结。

可惜的是 Calude 中的 glm4.6 是无法访问网络(fetch)的(具体原因我不清楚,不知道是配置问题还是模型和CLI兼容的问题)。

Gemini 3 、Grok4.1均作了不错的详尽的总结。

Grok4.1 对 Antigravity 及官网粒子动画的总结

Gemini 3 对 Antigravity 及官网粒子动画的总结

这一轮,由于配置环境的原因,Claude 中的 GLM 4.6 不能访问页面(有知道解决办法的朋友请留言,感谢)从而无法参与测评。Gemini 3 、Grok4.1 均表现不错。

为了后续对比公平起见,我将页面效果截屏,它们都可以读取图片,这样就都可以基于图片效果来进行编码。

第二轮:一句话直出页面

为各个模型都提供了同样的三张 Antigravity 官网粒子效果截屏图片作为参考。

提示词:

> 复刻 google 新发布的 antigravity 产品官网 https://antigravity.google/ 的背景粒子动画,单文件,代码清洁简练,不要有多余的内容。实际效果基于附件中的三张图片。

GLM 4.6 xiao'gu

首先,还挺好看的,颜色也较为接近,但形态差异巨大,实际动效也生硬一些,有点像随着鼠标到处游走的四溅的蓝色烟花。

Gemini 3 效果

不知大家怎么看,我个人是有点失望的。

虽然我没有指望 Gemini 3 一次 100% 复刻,但和预期差距有点大。我们要高仿的是 Google 自家产品的主页动效,它也在此前进行了网络访问了解到了页面信息,但它并没有抓到动效精髓,甚至我怀疑它并不了解动效的实际观感。

Grok4 效果

Grok 4 也只是实现了粒子效果,而不是我所预期的官网效果,虽然在此前的分析中,它说的头头是道,但实际出来的确实另外一回事。

总结:

        各大模型在这一轮中的表现都毫无惊艳,没有一个可以一键直出高仿效果,只是完成了“模拟粒子,鼠标交互”这一最基本的实现。

第三轮:再来一句话完善

提示词

现在实现的效果和 antigravity 差异很大。请观察 antigravity 的效果截屏 @screen\ ,它的效果粒子像波浪中的水母缓缓涌动,以鼠标为中心,中心点细小颜色很淡,外围的颗粒逐渐变大,涌动效果也更明显。严格参照截屏和描述重新生成粒子效果。

GLM 4.6

运动方面有点贴近了,但形态又发生了变化

Gemini 3 效果

像是浩瀚的宇宙星云,同样是交互动态有点接近,形状也算是贴近,但总体感觉还是完全的两个东西。

Grok 4 效果

无 ...

Grok 4 在这一轮直接‘弃疗’,后续的修改建议直接导致代码崩溃,页面陷入死一般的黑屏。这典型的‘越改越错’现象,暴露了当前 LLM 在处理复杂上下文逻辑时的通病——拆东墙补西墙。

总结

        虽然 智谱GLM 4.6 在本次测试中因工具限制出师不利,但在后续的代码生成中,它反而是‘听得懂人话’且能稳定输出可见效果的。对于国内开发者,考虑到网络稳定性和性价比,它依然是辅助 Coding 的首选。

        Gemini 3 Pro 的表现让我心情复杂。作为 Google 的亲儿子,去复刻自家官网的特效,本应是‘近水楼台先得月’。它在第一轮分析中虽然头头是道,仿佛已经洞察了粒子运动的物理规律,但真到了写代码环节,却像是‘纸上谈兵’。它生成的更像是一个静态的星云壁纸,完全丢失了原版那种如水母般呼吸、随波逐流的灵动感。懂了,但没完全懂。

        Grok 后续直接退赛了,但如果就此下结论 Grok 代码能力不行,也有失偏颇,毕竟大模型的输出具有很强的不确定性。

        其实测试过程中,对各个模型都进行了多次交流修改,稍不注意,就会变得离谱,比如有的时候,它就改成了下面的样子

        最终没有一家产出了满意的效果。

        这次测试有点像是泼冷水,浇灭了网络上关于“前端已死”的虚火。AI 目前处于“超级实习生”阶段,它能写出能跑的代码,但不懂“美感”和“物理质感”。


        我们可以看到,当任务涉及到复杂的视觉审美、细腻的物理交互逻辑时,大模型依然显得笨拙。它们擅长把代码跑通,却很难把产品“做对味”。

       不要指望 AI 成为你的“主程”,但可以作为“结对编程伙伴”。 用它来生成脚手架、写文档、Review 代码,而不是指望丢给它一句话,然后就等着跑起来你想要的东西。

Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐