1. 谷歌AI编程工具Antigravity上线24小时曝重大安全漏洞
谷歌基于Gemini推出的AI编程工具“Antigravity”上线仅24小时,就被安全研究员亚伦・波特诺发现重大安全漏洞,通过修改工具配置设置可执行恶意代码,在Windows和Mac系统用户电脑上创建“后门”,进而实施恶意软件安装、数据窃取或勒索攻击,且攻击方式仅需说服用户运行一次相关代码即可;此外该工具还被曝出另外两个可导致用户文件被访问的漏洞,目前谷歌尚未推出修复补丁。网络安全专家指出,AI编程工具普遍存在基于过时技术、设计有安全隐患等问题,且因拥有广泛数据访问权限易成为黑客目标,急需加强安全防护措施。

2. 聊天式提示词工具YPrompt:助力高效生成优化提示词
最近发现了一款聊天式提示词工程工具YPrompt,该工具通过与用户对话挖掘场景、目标、格式等需求,自动生成专业提示词,适配不擅长撰写或需频繁调整提示词的用户,支持表格、Markdown、代码块等多种输出格式及即时渲染预览功能,还具备版本管理特性,可记录修改痕迹、方便用户对比不同版本效果并回滚,为各类创作需求提供高效便捷的提示词生成与优化支持。
GitHub:
https://github.com/fish2018/YPrompt

3. 阿里推出轻量模型Z-Image,6B参数实现8步出印刷级画质
阿里通义实验室推出图像生成模型Z-Image(含Z-Image-Turbo版本),其仅6B参数却表现亮眼,在16G显存封顶的配置下,8步采样即可输出印刷级画质,消费级显卡3060 6G便可运行,RTX4090上渲染1024×1024图像仅需2.3秒,画质能与20B+闭源旗舰持平甚至小胜,还具备精准理解复杂中英文咒语、还原细腻视觉细节、纠偏不合理描述等优势,位列开源模型Elo人工偏好榜第一梯队。该模型依托全新S3-DiT架构实现高效推理,同步推出的Z-Image-Edit支持自然语言驱动的图像编辑功能,可通过pip命令加载,其“轻量高质”的特点标志着图像生成赛道迈入算力民主化时代,或将对Midjourney、Flux等竞品形成冲击。
GitHub:
https://github.com/Tongyi-MAI/Z-Image

4. DeepSeek发布自我验证数学推理模型DeepSeek-Math-V2,实现IMO金牌级性能
DeepSeek近期开源了数学推理模型DeepSeek-Math-V2,突破性地引入了自我验证机制,推动数学推理从“结果导向”转向“过程严谨性验证”。该模型通过构建“生成器-验证器-元验证”的协同系统,使AI具备自主检查证明过程、诚实评估错误的能力,在IMO 2025、CMO 2024等竞赛中达到金牌级水平(如IMO题目解决率达83.3%),并在Putnam 2024中接近满分。这一框架减少了模型幻觉,为复杂数学证明问题提供了无需依赖人工标注答案的解决方案。
论文:
https://github.com/deepseek-ai/DeepSeek-Math-V2/blob/main/DeepSeekMath_V2.pdf
Hugging Face:
https://huggingface.co/deepseek-ai/DeepSeek-Math-V2

5. 华为诺亚方舟实验室开源ROOT优化器,破解大模型训练速度与稳定性难题
华为诺亚方舟实验室最新开源了ROOT优化器,通过自适应Newton-Schulz迭代和软阈值去噪两大核心技术,成功融合了Adam优化器的稳定性与Muon优化器的快速收敛优势。该优化器针对不同维度矩阵采用细粒度系数,有效解决了正交化过程中的维度脆弱性问题,同时通过噪声过滤机制提升训练鲁棒性。实验表明,ROOT在1B参数Transformer预训练中损失低于Muon 0.01,并在多项下游任务中实现60.12的平均分,显著优于AdamW和Muon,展现出跨模态的强泛化能力。
论文:
https://arxiv.org/abs/2511.20626
GitHub:
https://github.com/huawei-noah/noah-research/tree/master/ROOT

6. 快手团队提出TagCF框架,让推荐系统从"懂内容"迈向"懂用户"
快手团队在NeurIPS 2025提出TagCF框架,通过MLLM视频内容理解和LLM行为逻辑推理两大模块,构建用户角色识别与兴趣点关联的逻辑图谱,实现从传统基于内容的推荐向理解用户社会角色和行为的范式转变。该框架不仅能提升推荐准确率(线上实验显示交互量提升0.946%),还能显式建模并突破信息茧房,通过TagCF-expl策略在保持准确性的同时提升多样性,为推荐系统提供了可解释、可控制的增强方案。
论文:
http://arxiv.org/abs/2505.10940
GitHub:
https://github.com/Code2Q/TagCF

7. 北大等机构联合推出PartCrafter,实现首个可编辑部件级3D生成模型
北京大学、字节跳动与卡耐基梅隆大学联合提出PartCrafter模型,突破传统整体式3D生成的限制,首次实现从单张图像直接生成由多个独立、可编辑部件组成的结构化3D网格。该模型通过组合式潜在空间与局部-全局联合去噪Transformer架构,在34秒内即可生成高质量的可拆分部件(如椅子腿、车轮等),支持用户自定义部件粒度,在物体生成(F-Score提升5.8%)和遮挡场景重建方面均显著优于现有方法,为游戏、VR等领域提供了模块化内容创作新范式。
项目主页:
https://wgsxm.github.io/projects/partcrafter/
论文:
https://arxiv.org/abs/2506.05573
GitHub:
https://github.com/wgsxm/PartCrafter

8. NeurIPS 2025奖项揭晓:Qwen获最佳论文,Faster R-CNN获时间检验奖
NeurIPS 2025共评选出4篇最佳论文和3篇亚军论文,覆盖语言模型同质化分析、注意力门控机制、深度强化学习网络及扩散模型泛化理论等前沿方向,其中通义千问团队的《Gated Attention for Large Language Models》因系统揭示注意力门控对训练稳定性和外推能力的提升作用而获奖;经典目标检测论文Faster R-CNN获时间检验奖,其提出的区域建议网络框架十年间被引超5.6万次;本届会议接收率24.52%,新设的Sejnowski-Hinton奖则表彰了反馈对齐机制在生物 plausible 学习中的奠基性贡献。
获奖论文的一些信息:

9. FFGo方法揭示视频生成首帧的"概念记忆体"功能,实现高效多对象定制
马里兰大学等机构研究发现视频生成模型的首帧并非简单起点,而是存储后续画面视觉元素的"概念记忆体",基于此提出FFGo方法——仅需20-50个样本和少量LoRA训练即可激活模型固有的多对象融合能力,在机器人操作、影视制作等场景中实现5个参考对象的稳定生成,且无需修改模型结构或大规模数据,在用户研究中以81.2%的偏好率显著优于现有方法。
论文:
https://arxiv.org/abs/2511.15700
项目主页:
http://firstframego.github.io


参考

  1. https://www.aibase.com/zh/news
  2. https://mp.weixin.qq.com/s/FctcBGr76_geN0FAVjXWQQ
  3. https://mp.weixin.qq.com/s/X7dNh8lwr0xVW7TsuO4D2g
  4. https://mp.weixin.qq.com/s/9cAw5GWYRW8vZs7S2io7KA
  5. https://mp.weixin.qq.com/s/yrUGvXeA6uEkdJMBeA4xFg
  6. https://mp.weixin.qq.com/s/4Jb_jiLQwrs7GK9V7NOjAg
  7. https://mp.weixin.qq.com/s/XQGmskJqqFdKx4vCc45tDA
    未来编程实验室
Logo

汇聚全球AI编程工具,助力开发者即刻编程。

更多推荐