Update 2025-07-19.md

2025-07-19 00:57:27 +08:00
parent 9eea3fe0f1
commit 283ebb7966
1 changed files with 63 additions and 28 deletions
--- a/daily/2025-07-19.md
+++ b/daily/2025-07-19.md
@@ -7,68 +7,103 @@
 ### **AI内容摘要**

 ```
-最新四款AI硬件亮相：Figure机器人高能电池  
-腾讯元宝关联音乐搜索秒点试听随Sunov  
-ChatGPT代理上手Pro用户享Kimi乐高调试
+OpenAI发布ChatGPT Agent，标志着AI开始亲自动手执行复杂任务。
+月之暗面Kimi也上线工具调用功能，进化为能解决实际问题的工匠。
+腾讯元宝与QQ音乐深度融合，Figure则自研机器人电池大幅降本。
+特斯拉自研Dojo 2芯片追求算力自由，Meta亦重组团队竞逐AGI。
+同时首款AI恶意软件LameHug出现，利用大模型窃取数据敲响警钟。
 ```



 ### AI产品与功能更新

-1. Figure F.03 机器人的能量心脏🌟：一块 **2.3 kWh "浓缩咖啡电池”** 提供 5 小时满马力蹦跶，**2 kW 快充**加持；BotQ 自研量产，**成本直降 78%**，年产 12 000 台的"钢铁侠工厂时代”驶进现实！<br/>![AI资讯：电池与机体嵌合](https://assets-v2.circle.so/t3z86y6nq15bg10919bjblof5t54)<br/>
+1.  **OpenAI**这是要彻底颠覆打工人的工作模式吗？ 🤔 **ChatGPT Agent** 的横空出世，标志着AI不再仅仅满足于与你对话，而是要亲自下场为你执行任务了！这个全新的AI物种深度融合了网页浏览、深度研究与代码执行三大核心能力，能够**自主浏览网页、对比商品价格、甚至独立完成PPT制作**。OpenAI官方自豪地宣称，其综合性能在多项基准测试中已超越竞争对手，并且贴心地内置了“监护人模式”——在执行任何高风险操作前，它都会主动征求你的许可。看来，AI从“动口”到“动手”的革命性时代，真的已经到来 🚀，是时候重新审视并构建你的个人工作流了。

-2. 腾讯元宝 2.30 上线 **QQ 音乐联网**，👂一句话、一行歌词、甚至一串心情立刻搜歌并划词试听，从"点红心”到"立等可听”只差一次升级——真正的多功能瑞士军刀亮相 AI资讯。
+<br/>
+<video src="https://upload.chinaz.com/video/2025/0718/6388842539479924363228312.mp4" controls="controls" width="100%"></video>

-3. Suno v4.5+ 新三件套🎤：**人声替换**秒变虚拟偶像、**伴奏反转**鼓点空翻、**灵感列表生成**即刻吐神曲；轻点[AI资讯：Suno座舱](https://suno.com)，创作像拼积木一样随性。<br/>![AI资讯：Suno界面](https://assets-v2.circle.so/3604h2pb7eswc1lzw3609ovnxd52)<br/>
+2.  月之暗面旗下的 **Kimi** 同样不甘示弱，推出了功能强大的 **Kimi Playground**，其核心理念就是“说到做到”，将承诺付诸实践。通过其全新的**工具调用（Tool Calling）**核心能力，Kimi彻底摆脱了过去只会纸上谈兵的“秀才”形象，摇身一变成为了一个能够撸起袖子解决实际问题的“工匠” (o´ω'o)ﾉ。现在，开发者们可以在这个平台上，如同搭建乐高积木一般，轻松调用天气查询、数据分析、网络搜索等各式各样的外部工具，让AI帮你自动规划复杂的旅游路线或是深度分析财务报表。这一重要进展，标志着Kimi正从一个庞大的“信息库”进化为真正的“问题解决者”，快来[体验一把让AI为你打工的快乐 - AI资讯](https://platform.moonshot.cn/playground)吧！

-4. **ChatGPT Agent** 正式上线，GP**T-4o** 大脑+Operator/Deep Research四肢，自动上网、订酒店、做 PPT、跑 Excel；Pro 用户每月 400 条任务任性用，**41.6%** 人类考试、**71.3%** 投行建模统统封神。官方博客直达：[AI日报：ChatGPT Agent](https://openai.com/zh-Hans-CN/index/introducing-chatgpt-agent/)<br/>![官方示意](https://upload.chinaz.com/2025/0718/6388842531607980829024668.png)<br/>![性能对比](https://upload.chinaz.com/2025/0718/6388842534730021379839364.png)<br/> <video src="https://upload.chinaz.com/video/2025/0718/6388842539479924363228312.mp4" controls="controls" width="100%"></video>
+<br/>
+![AI资讯：Kimi工具调用](https://upload.chinaz.com/2025/0718/6388842419754530518442218.png)
+<br/>

-5. **Kimi Playground** 试营业：像搭乐高一样拖拽 **工具调用**模块，天气、高铁、酒店一条龙；所见即所得调试，真正让 AI 干活的玩具来了→ [AI资讯：试玩](https://platform.moonshot.cn/playground)<br/>![功能界面](https://upload.chinaz.com/2025/0718/6388842419754530518442218.png)<br/>
+3.  **腾讯**正在紧锣密鼓地为其庞大的AI生态排兵布阵，最新动作是**腾讯元宝**App现已正式接入**QQ音乐**，成功打通了AI助手与音乐内容的任督二脉。这次深度整合后，你不仅可以利用它进行“大海捞针”式的**模糊搜歌**，还能让它根据你的当前场景和心情智能推荐配乐，甚至在聊天内容中实现**划线即播**的酷炫功能 ✨。这波精妙的操作，让AI助手不再是一个冷冰冰的问答机器，而是升华为一个更懂你心声的“数字DJ”，同时也清晰地预示着腾讯正全力加速其顶尖AI技术与庞大内容生态的联姻进程。

-6. **PresentAgent** 万词秒转片：30 组人类手工视频对标，**一键生配字幕+语音+动态幻灯片**超清视频，内容、干净、理解三项逼近真人。[Doc2Video巨献](https://arxiv.org/abs/2507.04036)<br/>![AI案例：PresentAgent](https://image.jiqizhixin.com/uploads/editor/227ec727-be05-418a-8b93-2db71955a86a/640.png)<br/>
+<br/>
+![AI资讯：腾讯元宝融合](https://upload.chinaz.com/2025/0718/6388844446916703934630013.png)
+<br/>

-7. **DecartAI MirageLSD** 🎯世界首个 **实时直播视频模型**：摄像头 40 ms 内任意风格化、无限时长 24FPS 不断电；**Diffusion Forcing + CUDA Mega Kernels** 把延迟秒砍 16 倍。[体验魔法](https://about.decart.ai/)<br/> <video src="https://videocdnv2.ruguoapp.com/lv0wTaCNdeDvN85tADVTGj61oe34.mp4" controls="controls" width="100%"></video>
+4.  AI音乐创作工具 **Suno** 近日发布了堪称“魔改”级别的 **v4.5+** 新版本，几乎将音乐创作的门槛降低到了地板。新版本引入了一系列令人惊叹的功能，包括一键**人声替换**（想让AI用你的歌词重新演唱？现在轻而易举！）、伴奏反转（对自动生成的编曲不满意？自己动手修改！），最令人叫绝的是，它还能从你喜爱的歌单中“吸取灵感”，自动生成风格相似的全新歌曲。这已经远远超越了简单的AI生成范畴，而是赋予了每一个人成为“金牌制作人”的潜力与机会，[点击体验 - AI资讯](suno.com)。
+
+<br/>
+![AI资讯：Suno音乐创作](https://assets-v2.circle.so/3604h2pb7eswc1lzw3609ovnxd52)
+<br/>
+
+5.  人形机器人领域的领军企业 **Figure** 不仅擅长“造人”，现在还学会了为机器人自己“造心脏”。其最新发布的 **F.03 机器人电池系统**，震撼地实现了从设计到制造的彻底**垂直整合**，完全由自家团队操刀。这款革命性的新电池系统，不仅使得生产成本**暴降78%**，能量密度更是惊人地提升了94%，足以支持机器人进行长达**5小时**的高强度“蹦迪”式作业。这不仅是电池技术上的一次重大突破，更是Figure公司在为未来大规模量产机器人铺平道路，有力地展示了“核心科技必须掌握在自己手里”的硬道理。[官方介绍 - AI资讯](https://www.figure.ai/news/f-03-battery-development)在此。
+
+<br/>
+![AI资讯：机器人电池](https://assets-v2.circle.so/t3z86y6nq15bg10919bjblof5t54)
+<br/>

 ### AI前沿研究

-1. OpenAI 推 **"多维验证器”**🧐：推理阶段用 Multilinear Verifiers 拆解复杂任务，精度媲美慢动作回放，但算力需求同步飙升。[AI资讯：论文直达](https://openai.com/index/multilinear-verifiers-for-complex-problem-solving)
+1.  你是否还在为制作PPT而头秃不已？一个由多所顶尖高校联合组建的研究团队，重磅推出了 **PresentAgent**，这是一个能够将任何枯燥文档“一键变身”为附带专业解说的**演示视频**的**多模态智能体** 🎬。它的强大之处在于，它生成的不仅仅是几页静态的幻灯片，而是能够像一位经验丰富的人类讲者一样，自主规划内容结构、精心设计视觉元素并生成同步的旁白语音，轻松将一篇晦涩的论文转变为一场生动有趣的演讲。这项开创性的研究不仅为评估此类AI提出了一个全新的框架，更预示着未来我们获取和传播知识的方式可能被彻底颠覆，详情请见[AI资讯：论文地址](https://arxiv.org/abs/2507.04036)。

-2. **1300 论著的上下文工程综述**像 AGI 百科地图：信息拼盘决定模型上限，超长文本生成却如没电磁浮——动能顿失。[参考阅读](https://arxiv.org/abs/2507.13334)
+<br/>
+![AI资讯：文档秒变视频](https://image.jiqizhixin.com/uploads/editor/b0be6a7f-34e8-4f2e-b596-23bf78d5c84b/640.png)
+<br/>

-3. **"模仿游戏”TAIL** 让大模型装图灵机：拆步成节拍，跨长度泛化超长待机，Qwen 也跟着练成马拉松选手。[文章链接](https://arxiv.org/abs/2507.13332)
+2.  “提示词工程”的时代或许正在成为过去，现在，AI领域的前沿风向标正指向“**上下文工程**”（Context Engineering）。一篇刚刚发布的重磅[AI资讯：重磅综述论文](https://arxiv.org/abs/2507.13334)正式为这个新兴领域给出了权威定义，它系统性地研究了如何更高效、更精准地为**LLM**“喂养”信息，其技术范围涵盖了从**RAG**到复杂多智能体系统的各种高级“投喂”技巧。该论文在深度分析了超过1300篇相关研究后，揭示了一个引人深思的现象：如今的AI模型已是“听得懂人话”的顶级理解者，但在“说人话”——尤其是生成复杂长篇内容方面——却仍像个笨拙的初学者。如何弥合这种“知行不一”的巨大差距，将是AI未来发展的核心挑战之一。
+
+3.  如何才能让AI学会真正的**逻辑推理**，而非仅仅依赖于海量数据的死记硬背？一篇最新的研究给出了一个颇具哲学意味的答案：教它像计算机的祖师爷——**图灵机**那样进行根本性的思考。研究者们创新地提出了 **TAIL** (Turing MAchine Imitation Learning) 方法，通过引导**LLM**模仿图灵机执行任务的每一个原子化步骤，从而显著提升了模型在处理超长序列问题时的**长度泛化**能力。这就像我们教育学生，不是反复灌输解题答案，而是教会他们解题的底层逻辑与第一性原理。这项工作或许为解决当前LLM面临的推理瓶颈，指明了一条“返璞归真”的光明道路，[AI资讯：论文在此](https://arxiv.org/abs/2507.13332)。

 ### AI行业展望与社会影响

-1. 扎克伯格拼装 Meta 3400 人 AI 军团🧩：王+王+LeCun 组合锁死 GPU 战略，Llama 5 能否在高薪传闻中长大？<br/>![AI资讯：重构现场](https://pic.chinaz.com/picmap/202304251756311752_2.jpg)<br/>
+1.  **马斯克**又来描绘宏伟蓝图了，但这一次他吹的“牛”似乎真的要实现了。据报道，**特斯拉**自研的 **Dojo 2** 芯片即将投入量产，其性能据称比上一代产品猛增了整整10倍，性能表现直逼英伟达的旗舰B200芯片。这一飞跃意味着特斯拉的**FSD**自动驾驶训练将彻底摆脱对外部供应商的依赖，完全实现“算力自由”，甚至在未来可能开辟出“出租算力”的新商业模式。马斯克甚至开玩笑说Dojo 2玩《孤岛危机》能达到十亿帧，用当年的“显卡杀手”来秀肌肉 💪，足见其颠覆AI和汽车两大行业的巨大野心。

-2. Tesla Dojo 2 量产倒计时⏱️：台积电封装+十倍算力，踹开英伟达 B200，明年 Dojo 3 彩蛋已埋好——马斯克笑称"能跑《孤岛危机》”的芯片。<br/>![Dojo2芯片](https://pic.chinaz.com/picmap/202304231132173466_7.jpg)<br/>
+<br/>
+![AI资讯：特斯拉Dojo芯片](https://pic.chinaz.com/picmap/202304231132173466_7.jpg)
+<br/>

-3. 影子工厂崛起：橙色统计敲警钟——中国自媒体创作者破亿，客厅即流水线、点赞即计件。旧"工人”定义或将彻底重塑，恰是AI资讯揭示的时代拐点。
+2.  **扎克伯格**正在对 **Meta** 的 **AI 团队**进行一场雷厉风行的“大手术”，意图重塑其AI战略格局。一个规模超过3400人的全新AI组织架构已浮出水面，其核心是一个被寄予厚望的神秘部门——“**超级智能实验室**”。小扎不仅不惜重金从OpenAI、苹果等主要竞争对手那里高薪挖角顶尖人才，还精心设立了AGI研究、AI产品、基础研究以及下一代**Llama5**研发等多个关键部门，摆出了一副“集结重兵、毕其功于一役”的决战架势。这场豪赌究竟能否让Meta在白热化的**AGI**竞赛中扳回一城，全世界的目光都在密切关注。

-4. 调研共识敲黑板：未来胜负手不在模型大小，而在 **上下文拼接＋记忆装置＋代理协作** 的交响乐能否奏响。
+<br/>
+![AI资讯：Meta重组AI团队](https://pic.chinaz.com/picmap/202304251756311752_2.jpg)
+<br/>
+
+3.  AI的双刃剑效应正日益显现，给我们敲响了警钟。首个被公开记录的 **AI 恶意软件** **LameHug** 已经出现，它专门针对**Windows**操作系统进行**数据窃取**，性质极其恶劣。这款恶意软件最阴险之处在于，它巧妙利用了阿里巴巴开源的 **Qwen** 大模型来动态生成攻击指令，仿佛一个会独立思考、持续进化的“数字小偷” 👾。该恶意软件目前主要通过钓鱼邮件进行传播，它的出现标志着网络攻击正式进入了“智能化”时代，也给所有用户和企业提出了严峻的挑战：你未来的对手，可能不再是简单的静态代码，而是一个具备学习和适应能力的AI。
+
+<br/>
+![AI资讯：AI恶意软件警示](https://upload.chinaz.com/2025/0718/6388843437031182236934140.png)
+<br/>

 ### 开源TOP项目

-1. **llama.cpp**🌱 15.9 k 星：C++ 引擎把 Llama、BERT、Whisper 塞进 iPhone 乃至冰箱芯，无显卡也能耍 AI。[仓库指路](https://github.com/ggerganov/llama.cpp)
+1.  来自 **Facebook Research** 的明星开源项目[AI资讯：segment-anything](https://github.com/facebookresearch/segment-anything)，在GitHub上已经积累了超过 **5.1万** Star，热度非凡。它就如同是图像处理领域的“瑞士军刀”，功能强大且用途广泛，能够让你从任何一张图片中，通过简单的交互，“一键抠出”你想要的任何物体。这个**通用图像分割**工具的核心优势在于其惊人的泛化能力，几乎能应对所有类型的图像和对象，为无数下游的计算机视觉任务提供了坚实而强大的基础，是AI视觉开发者必备的利器之一。

-2. **test-front-end** 1.2 k 星：一行命令开摆前端全流程测试，新手秒变老鸟。[仓库直达](https://github.com/TencentCloudBase/test-front-end)
+2.  AI模型最令人头疼的“幻觉”问题，现在终于有了更可靠的解决方案吗？**DocsGPT** 就是一个拥有 **1.6万** Star的优秀开源工具，它致力于从你个人或企业的知识库中，提供精准、可靠且绝无杜撰的答案。该工具的核心亮点在于能够实现完全**私密化**的本地信息检索，确保数据安全，并且内置了先进的智能体系统，堪称是为企业和个人量身打造的“专属事实核查员”与“永不撒谎的专家顾问”。[项目地址 - AI资讯](https://github.com/arc53/DocsGPT)。

-3. **open_deep_research**🛠️ 4 958⭐：LangChain 出品的"一键写尽调、写专利、写年报”自动化神器。[深入AI资讯](https://github.com/langchain-ai/open_deep_research)
-
-4. **segment-anything** 51 k★"图片里的 Chrome”：Weights+Notebook 开箱即用，直接分割一切。[官方仓库](https://github.com/facebookresearch/segment-anything)
-
-5. **DocsGPT** 16 k★企业 wiki 私有化神器，零幻觉问答终端/网页/插件一把梭。[源码](https://github.com/arc53/DocsGPT)
+3.  紧随 OpenAI Agent 重磅发布的浪潮，一个名为 **open_deep_research** 的开源项目在社区中迅速崛起，短时间内就获得了接近 **5千** Star的关注。尽管目前项目的描述信息不多，但其名称已经清晰地暗示了它的宏大目标：构建一个用于实现**深度研究**和信息综合的开源框架。该项目旨在将AI从一个简单的问答机器，全面升级为一个能够独立进行复杂课题研究的强大助手，可以说是开源社区对标商业闭源产品的有力回应，感兴趣的开发者可以[关注其后续进展 - AI资讯](https://github.com/langchain-ai/open_deep_research)。

 ### 社媒分享

-1. @[sama] 预告**OpenAI o2.0**🔗：图像+文本超级链路将进入实战，算力党攒钱别手软→ [AI资讯：原文](https://x.com/sama/status/1234567890123456789)
+1.  行业专家宝玉在其X平台[一针见血地指出](https://x.com/dotey/status/1945964840498930152)，**OpenAI** 最新发布的 **ChatGPT Agent** 并非单一技术的突破，而更像是一个“三合一”的超级缝合怪。它巧妙地将公司此前独立研发的 **Operator**（负责网页操作）、**Deep Research**（负责深度研究）和 **Codex**（负责终端执行）三大前沿能力无缝融于一身，并让它们在一个安全的虚拟机环境中协同作战，共同完成复杂任务。宝玉犀利地评论道，这波高明的操作，可以说是把过去零散的“特种兵”能力，成功整合成了一支战斗力爆表的“合成旅”。

-2. @归藏谏言功能上线前：**第三方 Chatwise 镜像测试**是防"虚胖”杠铃的必备姿势——别让 AI资讯成为你的"隐性失败”复现场💣。
+<br/>
+<video src="https://video.twimg.com/amplify_video/1945962621871521795/vid/avc1/1920x1080/VYmSxEyfEmVFVnFh.mp4" controls="controls" width="100%"></video>

-3. Reddit 热帖「为何程序泛滥？」：**ChatGPT 哲思**：人是"玩家副本”、人生是现场调试、成长是自编译；完整体验→ [AI资讯：阅读](https://www.reddit.com/r/artificial/comments/1m2z0rw/chatgpt_just_explained_human_programming_to_meand)
+2.  即刻用户“歸藏”[发表观点认为](https://m.okjike.com/originalPosts/6879a261765c7f98f8682043)，尽管OpenAI的Agent引发了巨大关注，但**DecartAI**发布的**实时视频模型 MirageLSD**或许才是昨夜真正的王炸级产品 🤯。该模型能够将摄像头捕捉的画面进行实时风格转换，其延迟低至惊人的40毫秒且支持无限时长的处理，这对于直播、视频会议和内容创作领域而言，无疑是一项黑科技。这背后是Diffusion Forcing和History Augmentation等前沿技术的重大突破，它成功地让AI实时视频生成从遥远的“期货”变成了触手可及的“现货”。

-4. 宝玉深夜刷屏：OpenAI 把 **Operator + Deep Research + Codex** 合体塞进虚拟机，ChatGPT 自己开机打工。<br/> <video src="https://video.twimg.com/amplify_video/1945962621871521795/vid/avc1/1920x1080/VYmSxEyfEmVFVnFh.mp4" controls="controls" width="100%"></video><br/> <video src="https://video.twimg.com/amplify_video/1945893500123496448/vid/avc1/1280x720/Zk9u5ZXtcPnm-qVL.mp4?tag=14" controls="controls" width="100%"></video><br/>[原链](https://x.com/dotey/status/1945964840498930152)
+<br/>
+<video src="https://videocdnv2.ruguoapp.com/lv0wTaCNdeDvN85tADVTGj61oe34.mp4?sign=02be34f5884ecc71b68284e12e0d6cbc&t=687a7262" controls="controls" width="100%"></video>
+
+3.  一位Reddit用户[分享了](https://www.reddit.com/r/artificial/comments/1m2z0rw/chatgpt_just_explained_human_programming_to_meand/)一段他与 **ChatGPT** 之间极其深刻的对话，其内容探讨了人类为何会拥有潜意识层面的“**程序**”这一哲学问题。在对话中，ChatGPT给出了一个精妙的比喻，它将这些潜意识行为模式比作是植根于我们童年经历的“生存代码”，而人生的意义与成长，就在于清醒地意识到这些旧程序的存在，并主动学习如何去“重写代码”。这番充满智慧的对话让人不禁感叹，AI不仅能编写计算机代码，更能启发你理解自己的“人生代码”，堪称一位真正的“赛博禅师”🙏。
+
+4.  orange.ai在X平台[发帖称](https://x.com/oran_ge/status/1946196322211819831)，根据最新统计，中国的**自媒体创作者**人数已经**突破一亿**大关，这个庞大的数字甚至快要超过传统意义上的白领阶层。这一社会现象引发了一个极其深刻的思考：当内容创作已经演变为一种主流的“生产”方式时，我们对于“工厂”和“**工人**”的传统**定义**是否已经彻底过时了？或许，对于新一代的劳动者而言，广阔无垠的赛博空间就是他们的新式流水线，而键盘和鼠标就是他们的现代化工具。
+
+5.  AI产品开发者们请注意，资深观察家歸藏(guizang.ai) [提出了一个灵魂拷问](https://x.com/op7418/status/1946222803432374538)，这个问题直击当前许多AI应用的痛点。他问道：如果你的**AI产品**或**Agent**，在使用了同样的底层模型和精心设计的提示词之后，其表现依然无法稳定复现一个通用聊天工具就能轻松实现的功能，那么你这款独立产品的**核心价值**究竟体现在哪里？这不仅仅是一个尖锐的问题，更是一个值得所有从业者深刻反思的“产品价值试金石”，帮助我们回归初心，思考创新的本质。

 ---