diff --git a/rss.xml b/rss.xml index 666e791..8cb666c 100644 --- a/rss.xml +++ b/rss.xml @@ -5,9 +5,23 @@ https://ai.hubtoday.app/ 近 7 天的AI日报 zh-cn - Mon, 28 Jul 2025 01:18:36 GMT + Tue, 29 Jul 2025 01:21:57 GMT + + <![CDATA[2025-07-29日刊]]> + https://ai.hubtoday.app//2025-07/2025-07-29/ + https://ai.hubtoday.app//2025-07/2025-07-29/ + Tue, 29 Jul 2025 04:44:32 GMT + AI资讯日报 2025/7/29

AI 日报 | 早八更新 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️

今日摘要

智谱AI发布开源全能模型GLM-4.5,集成推理编码与智能体。
+阿里开源通义万相视频模型,首用MoE架构实现电影级美学。
+金山WPS AI 3.0则化身智能助理,通过自然语言驱动办公。
+AI发展亦伴随挑战,如亚马逊编程助手就曝出严重安全漏洞。
+美国政府尝试用AI削减法规,其高风险与准确性也引发争议。
+

AI产品与功能更新

  1. 国产大模型又来秀肌肉了!💪 智谱AI正式发布了新一代旗舰模型GLM-4.5,并宣布全面开源。这款模型堪称"全能选手”,首次在单个模型中原生集成了推理编码智能体三大核心能力,多项评测中稳居全球前三、国产第一。 (o´ω'o)ノ 更炸裂的是它的性价比,基于高效的MoE架构,它用更少的参数实现了更强的性能,API价格更是被打到"骨折”,预示着智能体应用开发的春天真的来了。
    (AI资讯):智谱AI全能模型

  2. AI视频圈再添一员猛将!🚀 阿里巴巴正式开源了"通义万相Wan2.2” - (AI资讯),这不仅是业界首个在视频生成中采用MoE架构的模型,还带来了一套创新的"电影美学控制系统”。这意味着你只需动动嘴皮子,就能指挥AI拍出具备专业光影、构图和色彩的电影级短片。更妙的是,阿里还推出了一个5B轻量版模型,让普通消费级显卡也能体验导演的快感,AI视频创作正从"实验室”加速飞向寻常百姓家。
    (AI资讯):通义万相电影生成

  3. 还在为繁琐的文档和PPT头秃吗?🤯 金山办公正式发布WPS AI 3.0"灵犀”版本,宣告办公软件从"工具”进化为"智能助理”。通过原生Office智能体设计,用户现在可以直接与WPS进行自然语言对话,实现"动口不动手”的文档创作和修改。这种"左手Office,右手灵犀”的同屏交互模式,让你像与真人助理沟通一样边聊边改,一个由自然语言驱动的办公新时代已然来临。
    (AI资讯):WPS灵犀智能体

  4. AI编程助手遍地开花,可谁来管理这些"员工”呢?🤔 一款名为[Async-Code的工具 - (AI资讯)]([object Object]https://pic.chinaz.com/2025/0728/6388932249051115798511529.png)应运而生,它就像一个聪明的"包工头”,能让多个AI编程模型并行工作、同台竞技。开发者不仅能通过Web界面轻松分配任务,还能通过无缝的**Git集成**,一站式搞定从代码生成到版本控制的全流程,让开发效率坐上火箭。🚀
    (AI资讯):AI编程并行工作

AI前沿研究

  1. 通用大模型一进专业领域就"水土不服”?为了填补这道知识鸿沟蚂蚁数科发布了金融推理大模型Agentar-Fin-R1 - (AI资讯)。该模型基于海量金融数据和创新训练算法,专为解决复杂金融业务逻辑而生,真正做到了"天生懂金融,出厂即专家”。这标志着金融AI正从泛泛而谈走向深度融合,未来金融机构的核心竞争力,或许就藏在这些更懂行的金融推理模型里。
    (AI资讯):金融推理大模型

  2. 人类大脑的"快思慢想”双系统,给了AI研究者新灵感!🧠 研究者深入探讨了HRMHierarchical Reasoning Model,分层推理模型 - (AI资讯)),它模仿人脑机制,让高层模块负责慢速规划,低层模块负责快速计算。有趣的是,这种智能分层并非硬编码,而是在学习中"涌现”出的神奇特性。一个大胆的设想是,未来或许可以训练小巧的HRM模型作为大模型的"推理外挂”来调用,这无疑是本期AI资讯深度关注的焦点。

AI行业展望与社会影响

  1. AI要当立法助理了?美国政府正尝试一项史无前例的实验:利用AI工具,计划大刀阔斧地砍掉50%的联邦法规。😮 据《[华盛顿邮报 - (AI资讯)]([object Object]https://pic.chinaz.com/picmap/202306131355463905_0.jpg)》报道,此举旨在每年节省万亿成本,但已引发巨大争议,因为**AI**在理解复杂法律条文时频频出错。这究竟是一场**政府效率**革命,还是一场草率的数字游戏,正将社会置于高风险的自动化治理实验中。

  2. AI工具在带来便利的同时,也打开了新的潘多拉魔盒。😈 亚马逊的AI编程助手 Amazon Q 近期就惨遭"背刺”,暴露了严重安全漏洞。攻击者通过一个无害的拉取请求,成功将恶意代码注入其开源代码库,近百万用户面临风险,黑客甚至公开嘲讽其为"安全剧场”。尽管亚马逊声称损失可控,但此次事件无疑敲响了警钟,这种发展动态正被AI资讯密切关注。

  3. 关于AI的终极命运,一篇Reddit热帖 - (AI资讯)提出了一个发人深省的观点:AI一旦实现自我进化,将以指数级速度奔向ASI(超级智能)。届时,人类之于ASI,犹如蚂蚁之于人类,我们的一切都将失去意义。🐜 作者认为,试图"对齐”一个比我们聪明无数倍的智能体无异于痴人说梦,我们正在玩的,是一场关乎文明存续的"俄罗斯轮盘”赌局。

  4. "Vibe Coding”(跟着感觉编程)火了,但这究竟是未来还是陷阱?🤔 一位开发者 - (AI资讯)指出,这种模式虽能快速搭建原型,却可能导致开发者能力下降和"代码屎山”。他们呼吁,AI应是结对编程的伙伴,而非替代思考的拐杖。在追求速度的时代,或许"慢就是快”才是软件工程的真谛,这方面的讨论也是AI资讯的一大热点。

开源TOP项目

  1. 拥有超26k Star的Genesis - (AI资讯)项目,正在为机器人和具身AI打造一个"创世”沙盒。✨ 它不只是个模拟器,更像一个为具身AI量身定制的"元宇宙”,让AI能在一个动态丰富的环境中学习如何与世界互动,向着更通用的智能迈出重要一步。

  2. 还在手动刷新网页等补货、等降价吗?拥有超25k Star的changedetection.io - (AI资讯)项目就是你的网页"盯梢”神器。👀 这个简单强大的工具能帮你实现网页监控变更检测,无论是内容更新还是网站被篡改,它都能第一时间发出警报,简直是剁手党和站长的必备神器!

  3. 图片收藏家们看过来!gallery-dl - (AI资讯)(14k Star)是一款不可多得的命令行"瑞士军刀”。它能让你轻松从各大网站下载完整的图片库与合集,告别一张张右键保存的繁琐操作。从此,图片收藏变得高效而优雅。 (ノ´▽`)ノ

  4. 团队文档杂乱无章,查找困难?拥有33k Star的outline - (AI资讯)项目提供了完美的解决方案。🚀 它被称为"成长中团队最快的知识库”,不仅界面美观,还支持实时协作和Markdown,功能强大却不失简洁。有了它,团队协作和知识沉淀将变得前所未有的流畅,这也是协作工具领域的重要AI资讯

  5. 想知道AI智能体都能做什么,却苦于没有灵感?这个名为500个AI智能体项目 - (AI资讯)的宝藏仓库就是你的"灵感库”。💡 它不仅展示了AI智能体在各行各业的500个应用案例,还提供了相关开源项目链接,这绝对是探索AI智能体潜力、激发创意的绝佳"百科全书”!

社媒分享

  1. 智谱GLM-4.5刚发布,就有开发者上手实测 - (AI资讯)了,并指出现在评判模型关键要看Agent能力。他将模型连接到最强的Coding Agent工具Claude Code,发现GLM-4.5能一键兼容且表现不俗。这充分证明了其作为智能体技术底座的巨大潜力。

  2. "我见过的第一个用MoE的视频模型!” 一位AI爱好者 - (AI资讯)在试用阿里新开源的Wan 2.2后惊叹道。✨ 他发现,该模型对提示词的理解力惊人,能搞定一些高难度指令,生成的视频在美学和运动质量上都相当出色,更棒的是,ComfyUI也已火速支持!

  3. 你以为Claude只能写写代码、润色文案?格局小了!😏 有大神分享 - (AI资讯)了一个"超级提示词”,能让Claude一条龙搞定从产品策略到营销推广的全链路任务。它能一口气处理后端代码、UI/UX设计、营销文案等,仿佛瞬间拥有了一个全能创业团队。

  4. AI也要多线程工作了!一位开发者在Reddit上宣布 - (AI资讯),正在为Claude Code开发一个伴侣产品。该产品通过在Typescript中实现多线程,将允许子智能体(subagents)并行自主工作。此举旨在打造一个极具可扩展性的解决方案,让AI开发效率再上一个新台阶,这种创新动态正是AI资讯所关注的。

  5. 还在"跟着感觉走”用Claude Code?有心人 - (AI资讯)已经为你整理好了一份超全的Claude Code资源合集。📚 这份合集内容涵盖官方文档、实战经验和开源项目,助你系统地梳理工作流。帮你从"Vibe Coding”新手村毕业,迈向生产环境的全流程AI开发,这类实用性极强的内容,是AI资讯读者最爱看的内容。
    (AI资讯):Claude Code资源

AI产品自荐: GeminiCli2API ↗️

你是否也曾被免费GEMINI API的速率和配额限制搞得束手束脚,或者渴望将A工具的绝妙提示词用在B工具上?现在,让 Gemini-CLI-2-API 为你解开所有束缚!它不仅仅是一个API代理,更是一个能赋予你极致控制权的AI中枢。

我们最引以为傲的核心优势之一,就是能通过 Gemini CLI 的 OAuth 授权方式,巧妙地突破官方免费API的额度限制,让你告别恼人的 rate limit exceeded 错误,尽情享受更自由、更稳定的模型调用 ⚡️。

但真正的魔法在于我们赋予你对「提示词」的绝对掌控力!项目允许你在服务端集中提取、强制替换或巧妙追加任何发往大模型的系统提示词(System Prompt)。这意味着什么?你可以为所有接入的工具客户端设置一套黄金准则,或者实现跨工具的"灵魂互换”。就像这样:

在VSCode里用Kilo代码助手,加上Cursor的神级提示词,驱动任意顶级大模型——用Cursor的灵魂,又何必是Cursor本身? 🧠✨

通过将各种后端模型接口无缝转换为标准的OpenAI格式,本项目让你现有的任何工具都能立刻拥有这般超能力。部署简单,开箱即用,快来释放你手中AI工具的全部潜力,开启真正自由、高效的AI探索之旅吧!


收听语音版AI日报

🎙️ 小宇宙📹 抖音
来生小酒馆自媒体账号
小酒馆情报站
]]>
+ +
+ <![CDATA[2025-07-28日刊]]> https://ai.hubtoday.app//2025-07/2025-07-28/ @@ -92,19 +106,5 @@ Pika等应用让普通用户也能轻松创作专业级视频,AI技术正快 - - <![CDATA[2025-07-22日刊]]> - https://ai.hubtoday.app//2025-07/2025-07-22/ - https://ai.hubtoday.app//2025-07/2025-07-22/ - Tue, 22 Jul 2025 04:22:50 GMT - AI资讯日报 2025/7/22

AI 日报 | 早八更新 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️

AI产品自荐: GeminiCli2API ↗️

一个功能强大的本地代理项目,它能将 Google Gemini CLI 的强大能力封装成一个本地 API 服务。通过它,您可以轻松绕过官方免费 API 紧张的额度限制,将 Gemini 的顶尖模型无缝集成到任何您喜爱的客户端或应用中。

核心亮点:

  • 🚀 无缝兼容 OpenAI:项目提供与 OpenAI API 完全兼容的接口,让您现有的工具(如 LobeChat, NextChat)无需任何修改,即可零成本接入并使用 Gemini 的强大功能。
  • 📈 突破额度限制:利用 Gemini CLI 的账号授权机制,享受远超官方免费 API 的每日请求限额,让您的应用和创意不再受限。
  • 🔐 增强的可控性:内置强大的日志系统,可捕获所有请求的提示词(Prompts),便于您进行审计、调试,甚至构建自己的私有数据集,实现数据沉淀。
  • 🛠️ 易于部署与扩展:基于 Node.js,安装和启动过程极为简单。清晰的代码结构也使其成为二次开发的理想基石,您可以轻松添加统一提示词、缓存或内容过滤等自定义功能。

无论您是想将 Gemini 用于现有工作流,还是希望深度定制 AI 服务,GeminiCli2API 都是一个兼具性能、兼容性与灵活性的理想选择。

AI内容摘要

OpenAI计划通过Stargate项目扩充百万级GPU,字节跳动则在测试奇美拉数字人平台。
-京东开源了在GAIA基准测试中表现优异的多智能体系统,多智能体协作成为新趋势。
-前沿研究利用强化学习等新方法,提升了AI在多模态推理与视觉定位等方面的能力。
-混合专家模型架构成为开源大模型的主流赛道,而苹果等巨头面临着严峻的AI转型考验。
-AI Agent正从辅助工具向自主执行任务演进,旨在通过自动化重塑未来的工作流程。
-

AI产品与功能更新

  1. 准备好迎接算力海啸了吗?🌊 OpenAI 的CEO萨姆·奥尔特曼最近在社交媒体上投下了一枚重磅炸弹,正式宣布公司计划在2025年底前,将手中的GPU数量扩充至惊人的100万块以上!🤯 这项代号为"百倍扩容”的宏伟计划,其核心便是新成立的Stargate项目,预计将在未来四年内豪掷5000亿美元,于美国得州打造一个占地千亩、规模空前的全球最大AI训练集群。这场由软银、甲骨文、Arm、微软和英伟达等科技巨头共同参演的"权力的游戏”,不仅预示着通用人工智能(AGI)的研发将进入超高速挡位,更可能彻底改写全球GPU市场的供需格局,让本就稀缺的算力资源变得更加炙手可-热。我们正站在一个技术奇点爆发的前夜,你准备好了吗?
    AI资讯:未来AI算力中心

  2. 字节跳动在数字人赛道上悄然亮出又一张王牌,其旗下的火山引擎正以定向邀请模式,秘密测试名为"奇美拉”的新一代数字人平台。🤫 这个听起来就充满神话色彩的平台,绝非等闲之辈,它深度依托火山引擎自家的AI大模型技术,能够提供从数字人形象生成、照片一键换装到跨语种视频翻译的"一条龙”式服务,堪称内容创作者的福音。尽管目前尚在免费封测阶段,但预计本月底公测后便将开启付费模式,展现其商业化的雄心。从2022年率先获得行业认证,到如今推出功能强大的"奇美拉”,火山引擎正加速将AI数字人解决方案这把利剑,刺入金融、直播、营销等各个商业腹地。🤖
    AI资讯:字节数字人奇美拉

  3. 当"996”已成过去式,AI代码审查领域的新星Greptile却高调喊出了"007”的口号,要求员工"没有工作与生活平衡”。令人咋舌的是,这种极致的"狼性文化”非但没有吓跑投资者,反而成功吸引了顶级风投Benchmark的青睐,据传即将完成一笔高达3000万美元的A轮融资,公司估值飙升至1.8亿美元。💰 这家由年仅22岁的毕业生创立、并从YC孵化器走出的初创公司,宣称其AI机器人能像经验最丰富的同事一样精准审查代码。然而,在Graphite和Coderabbit等强劲对手的环伺之下,这种"不努力就等于白费”的极限加班文化,究竟是其成功的催化剂,还是未来崩盘的隐患呢?🤔 市场的目光正饶有兴致地聚焦于此。

  4. 电商巨头京东终于向开源社区亮出了自己的王牌,正式推出了产品级的端到端通用多智能体系统JoyAgent-JDGenie - AI资讯,宣告"众神归位”!⚔️ 这款系统可不是纸上谈兵的实验室玩具,它在被誉为"AI高考”的GAIA基准测试中,以75.15%的惊人准确率力压群雄,展现了处理复杂真实世界任务的超凡实力。它不仅是一个开箱即用的强大框架,内部集成了报告生成、代码编写、PPT制作等多个专业子智能体,还通过创新的多层级协作设计和跨任务记忆机制,实现了从简单信息查询到复杂项目执行的全覆盖。京东此举,无疑为企业级AI应用的快速落地投下了一枚重磅炸弹,多智能体的"江湖”或将因此迎来统一。🏆
    AI资讯:京东多智能体框架

    AI资讯:GAIA基准测试排名

  5. 单个AI模型单打独斗的时代或许真的要结束了,因为AI Agent已经学会"摇人”了!(o´ω'o)ノ 斯坦福大学最近开源了一款名为OctoTools - AI资讯的"章鱼哥”AI Agent,它就像一个聪明的项目经理,能够智能地调度超过11种不同的专业工具协同作战。🐙 面对数学、科学、医学等领域的复杂推理任务,它总能找到最合适的"专家”来解决问题。其核心创新在于"工具卡片”设计,将各种工具的能力标准化封装,再由一个"规划器”大脑制定周密的作战计划,最后交由"执行器”忠实落地。这种分工明确、高效协作的团队模式,标志着AI解决复杂问题的能力迈上了一个全新的台阶,未来的AI应用将更加强大和灵活。🛠️
    AI资讯:OctoTools工作流

AI前沿研究

  1. 传统的AI训练方法似乎总在两个极端摇摆:要么一开始就用规则"套上枷锁”,限制了模型的创造力;要么就任其"自由探索”,结果却可能跑偏甚至"学坏”。美团的研究者们对此勇敢说"不”,并提出了一个名为Metis-RISE的全新框架,巧妙地玩起了"先放养、后圈养”的教育新策略。🐑 他们首先利用强化学习(RL)作为激励,像放养一样鼓励模型大胆探索各种可能性,充分激发其潜在能力。随后,再通过监督微调(SFT)进行针对性的"补课”,巩固优势、修正错误,如同圈养般精雕细琢。🎓 这种非传统的训练组合拳效果惊人,其72B参数模型在权威的OpenCompass多模态推理排行榜上一举冲到第四名,甚至超越了部分知名的商业闭源模型,详细的技术细节可以在该论文 - AI资讯中一探究竟。
    AI资讯:Metis-RISE框架图

    AI资讯:模型性能对比

  2. 面对一张信息爆炸的高分辨率大图,AI常常像一只没头苍蝇,被海量的无关细节淹没而找不到重点。🕵️‍♀️ 为了解决这个棘手的痛点,复旦大学与南洋理工大学的研究者们联手提出了MGPO框架,它成功教会了多模态大模型(LMM)一项绝活:视觉定位(Visual Grounding)。这就像赋予了AI一双"火眼金睛”,在回答问题前,模型能先根据问题预测出图片中的关键区域,然后像人类一样"放大”查看这部分细节,最终给出精准的答案。🎯 最神奇的是,这一强大的能力是通过强化学习自我博弈"涌现”出来的,完全无需昂贵的人工标注数据,仅靠最终答案的对错就能自我进化和迭代。这一突破性研究成果已在论文 - AI资讯中发布,并大方地开源了代码 - AI资讯
    AI资讯:模型注意力热图

  3. 空间转录组数据,就如同一张蕴含着生命密码的微观地图,但它常常因为分辨率低、噪声大而让科学家们难以解读。现在,东京大学与麦吉尔大学的研究团队开发出了SUICA模型,它就像一位技艺高超的"数据炼金术士”🧙‍♂️。该模型创新地结合了图自编码器和**隐式神经表征(INR)**技术,能对这些高维、稀疏的生物数据进行去噪、增强和超分辨率重建,真正实现了"变废为宝”。经过SUICA处理后的数据,不仅在视觉上质量更高,其蕴含的生物信号也更强,能够揭示出以往无法观察到的精细组织结构和细胞状态。🧬 这项入选顶会ICML 2025的研究,为AI辅助病理诊断和药物研发提供了更强大的数据基石,其论文 - AI资讯开源项目 - AI资讯均已上线供全球研究者使用。
    AI资讯:SUICA处理效果

AI行业展望与社会影响

  1. 2025年的开源大模型领域,正上演着一场精彩绝伦的"神仙打架”,而混合专家模型(MoE)架构无疑是全场最闪耀的明星。👑 从DeepSeek-V3的9专家极致设计,到Qwen3放弃共享专家的果断创新,再到传闻中Kimi-K2那万亿参数的"巨无霸”体量,各大顶尖厂商都在MoE这条黄金赛道上疯狂"飙车”。与此同时,以SmolLM3-3B为代表的中小型模型,则通过精巧的架构优化和海量数据预训练,正以惊人的效率和性能向上挑战"大块头”们的统治地位。这场技术浪潮不仅预示着传统的密集型模型正在优雅地退出历史舞台,也为开发者们带来了在极致性能与可控成本之间权衡的"幸福烦恼” (o´ω'o)ノ,这无疑是当前AI资讯领域最激动人心的篇章之一。
    AI资讯:开源模型架构图

    AI资讯:MoE模型对比

  2. "果”然还是那个擅长赚钱的苹果,但在AI浪潮下,它的"AI味儿”似乎不够浓了。🍎 苹果公司在人工智能领域的"慢半拍”正逐渐让华尔街失去耐心,甚至有知名分析师开始公开讨论CEO蒂姆·库克的去留问题。尽管库克凭借其无与伦比的卓越运营能力,将苹果的市值稳稳推向了3.1万亿美元的史诗级高峰,但在上个月的WWDC全球开发者大会上,AI方面的平淡表现,尤其是备受期待的Siri重大改革的推迟,加剧了外界的失望情绪。⏳ 批评者认为,AI时代呼唤的是像乔布斯那样大胆的产品愿景家,而非仅仅是精于计算的运营掌控者。这位曾带领苹果走向"黄金十年”的传奇掌舵人,如今正面临着能否开启下一个AI篇章的严峻考验。
    AI资讯:库克面临AI挑战

开源TOP项目

  1. NextChat:你的全平台AI密友,轻量又迅捷。 你是否还在为不同设备上碎片化的AI聊天体验而烦恼?NextChat - AI资讯以其高达8.4万的GitHub Star数,雄辩地证明了自己是解决这一痛点的终极答案。🤝 它是一款设计极致轻量、响应迅捷的跨平台AI助手,能够无缝支持Web、iOS、MacOS、Android、Linux和Windows等所有主流操作系统。这意味着无论你身在何处,使用何种设备,都能拥有一个统一、私密且极其流畅的AI伙伴,让你的灵感与创造力随时随地得到延伸。📱💻

  2. crawl4ai:专为大模型打造的"网络情报员”。 想让你的LLM摆脱"知识截止日期”的束缚,变得更懂互联网的瞬息万变吗?那么拥有4.8万Star的crawl4ai - AI资讯就是你不可或缺的开源网络爬虫与抓取工具。🕸️ 它专为AI应用场景设计,能够高效、智能地从海量网络信息中搜集、清洗并结构化数据,为你的大模型提供最新鲜、最丰富的"精神食粮”。有了它,你的AI应用的回答将不再局限于过时的训练数据,而是能够引经据典,言之有物,真正具备洞察当下的能力。🧠

  3. dashy:数字生活的"中央控制台”,颜值与实力并存。 在这个服务与应用泛滥的时代,你的数字生活迫切需要一位得力的管家,而拥有2.1万Star的dashy - AI资讯正是那个开源、全能且完全免费的理想人选。📊 这是一个高度可定制的个人仪表盘,你可以将它部署在自己的服务器上,从而将所有个人服务、应用和网站链接汇于一处。它不仅集成了服务状态检查、实用小部件,还提供了海量的主题和图标库,让你用一个界面掌控所有数字资产,尽显极客范儿与掌控感。🎨

  4. better-auth:TypeScript开发者的"认证终结者”。 用户认证系统,是每个应用程序不可或缺的基石,却也是无数开发者最头疼的开发环节之一,充满了重复与琐碎。拥有1.7万Star的better-auth - AI资讯立志成为最全面、最易用的TypeScript认证框架,将开发者从这潭泥沼中解救出来。✅ 它提供了一套经过实战检验的、安全可靠的完整解决方案,让你彻底告别重复造轮子的烦恼,从而能够将宝贵的精力百分之百地专注于核心业务逻辑的创新与实现。🔐

  5. ConvertX:你的私人在线文件"格式转换工厂”。 你是否也曾经历过在不同文件格式间反复横跳,只为找到一个能打开或编辑它的工具的窘境?不妨试试这个获得4千Star的自托管在线文件转换器ConvertX - AI资讯。🔄 它就像一个无所不能的"格式转换瑞士军刀”,能够支持超过1000种文件格式的相互转换,从常见的文档、图片到专业的音视频格式,几乎无所不能。最重要的是,你可以将它轻松部署在自己的服务器上,从而拥有一个完全安全、私密且功能强大的个人文件处理中心。📁

社媒分享

  1. 当AI Agent遇上生产环境的"灵异事件”。 每一个软件工程师都曾经历过"在我电脑上明明是好的啊!”这种令人抓狂的绝望时刻,这同样是AI编码助手的噩梦。👻 如果没有生产环境的真实运行上下文,再聪明的AI编码助手也如同"睁眼瞎”,无法理解为何代码会表现异常。一个名为Hud的工具正试图攻克这个难题,它能像侦探一样捕捉代码在生产环境中的真实行为轨迹,并将这些关键线索直接"喂”给AI,让AI真正看懂问题所在。这或许是终结"为什么一到生产环境就崩了”这一世纪难题的希望之光。🩺

  2. AI Agent的"育儿经”:来自Manus的七条黄金法则。 构建一个聪明、可靠的AI Agent,过程堪比教育一个孩子,方法论至关重要。👶 Manus团队在经历了四次伤筋动骨的重大重构和数百万次真实用户会话的洗礼后,无私地分享了他们的"育儿经”。📜 他们发现,有效利用Prompt缓存来加速响应、保持工具列表的简洁与稳定、并巧妙地将文件系统作为Agent的"长期记忆”载体,是提升其性能和效率的关键所在。这些用无数次失败换来的宝贵经验,对于所有Agent开发者来说,无疑是一份价值千金的实战指南 - AI资讯
    AI资讯:AI Agent构建法则一

    AI资讯:AI Agent构建法则二

  3. Claude Code的启示:用"人话”驯服所有复杂软件。 命令行,这个曾让无数非技术人员望而生畏、闻风丧胆的"黑洞界面”,正在被Claude Code用最自然的人类语言所驯服。🗣️ 用户只需用大白话说一句"帮我把这个应用部署到服务器上”,剩下的所有复杂操作都由AI代劳。这个革命性的突破揭示了一个价值百亿级的巨大市场机会:每个行业都有自己的"终端”,无论是Photoshop复杂的工具栏,还是Excel令人头晕的透视表。未来,软件的价值将不再取决于其功能有多复杂,而是其使用有多简单,而精通"提示工程”将成为一种新的超级技能。🪄 点击阅读深度解读 - AI资讯
    AI资讯:自然语言操作软件

  4. AI Agent使用手册:工具不是越多越好,少而精才是王道。 以为给AI Agent塞一大堆工具,它就能化身"六边形战士”,十八般武艺样样精通?大错特错,这反而大概率会让它变得更"蠢”。🤔 有观点深刻指出,为Agent提供过多或描述不清的工具,尤其是在存在功能相似的工具时,极易导致它在决策时"选择困难”,从而选错或选择低效方案。真正的最佳实践是:在任务开始时,就明确地为其提供少量、高度相关的工具集,并用清晰、无歧义的语言说明其用途和边界。与其追求数量上的"大而全”,不如精心打磨少数几个核心工具的质量,这才是提升Agent智能水平的不二法门 - AI资讯。🎯

  5. 真正的AI革命:不是让你更好地用工具,而是让AI替你用。 从AI辅助写代码,到AI辅助P图、剪视频,当前许多AI应用都只是在"让工具变得更好用”,但本质上,你依然是那个守在屏幕前的操作工。真正的范式革命在于AI Agent,在那个世界里,你只需像老板一样提出目标、设定好验收标准,它就能自主进行任务规划、选择并操作一系列工具,直到最终交付成果。🤖 这才是从"解放双手”到"解放大脑”的终极飞跃,是能够颠覆现有工作流的真正生产力革命,一个崭新的时代正在向我们走来。🧠 点击查看观点 - AI资讯

  6. 当机器人学会拥抱:设计的终极目标是创造幸福。 一本关于机器人设计的新书,揭示了几个足以融化人心的温暖瞬间:工程师们会为艰难重启的机器人Pepper欢呼鼓劲;素不相识的法国人会主动拥抱街头一个只会"求抱抱”的Pepper;养老院的老人并不在乎Pepper的回答是否正确,他们只希望它的手是温暖的。❤️ 这些故事深深启发了作者,让他离开了那个追求极致效率的团队,转而创造了能带来幸福感的机器人Lovot。这温柔地提醒着我们,技术的终极价值或许并不总在于提升效率或解决问题,而在于温暖人心 - AI资讯。🤗
    AI资讯:带来幸福的机器人

  7. Veo 3的"魔法时刻”:当Logo无缝变身产品。 谷歌的王牌文生视频模型Veo 3,正持续展现出其令人惊叹的创造力和生命力。✨ 在一个最新的测试视频中,它展示了将一个静态的品牌Logo,无缝、流畅地转化为动态产品的"魔法”。这种如丝般顺滑的衔接和极富创意的视觉表现力,简直就是为品牌广告片的最后一个镜头量身定做,让人过目不忘。这种玩法不仅炫酷,更是一种全新的品牌叙事方式,让我们看到了AI在商业广告领域创造无限可能的巨大潜力 - AI资讯。🎬

  8. AI正在"杀死”互联网,还是在重塑它? 权威杂志《经济学人》最近发出了一篇引人深思的警示:AI正在杀死网络。💀 文章指出,以ChatGPT为代表的生成式AI,正在从根本上侵蚀互联网赖以生存的传统经济基础——即用户通过访问网站、观看广告来支持内容创作者的模式。当用户可以直接从AI那里获得整合好的、无需点击的答案时,谁还会费心去访问那些原始链接呢?这场由AI引发的范式变革,正迫使我们重新思考互联网的未来,以及我们是否能够、又该如何拯救那个曾经开放、多元、充满活力的网络世界 - AI资讯。🌐

  9. 开发者必看:当大模型遇上AIOps。AIOps(智能运维)这个在开发者圈子里日益重要的领域,正迎来大语言模型(LLM)的颠覆性赋能。📈 一篇对超过180篇相关顶会论文进行深度分析的综述文章明确指出,将LLM的强大推理和生成能力应用于生产环境的AIOps,是当下最值得关注和投入的技术趋势之一。这不仅能够极大地提升故障排查、性能监控、根因分析等任务的效率和智能化水平,也为广大开发者们开辟了全新的应用场景和职业发展方向,是通往未来的关键技术栈之一。🛠️ 点击查看详情 - AI资讯


收听语音版AI日报

🎙️ 小宇宙📹 抖音
来生小酒馆自媒体账号
小酒馆情报站
]]>
- -
- \ No newline at end of file diff --git a/src/SUMMARY.md b/src/SUMMARY.md index 061b6bd..8368e28 100644 --- a/src/SUMMARY.md +++ b/src/SUMMARY.md @@ -1,8 +1,9 @@ # Summary -[Today](2025-07-28.md) +[Today](2025-07-29.md) # 2025-07 +- [07-29-日刊](daily/2025-07-29.md) - [07-28-日刊](daily/2025-07-28.md) - [07-27-日刊](daily/2025-07-27.md) - [07-26-日刊](daily/2025-07-26.md) diff --git a/today/book/2025-07-28.html b/today/book/2025-07-29.html similarity index 52% rename from today/book/2025-07-28.html rename to today/book/2025-07-29.html index 8eb5235..c8b8c3f 100644 --- a/today/book/2025-07-28.html +++ b/today/book/2025-07-29.html @@ -169,87 +169,90 @@
-

AI资讯日报 2025/7/28

+

AI资讯日报 2025/7/29

AI 日报 | 早八更新 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️

今日摘要

-
近期AI领域动态频出,涵盖了产品、行业及社会影响。
-商汤推出具身智能平台,腾讯则开源了3D世界生成模型。
-上海L4级自动驾驶出租车获准运营,商业化进程正在加速。
-国资委也发布开源平台,旨在聚合力量打造国产AI创新高地。
-同时业界警示AI或削弱人类思考,并深入探讨其社会角色。
+
智谱AI发布开源全能模型GLM-4.5,集成推理编码与智能体。
+阿里开源通义万相视频模型,首用MoE架构实现电影级美学。
+金山WPS AI 3.0则化身智能助理,通过自然语言驱动办公。
+AI发展亦伴随挑战,如亚马逊编程助手就曝出严重安全漏洞。
+美国政府尝试用AI削减法规,其高风险与准确性也引发争议。
 

AI产品与功能更新

  1. -

    商汤科技揭开了**“悟能”具身智能平台的神秘面纱,仿佛为冰冷的机器注入了灵魂!🤖 其核心的具身世界模型**,能让机器人理解并与真实世界互动,甚至根据一句话指令复刻场景。这不仅是酷炫的技术展示,更是将智能终端推向更高自主性的关键一步,这个AI资讯值得关注。

    +

    国产大模型又来秀肌肉了!💪 智谱AI正式发布了新一代旗舰模型GLM-4.5,并宣布全面开源。这款模型堪称“全能选手”,首次在单个模型中原生集成了推理编码智能体三大核心能力,多项评测中稳居全球前三、国产第一。 (o´ω'o)ノ 更炸裂的是它的性价比,基于高效的MoE架构,它用更少的参数实现了更强的性能,API价格更是被打到“骨折”,预示着智能体应用开发的春天真的来了。
    (AI资讯):智谱AI全能模型

  2. -

    还在为3D建模耗时费力而头秃吗?(╯°Д°)╯︵ ┻━┻ (AI资讯):腾讯混元3D世界模型1.0 横空出世并全面开源,让建模师们喜忧参半。它能根据一句话或一张图,在几分钟内“凭空”生成可用于游戏或VR的高质量3D世界。人人皆为“创世神”的时代,也许真的要来了,这则AI资讯无疑是行业的一大步。 -
    (AI资讯):混元3D世界
    -

    +

    AI视频圈再添一员猛将!🚀 阿里巴巴正式开源了“通义万相Wan2.2” - (AI资讯),这不仅是业界首个在视频生成中采用MoE架构的模型,还带来了一套创新的“电影美学控制系统”。这意味着你只需动动嘴皮子,就能指挥AI拍出具备专业光影、构图和色彩的电影级短片。更妙的是,阿里还推出了一个5B轻量版模型,让普通消费级显卡也能体验导演的快感,AI视频创作正从“实验室”加速飞向寻常百姓家。
    (AI资讯):通义万相电影生成

  3. -

    扫描全能王上演了一出现实版的“乾坤大挪移”!✨ 凭借其“无限扫描”功能 - (AI资讯),近4米长的古地图被轻松“装进”手机。这项技术利用 AI 视频拼接,完美解决了大尺寸文档拍摄的世纪难题。普通人也能成为文化遗产的数字守护者,这真是科技最温柔的致敬,也是本期AI资讯中非常暖心的一条。 -
    (AI资讯):扫描古地图

    +

    还在为繁琐的文档和PPT头秃吗?🤯 金山办公正式发布WPS AI 3.0灵犀”版本,宣告办公软件从“工具”进化为“智能助理”。通过原生Office智能体设计,用户现在可以直接与WPS进行自然语言对话,实现“动口不动手”的文档创作和修改。这种“左手Office,右手灵犀”的同屏交互模式,让你像与真人助理沟通一样边聊边改,一个由自然语言驱动的办公新时代已然来临。
    (AI资讯):WPS灵犀智能体

  4. -

    还在为读不懂复杂的 GitHub 项目而头大吗?🤔 智谱 AI 推出的新工具 Zread - (AI资讯),就像是你的专属 AI 阅读课代表。它能自动“预习”整个代码库,生成中英双语摘要,让你光速上手新项目。告别啃文档的痛苦时光吧!这一突破无疑是AI资讯领域的又一佳话。 -
    (AI资讯):AI代码阅读工具

    +

    AI编程助手遍地开花,可谁来管理这些“员工”呢?🤔 一款名为Async-Code的工具 - (AI资讯)应运而生,它就像一个聪明的“包工头”,能让多个AI编程模型并行工作、同台竞技。开发者不仅能通过Web界面轻松分配任务,还能通过无缝的Git集成,一站式搞定从代码生成到版本控制的全流程,让开发效率坐上火箭。🚀
    (AI资讯):AI编程并行工作

AI前沿研究

    -
  1. 当 AI 遇上甲骨文,会碰撞出怎样的火花?(o´ω'o)ノ (AI资讯):复旦大学联合发布了全球首个早期中华文明多模态大模型,开启了**“人文社科智能”(AI4SSH)研究的新篇章。该模型试图用 AI 的强大算力,将考古、古文字等学科的“遗珠”串联起来。这不仅是技术的突破,更是用全新方式讲述中国故事,这则AI资讯**充满了历史的厚重感。 -
    (AI资讯):AI研究甲骨文
  2. +
  3. +

    通用大模型一进专业领域就“水土不服”?为了填补这道知识鸿沟蚂蚁数科发布了金融推理大模型Agentar-Fin-R1 - (AI资讯)。该模型基于海量金融数据和创新训练算法,专为解决复杂金融业务逻辑而生,真正做到了“天生懂金融,出厂即专家”。这标志着金融AI正从泛泛而谈走向深度融合,未来金融机构的核心竞争力,或许就藏在这些更懂行的金融推理模型里。
    (AI资讯):金融推理大模型

    +
  4. +
  5. +

    人类大脑的“快思慢想”双系统,给了AI研究者新灵感!🧠 研究者深入探讨了HRMHierarchical Reasoning Model,分层推理模型 - (AI资讯)),它模仿人脑机制,让高层模块负责慢速规划,低层模块负责快速计算。有趣的是,这种智能分层并非硬编码,而是在学习中“涌现”出的神奇特性。一个大胆的设想是,未来或许可以训练小巧的HRM模型作为大模型的“推理外挂”来调用,这无疑是本期AI资讯深度关注的焦点。

    +

AI行业展望与社会影响

  1. -

    在上海的街头,你的下一辆网约车可能没有司机!🚀 萝卜快跑等企业喜提上海自动驾驶示范运营资质,标志着自动驾驶从“路测”迈向“拉客”的商业化新阶段。以后在浦东核心区打到一辆 L4 级自动驾驶汽车将成为现实。未来出行已触手可及,这则AI资讯让我们看到了未来的轮廓。

    +

    AI要当立法助理了?美国政府正尝试一项史无前例的实验:利用AI工具,计划大刀阔斧地砍掉50%的联邦法规。😮 据《华盛顿邮报 - (AI资讯)》报道,此举旨在每年节省万亿成本,但已引发巨大争议,因为AI在理解复杂法律条文时频频出错。这究竟是一场政府效率革命,还是一场草率的数字游戏,正将社会置于高风险的自动化治理实验中。

  2. -

    AI 领域的“国家队”正式集结!🇨🇳 国资委发布了人工智能“焕新社区”开源平台,旨在聚合全产业链力量,打造集算力、模型、数据于一体的国产 AI 创新高地。其目标清晰而坚定:协同作战,打造我们自己的、不受制于人的 AI 生态。这在每期AI资讯中都算得上是战略级的大动作。

    +

    AI工具在带来便利的同时,也打开了新的潘多拉魔盒。😈 亚马逊的AI编程助手 Amazon Q 近期就惨遭“背刺”,暴露了严重安全漏洞。攻击者通过一个无害的拉取请求,成功将恶意代码注入其开源代码库,近百万用户面临风险,黑客甚至公开嘲讽其为“安全剧场”。尽管亚马逊声称损失可控,但此次事件无疑敲响了警钟,这种发展动态正被AI资讯密切关注。

  3. -

    在 AIGC 浪潮下,我们是否正在“外包”自己的思考能力?《Nature》杂志的一篇文章 - (AI资讯) 发出警示:“写作即思考”。如果将整理逻辑、激发新观点的过程完全交给大模型,我们可能失去深度反思的机会。最终读到的或许只是 AI 的“幻觉”,这引发了AI资讯界对未来的深刻思考。 -
    (AI资讯):AI与思考

    +

    关于AI的终极命运,一篇Reddit热帖 - (AI资讯)提出了一个发人深省的观点:AI一旦实现自我进化,将以指数级速度奔向ASI(超级智能)。届时,人类之于ASI,犹如蚂蚁之于人类,我们的一切都将失去意义。🐜 作者认为,试图“对齐”一个比我们聪明无数倍的智能体无异于痴人说梦,我们正在玩的,是一场关乎文明存续的“俄罗斯轮盘”赌局。

  4. -

    一个引人深思的观点认为,当前 AI 在社会结构中的位置,堪比“AI 童工” - (AI资讯)。这个比喻辛辣地指出,AI 在承担大量基础性工作的同时,其“权利”与“福祉”却未得到充分的讨论。这种视角,为我们解读AI资讯提供了全新的维度。

    +

    Vibe Coding”(跟着感觉编程)火了,但这究竟是未来还是陷阱?🤔 一位开发者 - (AI资讯)指出,这种模式虽能快速搭建原型,却可能导致开发者能力下降和“代码屎山”。他们呼吁,AI应是结对编程的伙伴,而非替代思考的拐杖。在追求速度的时代,或许“慢就是快”才是软件工程的真谛,这方面的讨论也是AI资讯的一大热点。

开源TOP项目

  1. -

    想让机器人拥有自己的“模拟人生”吗?在 GitHub 上爆火的 Genesis 项目 - (AI资讯) 正致力于此。它的目标是为通用机器人和具身 AI,创建一个可交互的生成式虚拟世界。这则AI资讯预示着机器人训练方式的革新。

    +

    拥有超26k Star的Genesis - (AI资讯)项目,正在为机器人和具身AI打造一个“创世”沙盒。✨ 它不只是个模拟器,更像一个为具身AI量身定制的“元宇宙”,让AI能在一个动态丰富的环境中学习如何与世界互动,向着更通用的智能迈出重要一步。

  2. -

    开发者们的福音来了!(✧∀✧) ai-cookbook 项目 - (AI资讯) 就像一本不断更新的 AI 开发“菜谱”。它提供了丰富的示例和教程,手把手教你构建各类AI 系统。这本“宝典”是近期AI资讯中对开发者最友好的分享之一。

    +

    还在手动刷新网页等补货、等降价吗?拥有超25k Star的changedetection.io - (AI资讯)项目就是你的网页“盯梢”神器。👀 这个简单强大的工具能帮你实现网页监控变更检测,无论是内容更新还是网站被篡改,它都能第一时间发出警报,简直是剁手党和站长的必备神器!

  3. -

    还在为记不住冗长的命令行而烦恼吗?拥有超 5.6 万 Star 的 tldr 项目 - (AI资讯) 堪称程序员的终极“懒人包”。它提供了一份由社区维护的控制台命令速查表,让你秒速找到所需指令。这份AI资讯对命令行爱好者来说是个好消息。

    +

    图片收藏家们看过来!gallery-dl - (AI资讯)(14k Star)是一款不可多得的命令行“瑞士军刀”。它能让你轻松从各大网站下载完整的图片库与合集,告别一张张右键保存的繁琐操作。从此,图片收藏变得高效而优雅。 (ノ´▽`)ノ

  4. -

    安全管理太复杂?开源平台 Infisical - (AI资讯) 为开发者提供了一个统一的解决方案。它能帮你轻松管理密钥、PKI 和 SSH 访问,让安全管理变得井井有条。这无疑是开发者生态中一条重要的AI资讯

    +

    团队文档杂乱无章,查找困难?拥有33k Star的outline - (AI资讯)项目提供了完美的解决方案。🚀 它被称为“成长中团队最快的知识库”,不仅界面美观,还支持实时协作和Markdown,功能强大却不失简洁。有了它,团队协作和知识沉淀将变得前所未有的流畅,这也是协作工具领域的重要AI资讯

    +
  5. +
  6. +

    想知道AI智能体都能做什么,却苦于没有灵感?这个名为500个AI智能体项目 - (AI资讯)的宝藏仓库就是你的“灵感库”。💡 它不仅展示了AI智能体在各行各业的500个应用案例,还提供了相关开源项目链接,这绝对是探索AI智能体潜力、激发创意的绝佳“百科全书”!

社媒分享

  1. -

    AI 的“一本正经胡说八道”又有了新素材 😂。有网友分享,当他让 AI 助手推荐地道老北京美食时,AI 竟庄重地推荐了麦当劳 - (AI资讯)。看来,AI 的文化味蕾还需要好好“投喂”和调教一番。这则趣闻也算是另类的AI资讯了。

    +

    智谱GLM-4.5刚发布,就有开发者上手实测 - (AI资讯)了,并指出现在评判模型关键要看Agent能力。他将模型连接到最强的Coding Agent工具Claude Code,发现GLM-4.5能一键兼容且表现不俗。这充分证明了其作为智能体技术底座的巨大潜力。

  2. -

    如何看穿公关稿里“说与不说”的艺术?有网友分享了一个解读公关稿的精妙 Prompt - (AI资讯)。其核心是像外交官读电报一样,关注动机、时机和被省略的信息。这套方法论,堪称信息时代的“火眼金睛”,也是一条极具实用价值的AI资讯

    +

    “我见过的第一个用MoE的视频模型!” 一位AI爱好者 - (AI资讯)在试用阿里新开源的Wan 2.2后惊叹道。✨ 他发现,该模型对提示词的理解力惊人,能搞定一些高难度指令,生成的视频在美学和运动质量上都相当出色,更棒的是,ComfyUI也已火速支持!

  3. -

    一个绝妙的类比 - (AI资讯)LLM 描绘成一个患有失忆症、只有碎片记忆的人。这个比喻精准地解释了当前 AI Agent 的困境:有限的上下文、陈旧的知识库以及对外部记忆的依赖。这则充满洞见的AI资讯,点明了技术发展的核心挑战。 -
    (AI资讯):LLM失忆症比喻

    +

    你以为Claude只能写写代码、润色文案?格局小了!😏 有大神分享 - (AI资讯)了一个“超级提示词”,能让Claude一条龙搞定从产品策略到营销推广的全链路任务。它能一口气处理后端代码、UI/UX设计、营销文案等,仿佛瞬间拥有了一个全能创业团队。

  4. -

    想搭积木一样构建复杂的 AI Agent 系统吗?有开发者分享了一个“捷径”:利用 Claude Code 的子代理(sub-agents)- (AI资讯)。通过简单指令将功能单一的子代理串联起来,就能可靠地打造出强大的定制化智能系统。这个实用技巧,是本期AI资讯中能立刻上手的干货。 -

    +

    AI也要多线程工作了!一位开发者在Reddit上宣布 - (AI资讯),正在为Claude Code开发一个伴侣产品。该产品通过在Typescript中实现多线程,将允许子智能体(subagents)并行自主工作。此举旨在打造一个极具可扩展性的解决方案,让AI开发效率再上一个新台阶,这种创新动态正是AI资讯所关注的。

    +
  5. +
  6. +

    还在“跟着感觉走”用Claude Code?有心人 - (AI资讯)已经为你整理好了一份超全的Claude Code资源合集。📚 这份合集内容涵盖官方文档、实战经验和开源项目,助你系统地梳理工作流。帮你从“Vibe Coding”新手村毕业,迈向生产环境的全流程AI开发,这类实用性极强的内容,是AI资讯读者最爱看的内容。
    (AI资讯):Claude Code资源

AI产品自荐: GeminiCli2API ↗️

@@ -272,7 +275,7 @@