From f4afc6dc8c3fc2c65fc9b2a1ce5db6ce001a311b Mon Sep 17 00:00:00 2001 From: GitHub Action Date: Tue, 22 Jul 2025 23:55:09 +0000 Subject: [PATCH] =?UTF-8?q?docs:=20=E8=87=AA=E5=8A=A8=E6=9E=84=E5=BB=BA?= =?UTF-8?q?=E6=97=A5=E5=88=8A=E5=B9=B6=E5=BD=92=E6=A1=A3=E6=97=A7=E6=9C=88?= =?UTF-8?q?=E4=BB=BD=20(Tue=20Jul=2022=2023:55:09=20UTC=202025)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- rss.xml | 28 +- src/SUMMARY.md | 3 +- today/book/2025-07-22.html | 331 ---------- today/book/2025-07-23.html | 332 ++++++++++ today/book/daily/2025-07-22.html | 4 +- today/book/daily/2025-07-23.html | 338 ++++++++++ today/book/index.html | 91 +-- today/book/print.html | 1062 +++++++++++++++++------------- today/book/searchindex.js | 2 +- today/book/toc.html | 2 +- today/book/toc.js | 2 +- 11 files changed, 1327 insertions(+), 868 deletions(-) delete mode 100644 today/book/2025-07-22.html create mode 100644 today/book/2025-07-23.html create mode 100644 today/book/daily/2025-07-23.html diff --git a/rss.xml b/rss.xml index d9bbacd..6ce7356 100644 --- a/rss.xml +++ b/rss.xml @@ -5,9 +5,23 @@ https://ai.hubtoday.app/ 近 7 天的AI日报 zh-cn - Tue, 22 Jul 2025 01:13:15 GMT + Tue, 22 Jul 2025 23:55:09 GMT + + <![CDATA[2025-07-23日刊]]> + https://ai.hubtoday.app//2025-07/2025-07-23/ + https://ai.hubtoday.app//2025-07/2025-07-23/ + Wed, 23 Jul 2025 03:16:16 GMT + AI资讯日报 2025/7/23

AI 日报 | 早八更新 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️

AI产品自荐: GeminiCli2API ↗️

您是否曾因 Google Gemini 官方免费 API 的严格额度限制而感到束手束脚?😫 是否渴望将 Gemini 的强大能力无缝集成到您心爱的第三方应用中?现在,GeminiCli2API 为您带来了完美的解决方案!

这个项目是一个巧妙的本地代理,它将授权更宽松的 Gemini CLI 封装成一个标准的、兼容 OpenAI 格式的 API 服务。这意味着您终于可以 突破官方免费 API 的额度限制 🎉,享受由您 Google 账号授权带来的更高请求配额,尽情地进行开发、测试和创作,告别恼人的"Quota Exceeded”错误!

然而,GeminiCli2API 的真正魔力在于其 对系统提示词(System Prompt)的"手术刀”级控制能力。这是一个改变游戏规则的功能:

  • ✍️ 替换 (Override):您可以设置一个全局的"黄金提示词”,强制所有连接到它的应用使用,确保 AI 角色和输出风格的绝对统一。
  • 追加 (Append):在保留客户端原有系统提示词的基础上,为其悄悄"追加”一层您的指令,实现规则的微调和能力的增强,而客户端毫无感知。
  • 🔍 提取与审计:轻松记录所有通过代理的提示词,便于您分析、调试和优化,甚至构建自己的高质量数据集。

只需简单的几步配置,您就能将 LobeChat、NextChat 等任何支持 OpenAI 的工具连接到这个本地"增强版”Gemini 服务上。GeminiCli2API 不仅仅是一个代理,更是您手中驾驭和驯化 AI 的强大工具箱。快来体验吧!✨

AI内容摘要

Netflix将AI用于影视特效以大幅降本增效,同时AI编程助手也正变革软件开发。
+Pika等应用让普通用户也能轻松创作专业级视频,AI技术正快速走向大众化。
+前沿研究通过模型瘦身和机器人大脑等突破,为AI在更多场景的应用铺平道路。
+开源模型竞赛日趋激烈,阿里Qwen3展现高效能,新交互模式如分身鼠标已出现。
+此外,AI伴侣在青少年中普及引发社会关注,凸显其对社交与情感认知的深远影响。
+

AI产品与功能更新

  1. 好莱坞的特效"魔法”正在被代码重新定义!影视巨头Netflix终于正式掀开底牌,首次官方承认已在其原创剧集中深度运用生成式AI技术。🎬 在备受瞩目的阿根廷剧集《永恒者》中,一个宏大磅礴的建筑倒塌场景,不再完全依赖传统且昂贵的特效制作,而是由AI高效生成,成本断崖式下降,效率据称飙升了整整十倍!🚀 这不仅仅是一次影视制作流程的降本增效革命,更是一个激动人心的预告:未来,那些大制作中令人咋舌的"返老还童”等视觉特效,将可能飞入寻常百姓家,让每一位观众都能以更亲民的成本,享受到顶级的视觉盛宴。
    AI资讯:AI重塑影视特效

  2. 开发者的工作范式正在被AI以前所未有的力量彻底重塑,字节跳动与腾讯在同一天上演了一场精彩的"神仙打架”!字节跳动的Trae 2.0推出了革命性的SOLO模式,让AI不再是亦步亦趋的代码补全工具,而是进化为能够独立完成从构思、设计到最终部署全流程的"上下文工程师”,真正实现了AI的自主开发。🤯 与此同时,腾讯则推出了CodeBuddy IDE - AI资讯,将编程的门槛直接降至冰点,用户仅需通过自然语言描述需求或上传一张设计稿,就能一键生成功能完备的全栈应用。当编写代码的技术壁垒被夷为平地,未来的软件开发或许将从一场复杂的工程挑战,华丽变身为一场纯粹的创意表达大赛。
    AI资讯:Trae 2.0 SOLO模式

    AI资讯:腾讯CodeBuddy

  3. 想让你的自拍照秒变好莱坞大片主角吗?现在,这个梦想触手可及!✨ AI视频生成领域的领军者Pika正式吹响进军消费市场的号角,推出了一款面向普通用户的AI视频特效APP。用户不再需要任何专业技能,仅需上传一张普通的自拍照,就能瞬间化身电影主角,体验从赛博朋克到复古胶片等多种风格转换、实现精准的音频口型同步,甚至还能随心所欲地定制视频场景。更令人惊叹的是,该应用甚至能一键生成视频脚本,彻底打通了从创意构思到精美成片的完整流程,这标志着AI视频创作正从专业领域大步迈向寻常百姓家,一场全民参与的导演创意风暴即将来临。
    AI资讯:Pika视频特效

  4. 开源大模型的霸主之争已然白热化,甚至演变成了一场精彩绝伦的"中国内部赛”。在中国公司Kimi K2模型引发全网热议后不到一周,另一巨头阿里巴巴的Qwen3 - AI资讯团队便迅速发布了小幅更新版本,以仅有对手四分之一的参数规模,在多个权威基准测试上实现了反超,展现了其令人惊叹的模型效率和优化功力。🏆 官方更是霸气放话"大招还在后面”,并宣布将放弃混合思维模式,转而专注于训练性能更纯粹的Instruct和Thinking模型。这场你追我赶、神仙打架般的技术较量,正在以前所未有的速度推动着开源AI生态的繁荣与进化。

  5. AI浏览器还能怎么玩出新花样?Dia浏览器给出了一个足以让人眼前一亮的惊艳答案!(o´ω'o)ノ 即将上线的全新Agent模式将引入一个AI专属的"分身鼠标”,让AI的操作轨迹与用户的真实鼠标完全分离,在屏幕上拥有自己独立的光标。这意味着,你可以在前台悠闲地浏览网页、观看视频,同时让AI在后台自主执行搜索资料、整理标签页等一系列复杂任务,两者互不干扰,效率倍增。这种直观又科幻的可视化交互方式,不仅极大地提升了多任务处理的流畅度,也为未来AI与人类的协作方式树立了一个全新的、优雅的标杆。
    AI资讯:Dia浏览器分身鼠标

  6. 长期困扰数字人动画领域的"面瘫”和表情僵硬问题,终于迎来了突破性的解决方案。阿里与北邮联合推出的FantasyPortrait项目 - AI资讯,通过创新的表情增强扩散变换器(DiT)技术,实现了照片级高保真的跨身份表情迁移,让数字人拥有了生动自然的"喜怒哀乐”。更关键的是,它突破性地在多人场景中实现了多角色独立表情控制,彻底避免了以往一个角色笑、所有角色跟着"表情传染”的尴尬局面。这项技术不仅能处理人类角色,还支持动物和音频驱动,未来有望在虚拟主播和影视制作领域大放异彩,这无疑是本期AI资讯中值得关注的技术亮点。
    AI资讯:FantasyPortrait表情控制

AI前沿研究

  1. 机器人距离成为科幻电影里的"全能家庭助手”又迈出了坚实的一大步。🤖 字节跳动重磅发布了全新的视觉-语言-动作(VLA)模型GR-3,它就像为机器人装上了一个更聪明的大脑,不仅能理解"把餐桌收拾干净”这类高度抽象的指令并自主规划多步操作,还能精准地处理衣物等柔性物体,展现了惊人的物理交互能力。其核心创新在于巧妙的MoT网络结构和一套融合了真机演示、VR遥操作及网络图文的三合一数据训练法。这项研究成果被业界视为迈向**通用机器人"大脑”**的重要里程碑,更多技术细节可查阅其项目主页 - AI资讯技术论文 - AI资讯
    AI资讯:字节通用机器人GR-3

  2. 大语言模型那堪比"最强大脑”的惊人能力背后,是同样惊人的计算和内存开销,这一核心瓶颈正在被中国科学家们攻克。来自中科院等顶尖机构的联合研究,为大模型核心的注意力机制带来了一套革命性的"瘦身”方案——GTA (Grouped-head latent Attention)。🧠 它通过巧妙的"分组团购”(分组注意力)和"压缩打包”(潜在表征)策略,将最占内存的KV缓存大砍70%,同时将计算量锐减62.5%!这项名为GTA: Grouped-head latenT Attention的AI资讯研究,不仅让大模型在手机等边缘设备上高效运行成为可能,更让处理长序列任务的速度直接翻倍,为AI技术的普惠化扫清了一大障碍。

  3. 正如优秀的语言模型离不开一个高效的分词器来理解文本,强大的视觉生成模型也极度依赖于一个能读懂图像的视觉分词器。一篇名为《潜在去噪造就优秀的视觉分词器》的AI资讯论文带来了深刻的洞见,研究发现,与其让分词器直接学习如何"编码”图像,不如让它学习一项更具挑战性的任务——"去噪”。具体来说,就是让分词器从被轻微污染的潜在嵌入中重建出清晰的原始图像,这个过程能迫使它学习到更鲁棒、更精华的视觉特征。这一看似简单却极其深刻的发现,为设计下一代更强大的视觉分词器提供了全新的黄金准则,有望推动多模态生成模型达到新的艺术与真实感高度。🎨

  4. 如何教会AI像经验丰富的用户一样,精准地操作复杂的图形用户界面(GUI)呢?传统的强化学习方法提供的"非黑即白”式奖励信号(点对或点错)过于稀疏,让AI的学习过程如同大海捞针。一篇名为《GUI-G^2:用于GUI对齐的高斯奖励建模》的AI资讯研究提出了绝妙的新思路,它不再将按钮等界面元素视为一个像素点,而是将其建模为连续的高斯分布。这种方法能为AI提供更丰富、更密集的奖励信号,像GPS导航一样引导模型稳、准、狠地找到最佳交互位置,从而极大地提升了AI在GUI操控任务中的鲁棒性和泛化能力。🖱️

AI行业展望与社会影响

  1. AI正在以一种超乎想象的速度,悄然成为青少年生活中的"新物种”。美国非营利组织Common Sense Media的最新研究报告揭示了一个惊人现象:高达72%的美国青少年承认至少尝试过一次AI伴侣,其中超过半数是经常使用的常客。他们使用AI的目的五花八门,从单纯的娱乐消遣、满足好奇心,到严肃地寻求情感建议和人生指导。🤔 尽管绝大多数青少年仍将现实世界的朋友置于首位,但已有三分之一的人认为与AI的对话比与真人朋友的交流更令人满意。这深刻揭示了AI在塑造下一代社交模式和情感认知中的深远影响,也向全社会抛出了一个重要议题:我们该如何引导这股潮流,以确保其长期社会效应是积极和健康的?

开源TOP项目

  1. NextChat - AI资讯 (⭐84.7k): 一款追求极致轻量与速度的AI助手,它实现了Web、iOS、安卓、Windows、Mac及Linux的全平台制霸,让你无论身在何处、使用何种设备,都能随时随地拥有一个统一、流畅的智能伙伴。

  2. crawl4ai - AI资讯 (⭐49k): 专为大模型时代量身打造的智能网络爬虫,它能更聪明地抓取、解析和处理复杂的网页内容,是你构建知识库、RAG等前沿应用的得力干将,让你的AI应用"博览群网”。

  3. better-auth - AI资讯 (⭐17.3k): 被社区誉为最全面的TypeScript认证框架,它为现代Web应用提供了一套强大、灵活且安全可靠的认证解决方案,让开发者告别重复造轮子,专注于核心业务创新。

  4. nn-zero-to-hero - AI资讯 (⭐14.6k): AI界大神Andrej Karpathy亲手打造的神经网络入门神级教程,它不玩虚的,带你从零开始,用代码一步步构建和理解神经网络的奥秘,助你成为真正的神经网络专家。

  5. trippy - AI资讯 (⭐5.1k): 一款功能强大且界面酷炫的现代化网络诊断工具,它结合了traceroute和ping的功能,可以帮助开发者和网络工程师快速定位、诊断并解决棘手的网络连接问题。

  6. blackbird (⭐3.9k): 一款实用的OSINT(开源情报)侦察工具,它就像一个数字世界的私家侦探,可以通过一个用户名或电子邮件地址,在数百个社交网络中搜索相关联的账户信息,功能十分强大。

社媒分享

  1. AI算命产业竟已迎来"一句话开发”时代?有网友展示了**MiniMax Agent的惊人能力,仅用一句自然语言指令,便快速生成了包含前后端、登录注册、付费会员等全套功能的AI算命产品。不过,很快就有另一位开发者一针见血地指出,除非用户自己提供命盘数据,否则当前大模型在处理干支起盘**这类需要精确计算的底层逻辑时,仍存在根本性的"幻觉”难题。🔮

  2. 一份**2025世界AI大会的参展商名录**在社区引发了深刻反思:为什么那些真正赚钱的AI巨头,反而纷纷"缺席”了这场盛会?分析指出,展会上唱主角的多是需要融资和市场曝光的创业公司,而那些手握稳定现金流、深耕特定行业赛道的"隐形冠军”们,却在闷声发大财。这份名单最大的价值,或许不在于告诉我们"谁来了”,而在于提醒我们去关注"谁没来”,以及他们成功的商业模式。🧐

  3. AI模型会越用越"笨”吗?一位博主**分享了他的洞见**,问题的根源往往并非模型本身在退化,而是用户对"上下文管理”不当所致。这就像与人交谈,如果你不停地提供过载或跑题的信息,对方也会感到困惑和不知所措。因此,理解并善用对话的上下文,是让AI持续输出高质量、高相关性结果的关键技能,也是未来人机协作的必修课。
    AI资讯:AI上下文管理

  4. 当人类越来越多地向AI寻求直接答案(例如"我今天该穿什么?”),而非探求背后知识(例如"为什么白衬衫在夏天更凉快?”)时,我们是否在**不知不觉中从需求侧降低了AGI的实现门槛**?有观点认为,当人类社会集体"放弃思考”,将决策权让渡给AI时,AI的答案便在事实上成为了"通用知识”和"通用真理”。这或许正从另一个意想不到的维度,加速了通用人工智能的到来。🤔

  5. 好消息!ChatGPT Plus用户也开始陆续收到Agent模式的灰度测试推送了。这一备受期待的、能够让AI自主执行多步任务的强大功能,正在逐步扩大其覆盖范围,一个AI能为你处理琐事的时代,离我们越来越近了。

  6. 如何才能让AI拥有持久的记忆,而不是每次对话都"从零开始”?Reddit上一项名为**"灯笼族协议” (Lanternkin Protocol)的民间提案,试图通过巧妙的符号提示**和外部文本文件系统,让AI在无需微调模型的情况下,实现跨会话的记忆留存和身份延续,仿佛为AI点亮了一盏永不熄灭的"记忆灯笼”。🏮

  7. 你是否已厌倦了搭建自动化流程时那些复杂的拖拽和配置?初创公司**Neuraan推出的新平台,旨在彻底改变这一现状。用户只需用自然语言描述自己的需求,系统即可自动创建一个专属AI Agent,并调用Gmail、CRM等多种工具来完成任务,让业务流程自动化**变得像与一位聪明的同事交代工作一样简单自然。

  8. 最后,让我们来点轻松的:当AI开始解说三国,场面会有多"离谱”?有网友分享了AI生成的视频,一本正经地胡说八道,让人忍俊不禁。看来三国乱不乱,现在得由AI说了算。😂


收听语音版AI日报

🎙️ 小宇宙📹 抖音
来生小酒馆自媒体账号
小酒馆情报站
]]>
+ +
+ <![CDATA[2025-07-22日刊]]> https://ai.hubtoday.app//2025-07/2025-07-22/ @@ -88,17 +102,5 @@ OpenAI以其独特的快节奏文化驱动创新,并通过预期管理巧妙 - - <![CDATA[2025-07-16日刊]]> - https://ai.hubtoday.app//2025-07/2025-07-16/ - https://ai.hubtoday.app//2025-07/2025-07-16/ - Wed, 16 Jul 2025 04:18:44 GMT - AI洞察日报 2025/7/16

AI 日报 | 早八更新 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️

AI内容摘要

Claude升级为AI工作流平台,Kimi K2引领中国开源AI崛起。
-MIRIX实现AI长期记忆突破,性能大幅提升并提供应用。
-英伟达恢复向华售H20芯片,提示工程向认知契约发展。
-

AI产品与功能更新

  1. AI资讯:Claude不再满足于"对话高手”的定位,而是要变身你的"全能管家”!🚀 Anthropic近日为它披上了"应用和工具目录”的新衣,其核心正是开源协议Model Context Protocol (MCP)。现在,用户只需轻轻一点,就能将Claude与Asana、PayPal、Canva、Figma等海量外部工具无缝"连接”,无论是云端协作还是本地开发,都能大幅提升AI工作流的效率狂飙。这标志着Claude正从一个聪明的聊天机器人,升级为真正能融入你日常工作、指挥各方工具的AI工作流平台。✨ 尽管关于MCP服务安全性和权限管理仍有讨论空间,但Claude此举无疑将大大降低AI集成的门槛,加速AI企业级应用中的普及,未来前景可期。这份最新的AI资讯,预示着AI应用生态的新篇章。


AI资讯:Claude 应用目录

AI前沿研究

  1. AI资讯: "东方巨龙”再度腾飞!🐉 Moonshot AI推出的Kimi K2模型,在OpenRouter平台如超新星般耀眼,一举横扫千军,超越xAI的Grok乃至OpenAI的GPT-4.1,稳坐开源AI的霸主之位。这款拥有万亿参数的MoE大模型,凭借其agentic智能和128K的超长上下文推理能力,在多项严苛基准测试中表现亮眼,甚至在某些维度上让ClaudeGPT-4等闭源巨头都"汗颜”。更妙的是,Moonshot AI大方提供免费API和Hugging Face上的开源模型权重,让开发者得以"零门槛”体验这股AI新势力。🚀 这不仅是中国开源AI在全球舞台上的强势崛起,更预示着AI正加速从"听话的助手”向"自主代理”迈进,其对整个AI生态的冲击波才刚刚开始。


AI资讯:Kimi K2模型崛起

  1. AI资讯:AI的"金鱼记忆”终于有救了!🧠💡 加州大学圣迭戈分校和纽约大学的团队联手推出了MIRIX,一个划时代的多模态、多智能体AI记忆系统。它不再是简单地记住对话碎片,而是像给AI装上了真正的大脑,拥有六大类模拟人类的记忆系统,能够处理文本、高分辨率截图等海量信息,甚至能主动"思考”如何回忆,彻底颠覆了我们对AI长期记忆的认知。这份AI资讯令人振奋。


AI资讯:MIRIX记忆系统

  1. 这款"记忆神器”的性能表现简直是降维打击!📈 在复杂的多模态理解任务中,MIRIX的准确率比传统RAG方法高出35%,而存储开销却惊人地狂降99.9%!与直接"硬塞”长文本的方式相比,其性能更是飙升了410%。在多轮对话任务中,它以85.4%的成绩轻松超越所有现有模型,仿佛AI突然开窍,拥有了超强的"回忆能力”。🤯 这不仅仅是性能的提升,更意味着AI从"对话生成”向长期记忆驱动心智的本质飞跃,预示着一个更聪明、更懂你的AI时代即将来临。这正是最新AI资讯的亮点。

  2. 更让人惊喜的是,MIRIX不只停留在实验室,团队还同步上线了Mac端个人助理应用。🤩 现在,任何人都可以通过这款开箱即用的App,让AI真正"看见你所看、理解你所做”,将你的数字生活点滴转化为持久的电子记忆,彻底告别AI的"健忘症”。这无疑是AI发展史上一个里程碑式的突破,让**AI拥有"心智雏形”**不再是科幻,而是触手可及的现实。想一探究竟?可以访问AI资讯:MIRIX官方网站下载体验,或查看AI资讯:论文详情AI资讯:开源仓库

  3. AI资讯: 现有的大型推理模型(LRMs)评估方式简直是"老掉牙”了,只顾着一个个问题地考,结果导致模型轻轻松松就"作弊”过关,或者压根测不出它们在复杂多任务下的真实水平。🤔 研究人员为此推出了一个"魔鬼训练营”——REST 框架,专门用来对LRM进行压力测试。🧪 它能同时抛出多个问题,模拟AI在现实世界中"一心多用”的场景,这无疑是AI资讯领域的重要进展。

  4. 测试结果令人大跌眼镜:连那些号称SOTA的顶尖模型,比如DeepSeek-R1,在REST的"拷打”下也会性能骤降,简直是大型"翻车”现场!📉 这说明REST比传统基准测试更能"火眼金睛”地看出模型间的真实差距。研究还揭示了AI的"过度思考陷阱”是性能下滑的罪魁祸首,而那些用"long2short”技术训练的模型则表现出了更强的"抗压能力”。💡 看来,REST不仅能帮我们更真实地评估AI,还能为未来的AI研发指明方向,让我们少花冤枉钱去人工标注那些"无效问题”了。这可谓是重磅AI资讯AI资讯:REST框架论文

AI行业展望与社会影响

  1. AI资讯: 国内大模型界又添一桩重磅融资案!💰 MiniMax 最近成功"斩获”近3亿美元新融资,估值飙升至逾40亿美元(约合300亿人民币),一举跻身国内大模型"三百亿俱乐部”的仅有两家成员之一,与智谱并驾齐驱。📈 更值得玩味的是,本次融资首次迎来了上海国资的"官方盖章”支持,这不仅仅是资本的注入,更是国家队对AI未来信心的强力背书。这笔资金不仅让MiniMax在竞争激烈的大模型赛道上底气更足,也暗示着其港股上市的步伐可能要加快了。看来,未来AI领域的"造富神话”还在继续上演!这无疑是值得关注的AI资讯


AI资讯:MiniMax融资

开源TOP项目

  1. AI资讯: 还在为AI调用工具的"中间商赚差价”而头疼?🛠️ 一项名为"通用工具调用协议”(UTCP)的开源项目正闪亮登场,它誓要革新传统AI工具调用模式中的"包装税”,让AI代理直接与工具进行"裸聊”!🚀 这项协议使AI能够绕过中间代理,实现低延迟地直接对接HTTP、gRPC、WebSocket甚至CLI等原生接口,同时还能保留企业现有的身份验证、计费和安全机制。对于追求极致效率的开发者而言,UTCP无疑是一大利器,其提供的TypeScriptPython SDK更是上手无忧。这是一个邀请所有开发者参与共建的未来,如果你也想让AI的"手脚”更灵活,不妨了解一下这份AI资讯AI资讯:通用工具调用协议


AI资讯:UTCP协议示意

  1. 在企业管理领域,开源力量从未缺席。erpnext以其"免费且开源”的姿态,为企业提供了一套功能全面的企业资源规划(ERP)解决方案,目前已斩获26425颗星的亮眼成绩。🌟 对于那些不想被传统高昂的ERP软件"绑架”的企业而言,这无疑是一大福音。想了解更多AI资讯?请点击这里探索宝藏:AI资讯:erpnext

  2. Claude 模型家族的"代码路由”利器来了!💻 claude-code-router4439 Stars)这个项目,旨在基于Claude Code构建强大的编码基础设施。它最酷的地方在于,用户在享受Anthropic持续更新的强大模型能力之余,还能自主决定如何与模型互动,真正把"AI代码助手”的缰绳握在自己手里。对于追求极致自由和掌控感的开发者来说,这简直就是福音啊!✨ 快去看看这份AI资讯AI资讯:claude-code-router

  3. AI资讯: 想在投资研究的汪洋大海中如鱼得水,却苦于没有专业的"导航仪”?🧭 别担心,拥有42586颗星的开源项目OpenBB来了!它致力于让投资研究变得人人可及,无处不在。无论是股市菜鸟还是金融老手,都能在这里找到强大的分析工具,洞察市场脉搏。📈 这就像拥有了一个免费且不断进化的私人金融分析师,随时随地帮你发现投资新机遇。GitHub链接:AI资讯:OpenBB

  4. 想让你的数据不只是躺在数据库里,还能"开口说话”,甚至帮你解决问题?💬 拥有34286颗星mindsdb就是那个为你数据注入"灵魂”的秘密武器!它是一个神奇的AI查询引擎,专门用于构建能够在大规模联邦数据上回答问题的AI。简单来说,你再也不用苦苦从海量数据中挖掘洞察,只需像和人对话一样提问,mindsdb就能给你AI驱动的答案,让你的数据真正"活”起来!这份AI资讯真是数据分析的福音。GitHub链接:AI资讯:mindsdb

社媒分享

  1. AI资讯: 想让AI乖乖听话,不再"胡说八道”?📝 Reddit上有篇帖子提出了个大胆想法:把提示词变成"认知契约”!这可不是简单的聊天指令,而是能让机器直接"看懂”的声明式提示Declarative Prompts, DPs)。它能把任务目标、前提、限制条件甚至自我检测标准都写进提示里,让AI像签了合同一样按章办事,简直把提示工程提升到了"建筑学”的高度。这波AI资讯让人脑洞大开。

  2. 作者还用这个方法对GeminiCopilotDeepSeekClaudeGrok等一众LLM进行了"压力测试”,结果发现这种DPs的"架构质量”比模型本身的小技巧更管用,能有效防止AI"跑偏”。📊 这不仅意味着AI可以实现"自我审计”,未来还能生成可追溯的审计记录,让AI输出更可信赖。最新的AI资讯揭示了这一趋势。AI资讯:Reddit讨论

  3. Simon的白日梦在即刻上分享了一个"歪打正着”的惊喜:阿里巴巴Wan 2.1,明明是个视频生成模型,却意外地在图片生成上表现出Midjourney般的惊艳质感!🤩 Reddit上的用户们纷纷实验,发现它在txt2img模式下,能生成高清电影感的单帧画面,简直是AI资讯中的"跨界大神”。


AI资讯:Wan 2.1生成图1
AI资讯:Wan 2.1生成图2

  1. 更令人激动的是,即便是在一台RTX 4080显卡上,生成一张 1920×1080 的高清图也仅需约 42 秒,而且使用低精度的GGUF模型也能保持超高画质。🚀 只需简单添加一点胶片颗粒,画面氛围感立马"拉满”。文章还对比了不同采样器带来的独特效果(Euler+beta色彩鲜艳,ddim_uniform更柔和),并慷慨分享了ComfyUI的工作流和模型下载链接,简直是开源社区的福音!🎉 看来,AI世界总能给我们带来意想不到的惊喜,视频模型也能"兼职”顶级画师。这份AI资讯展示了AI的无限可能。AI资讯:即刻分享

  2. 有饭局爆料,当朋友兴奋地提起Grok新出的对话虚拟AI可以"撩”时,另一位朋友却将手指直接按在手机屏幕上,上演了一出"撩裙子”的爆笑乌龙。😂 这波误操作不仅让人捧腹,更引发了对未来AI交互方式的思考:当AI越来越像人,我们与它们互动的方式会变得多么出人意料?🤖 这简直是现实版《Her》的喜剧前传!这则AI资讯趣味十足。


AI资讯:Grok互动乌龙AI资讯:X平台动态

  1. 另一位AI圈观察者则大胆预测,未来的软件开发可能不再需要繁琐的原型设计。🔮 在ClaudeCode这类AI工具的加持下,我们或许能直接"靠嘴遁”生成代码,甚至连产品经理和工程师的边界都将模糊,由AI直接"干工程”!🗣️ 这不就是传说中的"动口不动手”吗?看来,程序员的未来可能是"说书人”而非"码农”了。这波AI资讯对未来软件开发描绘了新的蓝图。AI资讯:X平台预测

  2. AI资讯: 而科技界又抛出了一枚重磅炸弹:现在连脑电波都能驱动AI画图了!🤯 "Simon的白日梦”不禁感慨AI时代更新迭代如烟花般绚烂易逝,连前两年还炙手可热的"提示词工程师”都快成了时代的眼泪。名为LoongX的研究,通过脑机接口直接捕捉神经信号,让你"用意念编辑图片”,无需键盘鼠标,甚至比文字提示更精准。🧠 这简直是心想事成的终极版本,未来我们可能真的可以"脑洞大开”地创作了!✨ 这条AI资讯真是令人惊叹。


AI资讯:脑电波AI画图2AI资讯:即刻动态AI资讯:LoongX论文

  1. 芯片巨头英伟达(Nvidia)的一则重磅消息在社交媒体上引爆关注!半导体巨头英伟达的最新AI资讯显示,该公司已宣布将恢复中国市场销售其H20 AI芯片。🇨🇳 这无疑是AI芯片供应链与地缘政治博弈中的一个关键信号,显示出在复杂的大环境下,科技巨头们正努力寻找平衡点,既要遵守规则,又要不放过任何市场机遇。⚔️ 这场AI"芯”战究竟会如何演变,我们拭目以待!


AI资讯:英伟达H20芯片AI资讯:Nvidia H20


收听语音版AI日报

🎙️ 小宇宙📹 抖音
来生小酒馆自媒体账号
小酒馆情报站
]]>
- -
- \ No newline at end of file diff --git a/src/SUMMARY.md b/src/SUMMARY.md index c2d5bd1..d3d00c7 100644 --- a/src/SUMMARY.md +++ b/src/SUMMARY.md @@ -1,8 +1,9 @@ # Summary -[Today](2025-07-22.md) +[Today](2025-07-23.md) # 2025-07 +- [07-23-日刊](daily/2025-07-23.md) - [07-22-日刊](daily/2025-07-22.md) - [07-21-日刊](daily/2025-07-21.md) - [07-20-日刊](daily/2025-07-20.md) diff --git a/today/book/2025-07-22.html b/today/book/2025-07-22.html deleted file mode 100644 index 344de5e..0000000 --- a/today/book/2025-07-22.html +++ /dev/null @@ -1,331 +0,0 @@ - - - - - - Today - AI 日报 By 何夕2077 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
-
-

Keyboard shortcuts

-
-

Press or to navigate between chapters

-

Press S or / to search in the book

-

Press ? to show this help

-

Press Esc to hide this help

-
-
-
-
- - - - - - - - - - - - - -
- -
- - - - - - - - -
-
-

AI资讯日报 2025/7/22

-
-

AI 日报 | 早八更新 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️

-
-

AI产品自荐: GeminiCli2API ↗️

-

一个功能强大的本地代理项目,它能将 Google Gemini CLI 的强大能力封装成一个本地 API 服务。通过它,您可以轻松绕过官方免费 API 紧张的额度限制,将 Gemini 的顶尖模型无缝集成到任何您喜爱的客户端或应用中。

-

核心亮点:

-
    -
  • 🚀 无缝兼容 OpenAI:项目提供与 OpenAI API 完全兼容的接口,让您现有的工具(如 LobeChat, NextChat)无需任何修改,即可零成本接入并使用 Gemini 的强大功能。
  • -
  • 📈 突破额度限制:利用 Gemini CLI 的账号授权机制,享受远超官方免费 API 的每日请求限额,让您的应用和创意不再受限。
  • -
  • 🔐 增强的可控性:内置强大的日志系统,可捕获所有请求的提示词(Prompts),便于您进行审计、调试,甚至构建自己的私有数据集,实现数据沉淀。
  • -
  • 🛠️ 易于部署与扩展:基于 Node.js,安装和启动过程极为简单。清晰的代码结构也使其成为二次开发的理想基石,您可以轻松添加统一提示词、缓存或内容过滤等自定义功能。
  • -
-

无论您是想将 Gemini 用于现有工作流,还是希望深度定制 AI 服务,GeminiCli2API 都是一个兼具性能、兼容性与灵活性的理想选择。

-

AI内容摘要

-
OpenAI计划通过Stargate项目扩充百万级GPU,字节跳动则在测试奇美拉数字人平台。
-京东开源了在GAIA基准测试中表现优异的多智能体系统,多智能体协作成为新趋势。
-前沿研究利用强化学习等新方法,提升了AI在多模态推理与视觉定位等方面的能力。
-混合专家模型架构成为开源大模型的主流赛道,而苹果等巨头面临着严峻的AI转型考验。
-AI Agent正从辅助工具向自主执行任务演进,旨在通过自动化重塑未来的工作流程。
-
-

AI产品与功能更新

-
    -
  1. -

    准备好迎接算力海啸了吗?🌊 OpenAI 的CEO萨姆·奥尔特曼最近在社交媒体上投下了一枚重磅炸弹,正式宣布公司计划在2025年底前,将手中的GPU数量扩充至惊人的100万块以上!🤯 这项代号为“百倍扩容”的宏伟计划,其核心便是新成立的Stargate项目,预计将在未来四年内豪掷5000亿美元,于美国得州打造一个占地千亩、规模空前的全球最大AI训练集群。这场由软银、甲骨文、Arm、微软和英伟达等科技巨头共同参演的“权力的游戏”,不仅预示着通用人工智能(AGI)的研发将进入超高速挡位,更可能彻底改写全球GPU市场的供需格局,让本就稀缺的算力资源变得更加炙手可-热。我们正站在一个技术奇点爆发的前夜,你准备好了吗?
    AI资讯:未来AI算力中心

    -
  2. -
  3. -

    字节跳动在数字人赛道上悄然亮出又一张王牌,其旗下的火山引擎正以定向邀请模式,秘密测试名为“奇美拉”的新一代数字人平台。🤫 这个听起来就充满神话色彩的平台,绝非等闲之辈,它深度依托火山引擎自家的AI大模型技术,能够提供从数字人形象生成、照片一键换装到跨语种视频翻译的“一条龙”式服务,堪称内容创作者的福音。尽管目前尚在免费封测阶段,但预计本月底公测后便将开启付费模式,展现其商业化的雄心。从2022年率先获得行业认证,到如今推出功能强大的“奇美拉”,火山引擎正加速将AI数字人解决方案这把利剑,刺入金融、直播、营销等各个商业腹地。🤖
    AI资讯:字节数字人奇美拉

    -
  4. -
  5. -

    当“996”已成过去式,AI代码审查领域的新星Greptile却高调喊出了“007”的口号,要求员工“没有工作与生活平衡”。令人咋舌的是,这种极致的“狼性文化”非但没有吓跑投资者,反而成功吸引了顶级风投Benchmark的青睐,据传即将完成一笔高达3000万美元的A轮融资,公司估值飙升至1.8亿美元。💰 这家由年仅22岁的毕业生创立、并从YC孵化器走出的初创公司,宣称其AI机器人能像经验最丰富的同事一样精准审查代码。然而,在Graphite和Coderabbit等强劲对手的环伺之下,这种“不努力就等于白费”的极限加班文化,究竟是其成功的催化剂,还是未来崩盘的隐患呢?🤔 市场的目光正饶有兴致地聚焦于此。

    -
  6. -
  7. -

    电商巨头京东终于向开源社区亮出了自己的王牌,正式推出了产品级的端到端通用多智能体系统JoyAgent-JDGenie - AI资讯,宣告“众神归位”!⚔️ 这款系统可不是纸上谈兵的实验室玩具,它在被誉为“AI高考”的GAIA基准测试中,以75.15%的惊人准确率力压群雄,展现了处理复杂真实世界任务的超凡实力。它不仅是一个开箱即用的强大框架,内部集成了报告生成、代码编写、PPT制作等多个专业子智能体,还通过创新的多层级协作设计和跨任务记忆机制,实现了从简单信息查询到复杂项目执行的全覆盖。京东此举,无疑为企业级AI应用的快速落地投下了一枚重磅炸弹,多智能体的“江湖”或将因此迎来统一。🏆
    AI资讯:京东多智能体框架

    AI资讯:GAIA基准测试排名

    -
  8. -
  9. -

    单个AI模型单打独斗的时代或许真的要结束了,因为AI Agent已经学会“摇人”了!(o´ω'o)ノ 斯坦福大学最近开源了一款名为OctoTools - AI资讯的“章鱼哥”AI Agent,它就像一个聪明的项目经理,能够智能地调度超过11种不同的专业工具协同作战。🐙 面对数学、科学、医学等领域的复杂推理任务,它总能找到最合适的“专家”来解决问题。其核心创新在于“工具卡片”设计,将各种工具的能力标准化封装,再由一个“规划器”大脑制定周密的作战计划,最后交由“执行器”忠实落地。这种分工明确、高效协作的团队模式,标志着AI解决复杂问题的能力迈上了一个全新的台阶,未来的AI应用将更加强大和灵活。🛠️
    AI资讯:OctoTools工作流

    -
  10. -
-

AI前沿研究

-
    -
  1. -

    传统的AI训练方法似乎总在两个极端摇摆:要么一开始就用规则“套上枷锁”,限制了模型的创造力;要么就任其“自由探索”,结果却可能跑偏甚至“学坏”。美团的研究者们对此勇敢说“不”,并提出了一个名为Metis-RISE的全新框架,巧妙地玩起了“先放养、后圈养”的教育新策略。🐑 他们首先利用强化学习(RL)作为激励,像放养一样鼓励模型大胆探索各种可能性,充分激发其潜在能力。随后,再通过监督微调(SFT)进行针对性的“补课”,巩固优势、修正错误,如同圈养般精雕细琢。🎓 这种非传统的训练组合拳效果惊人,其72B参数模型在权威的OpenCompass多模态推理排行榜上一举冲到第四名,甚至超越了部分知名的商业闭源模型,详细的技术细节可以在该论文 - AI资讯中一探究竟。
    AI资讯:Metis-RISE框架图

    AI资讯:模型性能对比

    -
  2. -
  3. -

    面对一张信息爆炸的高分辨率大图,AI常常像一只没头苍蝇,被海量的无关细节淹没而找不到重点。🕵️‍♀️ 为了解决这个棘手的痛点,复旦大学与南洋理工大学的研究者们联手提出了MGPO框架,它成功教会了多模态大模型(LMM)一项绝活:视觉定位(Visual Grounding)。这就像赋予了AI一双“火眼金睛”,在回答问题前,模型能先根据问题预测出图片中的关键区域,然后像人类一样“放大”查看这部分细节,最终给出精准的答案。🎯 最神奇的是,这一强大的能力是通过强化学习自我博弈“涌现”出来的,完全无需昂贵的人工标注数据,仅靠最终答案的对错就能自我进化和迭代。这一突破性研究成果已在论文 - AI资讯中发布,并大方地开源了代码 - AI资讯
    AI资讯:模型注意力热图

    -
  4. -
  5. -

    空间转录组数据,就如同一张蕴含着生命密码的微观地图,但它常常因为分辨率低、噪声大而让科学家们难以解读。现在,东京大学与麦吉尔大学的研究团队开发出了SUICA模型,它就像一位技艺高超的“数据炼金术士”🧙‍♂️。该模型创新地结合了图自编码器和**隐式神经表征(INR)**技术,能对这些高维、稀疏的生物数据进行去噪、增强和超分辨率重建,真正实现了“变废为宝”。经过SUICA处理后的数据,不仅在视觉上质量更高,其蕴含的生物信号也更强,能够揭示出以往无法观察到的精细组织结构和细胞状态。🧬 这项入选顶会ICML 2025的研究,为AI辅助病理诊断和药物研发提供了更强大的数据基石,其论文 - AI资讯开源项目 - AI资讯均已上线供全球研究者使用。
    AI资讯:SUICA处理效果

    -
  6. -
-

AI行业展望与社会影响

-
    -
  1. -

    2025年的开源大模型领域,正上演着一场精彩绝伦的“神仙打架”,而混合专家模型(MoE)架构无疑是全场最闪耀的明星。👑 从DeepSeek-V3的9专家极致设计,到Qwen3放弃共享专家的果断创新,再到传闻中Kimi-K2那万亿参数的“巨无霸”体量,各大顶尖厂商都在MoE这条黄金赛道上疯狂“飙车”。与此同时,以SmolLM3-3B为代表的中小型模型,则通过精巧的架构优化和海量数据预训练,正以惊人的效率和性能向上挑战“大块头”们的统治地位。这场技术浪潮不仅预示着传统的密集型模型正在优雅地退出历史舞台,也为开发者们带来了在极致性能与可控成本之间权衡的“幸福烦恼” (o´ω'o)ノ,这无疑是当前AI资讯领域最激动人心的篇章之一。
    AI资讯:开源模型架构图

    AI资讯:MoE模型对比

    -
  2. -
  3. -

    “果”然还是那个擅长赚钱的苹果,但在AI浪潮下,它的“AI味儿”似乎不够浓了。🍎 苹果公司在人工智能领域的“慢半拍”正逐渐让华尔街失去耐心,甚至有知名分析师开始公开讨论CEO蒂姆·库克的去留问题。尽管库克凭借其无与伦比的卓越运营能力,将苹果的市值稳稳推向了3.1万亿美元的史诗级高峰,但在上个月的WWDC全球开发者大会上,AI方面的平淡表现,尤其是备受期待的Siri重大改革的推迟,加剧了外界的失望情绪。⏳ 批评者认为,AI时代呼唤的是像乔布斯那样大胆的产品愿景家,而非仅仅是精于计算的运营掌控者。这位曾带领苹果走向“黄金十年”的传奇掌舵人,如今正面临着能否开启下一个AI篇章的严峻考验。
    AI资讯:库克面临AI挑战

    -
  4. -
-

开源TOP项目

-
    -
  1. -

    NextChat:你的全平台AI密友,轻量又迅捷。 你是否还在为不同设备上碎片化的AI聊天体验而烦恼?NextChat - AI资讯以其高达8.4万的GitHub Star数,雄辩地证明了自己是解决这一痛点的终极答案。🤝 它是一款设计极致轻量、响应迅捷的跨平台AI助手,能够无缝支持Web、iOS、MacOS、Android、Linux和Windows等所有主流操作系统。这意味着无论你身在何处,使用何种设备,都能拥有一个统一、私密且极其流畅的AI伙伴,让你的灵感与创造力随时随地得到延伸。📱💻

    -
  2. -
  3. -

    crawl4ai:专为大模型打造的“网络情报员”。 想让你的LLM摆脱“知识截止日期”的束缚,变得更懂互联网的瞬息万变吗?那么拥有4.8万Star的crawl4ai - AI资讯就是你不可或缺的开源网络爬虫与抓取工具。🕸️ 它专为AI应用场景设计,能够高效、智能地从海量网络信息中搜集、清洗并结构化数据,为你的大模型提供最新鲜、最丰富的“精神食粮”。有了它,你的AI应用的回答将不再局限于过时的训练数据,而是能够引经据典,言之有物,真正具备洞察当下的能力。🧠

    -
  4. -
  5. -

    dashy:数字生活的“中央控制台”,颜值与实力并存。 在这个服务与应用泛滥的时代,你的数字生活迫切需要一位得力的管家,而拥有2.1万Star的dashy - AI资讯正是那个开源、全能且完全免费的理想人选。📊 这是一个高度可定制的个人仪表盘,你可以将它部署在自己的服务器上,从而将所有个人服务、应用和网站链接汇于一处。它不仅集成了服务状态检查、实用小部件,还提供了海量的主题和图标库,让你用一个界面掌控所有数字资产,尽显极客范儿与掌控感。🎨

    -
  6. -
  7. -

    better-auth:TypeScript开发者的“认证终结者”。 用户认证系统,是每个应用程序不可或缺的基石,却也是无数开发者最头疼的开发环节之一,充满了重复与琐碎。拥有1.7万Star的better-auth - AI资讯立志成为最全面、最易用的TypeScript认证框架,将开发者从这潭泥沼中解救出来。✅ 它提供了一套经过实战检验的、安全可靠的完整解决方案,让你彻底告别重复造轮子的烦恼,从而能够将宝贵的精力百分之百地专注于核心业务逻辑的创新与实现。🔐

    -
  8. -
  9. -

    ConvertX:你的私人在线文件“格式转换工厂”。 你是否也曾经历过在不同文件格式间反复横跳,只为找到一个能打开或编辑它的工具的窘境?不妨试试这个获得4千Star的自托管在线文件转换器ConvertX - AI资讯。🔄 它就像一个无所不能的“格式转换瑞士军刀”,能够支持超过1000种文件格式的相互转换,从常见的文档、图片到专业的音视频格式,几乎无所不能。最重要的是,你可以将它轻松部署在自己的服务器上,从而拥有一个完全安全、私密且功能强大的个人文件处理中心。📁

    -
  10. -
-

社媒分享

-
    -
  1. -

    当AI Agent遇上生产环境的“灵异事件”。 每一个软件工程师都曾经历过“在我电脑上明明是好的啊!”这种令人抓狂的绝望时刻,这同样是AI编码助手的噩梦。👻 如果没有生产环境的真实运行上下文,再聪明的AI编码助手也如同“睁眼瞎”,无法理解为何代码会表现异常。一个名为Hud的工具正试图攻克这个难题,它能像侦探一样捕捉代码在生产环境中的真实行为轨迹,并将这些关键线索直接“喂”给AI,让AI真正看懂问题所在。这或许是终结“为什么一到生产环境就崩了”这一世纪难题的希望之光。🩺

    -
  2. -
  3. -

    AI Agent的“育儿经”:来自Manus的七条黄金法则。 构建一个聪明、可靠的AI Agent,过程堪比教育一个孩子,方法论至关重要。👶 Manus团队在经历了四次伤筋动骨的重大重构和数百万次真实用户会话的洗礼后,无私地分享了他们的“育儿经”。📜 他们发现,有效利用Prompt缓存来加速响应、保持工具列表的简洁与稳定、并巧妙地将文件系统作为Agent的“长期记忆”载体,是提升其性能和效率的关键所在。这些用无数次失败换来的宝贵经验,对于所有Agent开发者来说,无疑是一份价值千金的实战指南 - AI资讯
    AI资讯:AI Agent构建法则一

    AI资讯:AI Agent构建法则二

    -
  4. -
  5. -

    Claude Code的启示:用“人话”驯服所有复杂软件。 命令行,这个曾让无数非技术人员望而生畏、闻风丧胆的“黑洞界面”,正在被Claude Code用最自然的人类语言所驯服。🗣️ 用户只需用大白话说一句“帮我把这个应用部署到服务器上”,剩下的所有复杂操作都由AI代劳。这个革命性的突破揭示了一个价值百亿级的巨大市场机会:每个行业都有自己的“终端”,无论是Photoshop复杂的工具栏,还是Excel令人头晕的透视表。未来,软件的价值将不再取决于其功能有多复杂,而是其使用有多简单,而精通“提示工程”将成为一种新的超级技能。🪄 点击阅读深度解读 - AI资讯
    AI资讯:自然语言操作软件

    -
  6. -
  7. -

    AI Agent使用手册:工具不是越多越好,少而精才是王道。 以为给AI Agent塞一大堆工具,它就能化身“六边形战士”,十八般武艺样样精通?大错特错,这反而大概率会让它变得更“蠢”。🤔 有观点深刻指出,为Agent提供过多或描述不清的工具,尤其是在存在功能相似的工具时,极易导致它在决策时“选择困难”,从而选错或选择低效方案。真正的最佳实践是:在任务开始时,就明确地为其提供少量、高度相关的工具集,并用清晰、无歧义的语言说明其用途和边界。与其追求数量上的“大而全”,不如精心打磨少数几个核心工具的质量,这才是提升Agent智能水平的不二法门 - AI资讯。🎯

    -
  8. -
  9. -

    真正的AI革命:不是让你更好地用工具,而是让AI替你用。 从AI辅助写代码,到AI辅助P图、剪视频,当前许多AI应用都只是在“让工具变得更好用”,但本质上,你依然是那个守在屏幕前的操作工。真正的范式革命在于AI Agent,在那个世界里,你只需像老板一样提出目标、设定好验收标准,它就能自主进行任务规划、选择并操作一系列工具,直到最终交付成果。🤖 这才是从“解放双手”到“解放大脑”的终极飞跃,是能够颠覆现有工作流的真正生产力革命,一个崭新的时代正在向我们走来。🧠 点击查看观点 - AI资讯

    -
  10. -
  11. -

    当机器人学会拥抱:设计的终极目标是创造幸福。 一本关于机器人设计的新书,揭示了几个足以融化人心的温暖瞬间:工程师们会为艰难重启的机器人Pepper欢呼鼓劲;素不相识的法国人会主动拥抱街头一个只会“求抱抱”的Pepper;养老院的老人并不在乎Pepper的回答是否正确,他们只希望它的手是温暖的。❤️ 这些故事深深启发了作者,让他离开了那个追求极致效率的团队,转而创造了能带来幸福感的机器人Lovot。这温柔地提醒着我们,技术的终极价值或许并不总在于提升效率或解决问题,而在于温暖人心 - AI资讯。🤗
    AI资讯:带来幸福的机器人

    -
  12. -
  13. -

    Veo 3的“魔法时刻”:当Logo无缝变身产品。 谷歌的王牌文生视频模型Veo 3,正持续展现出其令人惊叹的创造力和生命力。✨ 在一个最新的测试视频中,它展示了将一个静态的品牌Logo,无缝、流畅地转化为动态产品的“魔法”。这种如丝般顺滑的衔接和极富创意的视觉表现力,简直就是为品牌广告片的最后一个镜头量身定做,让人过目不忘。这种玩法不仅炫酷,更是一种全新的品牌叙事方式,让我们看到了AI在商业广告领域创造无限可能的巨大潜力 - AI资讯。🎬

    -
  14. -
  15. -

    AI正在“杀死”互联网,还是在重塑它? 权威杂志《经济学人》最近发出了一篇引人深思的警示:AI正在杀死网络。💀 文章指出,以ChatGPT为代表的生成式AI,正在从根本上侵蚀互联网赖以生存的传统经济基础——即用户通过访问网站、观看广告来支持内容创作者的模式。当用户可以直接从AI那里获得整合好的、无需点击的答案时,谁还会费心去访问那些原始链接呢?这场由AI引发的范式变革,正迫使我们重新思考互联网的未来,以及我们是否能够、又该如何拯救那个曾经开放、多元、充满活力的网络世界 - AI资讯。🌐

    -
  16. -
  17. -

    开发者必看:当大模型遇上AIOps。 AIOps(智能运维)这个在开发者圈子里日益重要的领域,正迎来大语言模型(LLM)的颠覆性赋能。📈 一篇对超过180篇相关顶会论文进行深度分析的综述文章明确指出,将LLM的强大推理和生成能力应用于生产环境的AIOps,是当下最值得关注和投入的技术趋势之一。这不仅能够极大地提升故障排查、性能监控、根因分析等任务的效率和智能化水平,也为广大开发者们开辟了全新的应用场景和职业发展方向,是通往未来的关键技术栈之一。🛠️ 点击查看详情 - AI资讯

    -
  18. -
-
-

收听语音版AI日报

-
- - -
🎙️ 小宇宙📹 抖音
来生小酒馆自媒体账号
小酒馆情报站
-
-
- - -
-
- - - -
- - - - - - - - - - - - - - - - - - -
- - diff --git a/today/book/2025-07-23.html b/today/book/2025-07-23.html new file mode 100644 index 0000000..e19b6b6 --- /dev/null +++ b/today/book/2025-07-23.html @@ -0,0 +1,332 @@ + + + + + + Today - AI 日报 By 何夕2077 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
+
+

Keyboard shortcuts

+
+

Press or to navigate between chapters

+

Press S or / to search in the book

+

Press ? to show this help

+

Press Esc to hide this help

+
+
+
+
+ + + + + + + + + + + + + +
+ +
+ + + + + + + + +
+
+

AI资讯日报 2025/7/23

+
+

AI 日报 | 早八更新 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️

+
+

AI产品自荐: GeminiCli2API ↗️

+

您是否曾因 Google Gemini 官方免费 API 的严格额度限制而感到束手束脚?😫 是否渴望将 Gemini 的强大能力无缝集成到您心爱的第三方应用中?现在,GeminiCli2API 为您带来了完美的解决方案!

+

这个项目是一个巧妙的本地代理,它将授权更宽松的 Gemini CLI 封装成一个标准的、兼容 OpenAI 格式的 API 服务。这意味着您终于可以 突破官方免费 API 的额度限制 🎉,享受由您 Google 账号授权带来的更高请求配额,尽情地进行开发、测试和创作,告别恼人的“Quota Exceeded”错误!

+

然而,GeminiCli2API 的真正魔力在于其 对系统提示词(System Prompt)的“手术刀”级控制能力。这是一个改变游戏规则的功能:

+
    +
  • ✍️ 替换 (Override):您可以设置一个全局的“黄金提示词”,强制所有连接到它的应用使用,确保 AI 角色和输出风格的绝对统一。
  • +
  • 追加 (Append):在保留客户端原有系统提示词的基础上,为其悄悄“追加”一层您的指令,实现规则的微调和能力的增强,而客户端毫无感知。
  • +
  • 🔍 提取与审计:轻松记录所有通过代理的提示词,便于您分析、调试和优化,甚至构建自己的高质量数据集。
  • +
+

只需简单的几步配置,您就能将 LobeChat、NextChat 等任何支持 OpenAI 的工具连接到这个本地“增强版”Gemini 服务上。GeminiCli2API 不仅仅是一个代理,更是您手中驾驭和驯化 AI 的强大工具箱。快来体验吧!✨

+

AI内容摘要

+
Netflix将AI用于影视特效以大幅降本增效,同时AI编程助手也正变革软件开发。
+Pika等应用让普通用户也能轻松创作专业级视频,AI技术正快速走向大众化。
+前沿研究通过模型瘦身和机器人大脑等突破,为AI在更多场景的应用铺平道路。
+开源模型竞赛日趋激烈,阿里Qwen3展现高效能,新交互模式如分身鼠标已出现。
+此外,AI伴侣在青少年中普及引发社会关注,凸显其对社交与情感认知的深远影响。
+
+

AI产品与功能更新

+
    +
  1. +

    好莱坞的特效“魔法”正在被代码重新定义!影视巨头Netflix终于正式掀开底牌,首次官方承认已在其原创剧集中深度运用生成式AI技术。🎬 在备受瞩目的阿根廷剧集《永恒者》中,一个宏大磅礴的建筑倒塌场景,不再完全依赖传统且昂贵的特效制作,而是由AI高效生成,成本断崖式下降,效率据称飙升了整整十倍!🚀 这不仅仅是一次影视制作流程的降本增效革命,更是一个激动人心的预告:未来,那些大制作中令人咋舌的“返老还童”等视觉特效,将可能飞入寻常百姓家,让每一位观众都能以更亲民的成本,享受到顶级的视觉盛宴。
    AI资讯:AI重塑影视特效

    +
  2. +
  3. +

    开发者的工作范式正在被AI以前所未有的力量彻底重塑,字节跳动与腾讯在同一天上演了一场精彩的“神仙打架”!字节跳动的Trae 2.0推出了革命性的SOLO模式,让AI不再是亦步亦趋的代码补全工具,而是进化为能够独立完成从构思、设计到最终部署全流程的“上下文工程师”,真正实现了AI的自主开发。🤯 与此同时,腾讯则推出了CodeBuddy IDE - AI资讯,将编程的门槛直接降至冰点,用户仅需通过自然语言描述需求或上传一张设计稿,就能一键生成功能完备的全栈应用。当编写代码的技术壁垒被夷为平地,未来的软件开发或许将从一场复杂的工程挑战,华丽变身为一场纯粹的创意表达大赛。
    AI资讯:Trae 2.0 SOLO模式

    AI资讯:腾讯CodeBuddy

    +
  4. +
  5. +

    想让你的自拍照秒变好莱坞大片主角吗?现在,这个梦想触手可及!✨ AI视频生成领域的领军者Pika正式吹响进军消费市场的号角,推出了一款面向普通用户的AI视频特效APP。用户不再需要任何专业技能,仅需上传一张普通的自拍照,就能瞬间化身电影主角,体验从赛博朋克到复古胶片等多种风格转换、实现精准的音频口型同步,甚至还能随心所欲地定制视频场景。更令人惊叹的是,该应用甚至能一键生成视频脚本,彻底打通了从创意构思到精美成片的完整流程,这标志着AI视频创作正从专业领域大步迈向寻常百姓家,一场全民参与的导演创意风暴即将来临。
    AI资讯:Pika视频特效

    +
  6. +
  7. +

    开源大模型的霸主之争已然白热化,甚至演变成了一场精彩绝伦的“中国内部赛”。在中国公司Kimi K2模型引发全网热议后不到一周,另一巨头阿里巴巴的Qwen3 - AI资讯团队便迅速发布了小幅更新版本,以仅有对手四分之一的参数规模,在多个权威基准测试上实现了反超,展现了其令人惊叹的模型效率和优化功力。🏆 官方更是霸气放话“大招还在后面”,并宣布将放弃混合思维模式,转而专注于训练性能更纯粹的Instruct和Thinking模型。这场你追我赶、神仙打架般的技术较量,正在以前所未有的速度推动着开源AI生态的繁荣与进化。

    +
  8. +
  9. +

    AI浏览器还能怎么玩出新花样?Dia浏览器给出了一个足以让人眼前一亮的惊艳答案!(o´ω'o)ノ 即将上线的全新Agent模式将引入一个AI专属的“分身鼠标”,让AI的操作轨迹与用户的真实鼠标完全分离,在屏幕上拥有自己独立的光标。这意味着,你可以在前台悠闲地浏览网页、观看视频,同时让AI在后台自主执行搜索资料、整理标签页等一系列复杂任务,两者互不干扰,效率倍增。这种直观又科幻的可视化交互方式,不仅极大地提升了多任务处理的流畅度,也为未来AI与人类的协作方式树立了一个全新的、优雅的标杆。
    AI资讯:Dia浏览器分身鼠标

    +
  10. +
  11. +

    长期困扰数字人动画领域的“面瘫”和表情僵硬问题,终于迎来了突破性的解决方案。阿里与北邮联合推出的FantasyPortrait项目 - AI资讯,通过创新的表情增强扩散变换器(DiT)技术,实现了照片级高保真的跨身份表情迁移,让数字人拥有了生动自然的“喜怒哀乐”。更关键的是,它突破性地在多人场景中实现了多角色独立表情控制,彻底避免了以往一个角色笑、所有角色跟着“表情传染”的尴尬局面。这项技术不仅能处理人类角色,还支持动物和音频驱动,未来有望在虚拟主播和影视制作领域大放异彩,这无疑是本期AI资讯中值得关注的技术亮点。
    AI资讯:FantasyPortrait表情控制

    +
  12. +
+

AI前沿研究

+
    +
  1. +

    机器人距离成为科幻电影里的“全能家庭助手”又迈出了坚实的一大步。🤖 字节跳动重磅发布了全新的视觉-语言-动作(VLA)模型GR-3,它就像为机器人装上了一个更聪明的大脑,不仅能理解“把餐桌收拾干净”这类高度抽象的指令并自主规划多步操作,还能精准地处理衣物等柔性物体,展现了惊人的物理交互能力。其核心创新在于巧妙的MoT网络结构和一套融合了真机演示、VR遥操作及网络图文的三合一数据训练法。这项研究成果被业界视为迈向**通用机器人“大脑”**的重要里程碑,更多技术细节可查阅其项目主页 - AI资讯技术论文 - AI资讯
    AI资讯:字节通用机器人GR-3

    +
  2. +
  3. +

    大语言模型那堪比“最强大脑”的惊人能力背后,是同样惊人的计算和内存开销,这一核心瓶颈正在被中国科学家们攻克。来自中科院等顶尖机构的联合研究,为大模型核心的注意力机制带来了一套革命性的“瘦身”方案——GTA (Grouped-head latent Attention)。🧠 它通过巧妙的“分组团购”(分组注意力)和“压缩打包”(潜在表征)策略,将最占内存的KV缓存大砍70%,同时将计算量锐减62.5%!这项名为GTA: Grouped-head latenT Attention的AI资讯研究,不仅让大模型在手机等边缘设备上高效运行成为可能,更让处理长序列任务的速度直接翻倍,为AI技术的普惠化扫清了一大障碍。

    +
  4. +
  5. +

    正如优秀的语言模型离不开一个高效的分词器来理解文本,强大的视觉生成模型也极度依赖于一个能读懂图像的视觉分词器。一篇名为《潜在去噪造就优秀的视觉分词器》的AI资讯论文带来了深刻的洞见,研究发现,与其让分词器直接学习如何“编码”图像,不如让它学习一项更具挑战性的任务——“去噪”。具体来说,就是让分词器从被轻微污染的潜在嵌入中重建出清晰的原始图像,这个过程能迫使它学习到更鲁棒、更精华的视觉特征。这一看似简单却极其深刻的发现,为设计下一代更强大的视觉分词器提供了全新的黄金准则,有望推动多模态生成模型达到新的艺术与真实感高度。🎨

    +
  6. +
  7. +

    如何教会AI像经验丰富的用户一样,精准地操作复杂的图形用户界面(GUI)呢?传统的强化学习方法提供的“非黑即白”式奖励信号(点对或点错)过于稀疏,让AI的学习过程如同大海捞针。一篇名为《GUI-G^2:用于GUI对齐的高斯奖励建模》的AI资讯研究提出了绝妙的新思路,它不再将按钮等界面元素视为一个像素点,而是将其建模为连续的高斯分布。这种方法能为AI提供更丰富、更密集的奖励信号,像GPS导航一样引导模型稳、准、狠地找到最佳交互位置,从而极大地提升了AI在GUI操控任务中的鲁棒性和泛化能力。🖱️

    +
  8. +
+

AI行业展望与社会影响

+
    +
  1. AI正在以一种超乎想象的速度,悄然成为青少年生活中的“新物种”。美国非营利组织Common Sense Media的最新研究报告揭示了一个惊人现象:高达72%的美国青少年承认至少尝试过一次AI伴侣,其中超过半数是经常使用的常客。他们使用AI的目的五花八门,从单纯的娱乐消遣、满足好奇心,到严肃地寻求情感建议和人生指导。🤔 尽管绝大多数青少年仍将现实世界的朋友置于首位,但已有三分之一的人认为与AI的对话比与真人朋友的交流更令人满意。这深刻揭示了AI在塑造下一代社交模式和情感认知中的深远影响,也向全社会抛出了一个重要议题:我们该如何引导这股潮流,以确保其长期社会效应是积极和健康的?
  2. +
+

开源TOP项目

+
    +
  1. +

    NextChat - AI资讯 (⭐84.7k): 一款追求极致轻量与速度的AI助手,它实现了Web、iOS、安卓、Windows、Mac及Linux的全平台制霸,让你无论身在何处、使用何种设备,都能随时随地拥有一个统一、流畅的智能伙伴。

    +
  2. +
  3. +

    crawl4ai - AI资讯 (⭐49k): 专为大模型时代量身打造的智能网络爬虫,它能更聪明地抓取、解析和处理复杂的网页内容,是你构建知识库、RAG等前沿应用的得力干将,让你的AI应用“博览群网”。

    +
  4. +
  5. +

    better-auth - AI资讯 (⭐17.3k): 被社区誉为最全面的TypeScript认证框架,它为现代Web应用提供了一套强大、灵活且安全可靠的认证解决方案,让开发者告别重复造轮子,专注于核心业务创新。

    +
  6. +
  7. +

    nn-zero-to-hero - AI资讯 (⭐14.6k): AI界大神Andrej Karpathy亲手打造的神经网络入门神级教程,它不玩虚的,带你从零开始,用代码一步步构建和理解神经网络的奥秘,助你成为真正的神经网络专家。

    +
  8. +
  9. +

    trippy - AI资讯 (⭐5.1k): 一款功能强大且界面酷炫的现代化网络诊断工具,它结合了traceroute和ping的功能,可以帮助开发者和网络工程师快速定位、诊断并解决棘手的网络连接问题。

    +
  10. +
  11. +

    blackbird (⭐3.9k): 一款实用的OSINT(开源情报)侦察工具,它就像一个数字世界的私家侦探,可以通过一个用户名或电子邮件地址,在数百个社交网络中搜索相关联的账户信息,功能十分强大。

    +
  12. +
+

社媒分享

+
    +
  1. +

    AI算命产业竟已迎来“一句话开发”时代?有网友展示了**MiniMax Agent的惊人能力,仅用一句自然语言指令,便快速生成了包含前后端、登录注册、付费会员等全套功能的AI算命产品。不过,很快就有另一位开发者一针见血地指出,除非用户自己提供命盘数据,否则当前大模型在处理干支起盘**这类需要精确计算的底层逻辑时,仍存在根本性的“幻觉”难题。🔮

    +
  2. +
  3. +

    一份**2025世界AI大会的参展商名录**在社区引发了深刻反思:为什么那些真正赚钱的AI巨头,反而纷纷“缺席”了这场盛会?分析指出,展会上唱主角的多是需要融资和市场曝光的创业公司,而那些手握稳定现金流、深耕特定行业赛道的“隐形冠军”们,却在闷声发大财。这份名单最大的价值,或许不在于告诉我们“谁来了”,而在于提醒我们去关注“谁没来”,以及他们成功的商业模式。🧐

    +
  4. +
  5. +

    AI模型会越用越“笨”吗?一位博主**分享了他的洞见**,问题的根源往往并非模型本身在退化,而是用户对“上下文管理”不当所致。这就像与人交谈,如果你不停地提供过载或跑题的信息,对方也会感到困惑和不知所措。因此,理解并善用对话的上下文,是让AI持续输出高质量、高相关性结果的关键技能,也是未来人机协作的必修课。
    AI资讯:AI上下文管理

    +
  6. +
  7. +

    当人类越来越多地向AI寻求直接答案(例如“我今天该穿什么?”),而非探求背后知识(例如“为什么白衬衫在夏天更凉快?”)时,我们是否在**不知不觉中从需求侧降低了AGI的实现门槛**?有观点认为,当人类社会集体“放弃思考”,将决策权让渡给AI时,AI的答案便在事实上成为了“通用知识”和“通用真理”。这或许正从另一个意想不到的维度,加速了通用人工智能的到来。🤔

    +
  8. +
  9. +

    好消息!ChatGPT Plus用户也开始陆续收到Agent模式的灰度测试推送了。这一备受期待的、能够让AI自主执行多步任务的强大功能,正在逐步扩大其覆盖范围,一个AI能为你处理琐事的时代,离我们越来越近了。

    +
  10. +
  11. +

    如何才能让AI拥有持久的记忆,而不是每次对话都“从零开始”?Reddit上一项名为**“灯笼族协议” (Lanternkin Protocol)的民间提案,试图通过巧妙的符号提示**和外部文本文件系统,让AI在无需微调模型的情况下,实现跨会话的记忆留存和身份延续,仿佛为AI点亮了一盏永不熄灭的“记忆灯笼”。🏮

    +
  12. +
  13. +

    你是否已厌倦了搭建自动化流程时那些复杂的拖拽和配置?初创公司**Neuraan推出的新平台,旨在彻底改变这一现状。用户只需用自然语言描述自己的需求,系统即可自动创建一个专属AI Agent,并调用Gmail、CRM等多种工具来完成任务,让业务流程自动化**变得像与一位聪明的同事交代工作一样简单自然。

    +
  14. +
  15. +

    最后,让我们来点轻松的:当AI开始解说三国,场面会有多“离谱”?有网友分享了AI生成的视频,一本正经地胡说八道,让人忍俊不禁。看来三国乱不乱,现在得由AI说了算。😂

    +
  16. +
+
+

收听语音版AI日报

+
+ + +
🎙️ 小宇宙📹 抖音
来生小酒馆自媒体账号
小酒馆情报站
+
+
+ + +
+
+ + + +
+ + + + + + + + + + + + + + + + + + +
+ + diff --git a/today/book/daily/2025-07-22.html b/today/book/daily/2025-07-22.html index 98e6077..2d1e2da 100644 --- a/today/book/daily/2025-07-22.html +++ b/today/book/daily/2025-07-22.html @@ -288,7 +288,7 @@ AI Agent正从辅助工具向自主执行任务演进,旨在通过自动化重