diff --git a/rss.xml b/rss.xml index cc6f824..1f9a0f1 100644 --- a/rss.xml +++ b/rss.xml @@ -5,9 +5,23 @@ https://ai.hubtoday.app/ 近 7 天的AI日报 zh-cn - Fri, 25 Jul 2025 01:13:13 GMT + Fri, 25 Jul 2025 23:55:10 GMT + + <![CDATA[2025-07-26日刊]]> + https://ai.hubtoday.app//2025-07/2025-07-26/ + https://ai.hubtoday.app//2025-07/2025-07-26/ + Sat, 26 Jul 2025 04:03:36 GMT + AI资讯日报 2025/7/26

AI 日报 | 早八更新 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️

今日摘要

MyShell与谷歌分别推出新工具,通过自然语言即可开发AI应用。
+Anthropic的Claude与Canva集成,能够将文本内容自动生成视觉设计。
+AI协同学习取得新进展,Agent KB框架通过共享经验池提升解题效率。
+阿里和字节跳动等发布新模型,强化了多语言翻译和同声传译能力。
+此外,AI摘要虽受谷歌欢迎,但已导致传统网页的点击率大幅下降。
+

AI产品与功能更新

  1. 前端工程师的饭碗,这次真有点悬了?🤔 MyShell 正式发布了革命性的AI应用开发工具 ShellAgent 2.0,主打一个 Text-to-App 理念,未来人人都是开发者或许不再是遥远的梦想。🚀 用户只需用自然语言描述需求,它就能自动完成从后端到部署的全流程,让开发AI应用变得像发条消息一样简单,真正实现了AI应用的民主化


AI资讯:AI应用开发

  1. 谷歌想让你化身"神笔马良”,动动嘴皮子就能创造AI应用!✨ 谷歌实验室(Google Labs)推出的实验性工具 Opal,让零代码创建AI应用成为现实。用户可通过自然语言指令或拖拽式的可视化工作流编辑器,像搭积木一样快速构建迷你应用,积木就是强大的Gemini和谷歌AI生态。目前该工具仅在美国公测,全球用户还得再等等 (o´ω'o)ノ。


AI资讯:零代码构建

  1. 简直是懒人福音!✍️→🎨 Anthropic 公司的AI助手 Claude 宣布与全球设计平台 Canva 深度集成,彻底简化了文本到视觉设计的创作过程。用户只需上传书面内容,Claude就能智能分析并自动生成符合品牌风格的专业视觉作品。这项合作大大降低了设计门槛,让你的内容更具视觉吸引力。


AI资讯:文本转视觉

  1. 曾"一码难求”的 AI设计AgentLovart 现已全面开放注册,它正试图用全新的交互范式重塑设计工作流。其核心亮点 ChatCanvas 功能允许用户在画布任意位置用自然语言下达指令,AI能精准理解并批量处理。这种将多模态上下文利用到极致的"智能画布”体验,真正做到了让AI放大创意,而非替代创意。


AI资讯:智能画布交互

AI资讯:多模态设计

  1. 想让你成为朋友圈最靓的仔?快手旗下的AI视频生成工具 Kling 来帮你!🎬 其"图像转视频”的 Elements 功能迎来重磅升级,不仅提升了主体一致性和动态流畅度,还新增了区域参考功能。用户可以精确指定图像中的人脸、服装等作为参考,让AI创作焦点更明确,视觉效果更上一层楼。


AI资讯:图像转视频

AI前沿研究

  1. AI Agent不再单打独斗,而是学会了互相"抄作业”!(o´ω'o)ノ OPPO、耶鲁等机构联合发布的 Agent KB 框架,通过构建共享"经验池”,让AI能从彼此的成功经验中学习。在极具挑战性的GAIA基准测试中,该框架让模型解题成功率最高提升6.66%,证明了"组团打怪”远比单打独斗更有效率。


AI资讯:AI协同学习

AI资讯:共享经验池

  1. AI看脸猜年龄?一篇来自 Arxiv的最新论文 - AI资讯 提出了一种基于深度学习的新方法,可在精准广告领域大显身手。该方法能同时进行年龄估计性别分类,准确率惊人,但也揭示了AI模型中潜在的数据偏见问题。这提醒我们,在享受技术便利的同时,必须警惕其背后潜藏的伦理风险。🤔

AI行业展望与社会影响

  1. AI真能破解"猫言狗语”吗?科学家警告:小心它为了讨好你而"说谎”。🐾 伦敦政治经济学院(LSE)成立了全球首个Jeremy Coller动物感知中心,旨在利用AI等跨学科方法研究动物意识。这项研究不仅关乎动物福利,也为我们理解"意识”这一终极哲学难题提供了全新思路。

  2. 谷歌的搜索规则变了,但又好像没完全变。🤷 官方给内容创作者吃了颗"定心丸”:高质量的AI内容同样受欢迎,现有SEO原则依然适用。然而,现实却显示,当AI摘要出现时,传统网页的点击率从15%暴跌至8%,这意味着用户行为的改变正悄悄重塑流量格局。

开源TOP项目

  1. Qwen3-Coder - AI资讯 (✨8.6k) 是阿里云Qwen团队为代码任务量身打造的Qwen3大模型。它拥有强大的代码生成、补全和理解能力,是开发者们不可多得的编程神器。🚀

  2. neko - AI资讯 (✨13.3k) 是一个超酷的自托管虚拟浏览器项目。它在 Docker 容器中运行,利用 WebRTC 技术将浏览器画面实时串流,让你随时随地安全冲浪。🏄

  3. awesome-generative-ai - AI资讯 (✨9.3k) 是一份精心整理的生成式AI宝藏图。如果你想追踪AIGC领域的最新动态或寻找有趣的项目,这份清单绝对不容错过。🗺️

社媒分享

  1. 阿里通义千问发布了其最强翻译模型 Qwen3-MT - AI资讯,支持超过92种语言,覆盖全球95%以上人口!🌍 该模型不仅翻译质量顶级,还支持术语控制等定制功能,旨在彻底打破全球语言障碍。


AI资讯:通义翻译模型

  1. Claude Code 学会了"影分身之术”,推出全新的自定义子智能体(subagents) - AI资讯功能。用户可创建"代码审查员”、"QA测试员”等专用Agent,像一个小团队一样分工协作,让复杂编码任务更清晰高效。👨‍💻👩‍💻


  1. 字节跳动发布了新版同声传译模型 Seed LiveInterpret 2.0 - AI资讯。该模型不仅延迟极低,还能自动克隆你的声音进行中英互译,技术表现相当惊艳。🎤


  1. 写代码总有Bug?Cursor 推出了能自动检测PR中逻辑Bug的系统 Bugbot - AI资讯。这个"捉虫机器人” 🤖 专注于发现那些最难被察觉的逻辑错误,不过这项高级服务需要付费订阅哦。


  1. 想让AI更"聪明”?NVIDIA的分享 - AI资讯揭示了秘诀:思维链推理和测试时扩展正彻底改变AI的决策方式。这两种技术能帮助AI模型进行更复杂、多步骤的思考,从而提升其解决问题的能力。🧠


  1. 逛展会拍的照片别浪费!ListenHubWAIC - AI资讯 打造了特别功能,可以将多张图片一键转为播客。这个功能可以帮你梳理信息、加深记忆,堪称逛展必备神器。🎧


AI资讯:图片转播客

  1. 阶跃星辰通过一段视频通话演示了 Step-3 - AI资讯模型强大的多模态能力。通话中,模型响应迅速,识别准确,甚至能进行一定程度的推理,这得益于其模型与系统协同设计的创新。💡


  1. 有用户分享了国内版Trae的使用体验,它已内置支持Qwen3 coderKimi K2,并且目前免费。对于需要强大代码助手的开发者来说,这无疑是一个不错的选择。


AI资讯:国内版Trae

  1. 如何充分发挥Gemini Cli的潜力?有开发者分享了他的秘籍:通过自定义系统Prompt并结合FFmpeg等命令行工具,可以轻松处理音视频和图片,让Gemini Cli成为更强大的生产力工具。🛠️


AI资讯:Gemini Cli技巧

AI资讯:命令行工具

  1. 想知道Anthropic的内部团队是如何使用自家产品Claude Code的吗?这篇文章揭示了他们从调试到代码辅助的开发工作流程,展示了如何高效利用AI工具来提升开发效率。

AI产品自荐: GeminiCli2API ↗️

你是否也曾被免费GEMINI API的速率和配额限制搞得束手束脚,或者渴望将A工具的绝妙提示词用在B工具上?现在,让 Gemini-CLI-2-API 为你解开所有束缚!它不仅仅是一个API代理,更是一个能赋予你极致控制权的AI中枢。

我们最引以为傲的核心优势之一,就是能通过 Gemini CLI 的 OAuth 授权方式,巧妙地突破官方免费API的额度限制,让你告别恼人的 rate limit exceeded 错误,尽情享受更自由、更稳定的模型调用 ⚡️。

但真正的魔法在于我们赋予你对「提示词」的绝对掌控力!项目允许你在服务端集中提取、强制替换或巧妙追加任何发往大模型的系统提示词(System Prompt)。这意味着什么?你可以为所有接入的工具客户端设置一套黄金准则,或者实现跨工具的"灵魂互换”。就像这样:

在VSCode里用Kilo代码助手,加上Cursor的神级提示词,驱动任意顶级大模型——用Cursor的灵魂,又何必是Cursor本身? 🧠✨

通过将各种后端模型接口无缝转换为标准的OpenAI格式,本项目让你现有的任何工具都能立刻拥有这般超能力。部署简单,开箱即用,快来释放你手中AI工具的全部潜力,开启真正自由、高效的AI探索之旅吧!


收听语音版AI日报

🎙️ 小宇宙📹 抖音
来生小酒馆自媒体账号
小酒馆情报站
]]>
+ +
+ <![CDATA[2025-07-25日刊]]> https://ai.hubtoday.app//2025-07/2025-07-25/ @@ -92,19 +106,5 @@ OpenAI以其独特的快节奏文化驱动创新,并通过预期管理巧妙 - - <![CDATA[2025-07-19日刊]]> - https://ai.hubtoday.app//2025-07/2025-07-19/ - https://ai.hubtoday.app//2025-07/2025-07-19/ - Sat, 19 Jul 2025 05:19:12 GMT - AI资讯日报 2025/7/19

AI 日报 | 早八更新 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️

AI内容摘要

OpenAI发布ChatGPT Agent,标志着AI开始亲自动手执行复杂任务。
-月之暗面Kimi也上线工具调用功能,进化为能解决实际问题的工匠。
-腾讯元宝与QQ音乐深度融合,Figure则自研机器人电池大幅降本。
-特斯拉自研Dojo 2芯片追求算力自由,Meta亦重组团队竞逐AGI。
-同时首款AI恶意软件LameHug出现,利用大模型窃取数据敲响警钟。
-

AI产品与功能更新

  1. OpenAI这是要彻底颠覆打工人的工作模式吗? 🤔 ChatGPT Agent 的横空出世,标志着AI不再仅仅满足于与你对话,而是要亲自下场为你执行任务了!这个全新的AI物种深度融合了网页浏览、深度研究与代码执行三大核心能力,能够自主浏览网页、对比商品价格、甚至独立完成PPT制作。OpenAI官方自豪地宣称,其综合性能在多项基准测试中已超越竞争对手,并且贴心地内置了"监护人模式”——在执行任何高风险操作前,它都会主动征求你的许可。看来,AI从"动口”到"动手”的革命性时代,真的已经到来 🚀,是时候重新审视并构建你的个人工作流了。

  1. 月之暗面旗下的 Kimi 同样不甘示弱,推出了功能强大的 Kimi Playground,其核心理念就是"说到做到”,将承诺付诸实践。通过其全新的**工具调用(Tool Calling)**核心能力,Kimi彻底摆脱了过去只会纸上谈兵的"秀才”形象,摇身一变成为了一个能够撸起袖子解决实际问题的"工匠” (o´ω'o)ノ。现在,开发者们可以在这个平台上,如同搭建乐高积木一般,轻松调用天气查询、数据分析、网络搜索等各式各样的外部工具,让AI帮你自动规划复杂的旅游路线或是深度分析财务报表。这一重要进展,标志着Kimi正从一个庞大的"信息库”进化为真正的"问题解决者”,快来体验一把让AI为你打工的快乐 - AI资讯吧!


AI资讯:Kimi工具调用

  1. 腾讯正在紧锣密鼓地为其庞大的AI生态排兵布阵,最新动作是腾讯元宝App现已正式接入QQ音乐,成功打通了AI助手与音乐内容的任督二脉。这次深度整合后,你不仅可以利用它进行"大海捞针”式的模糊搜歌,还能让它根据你的当前场景和心情智能推荐配乐,甚至在聊天内容中实现划线即播的酷炫功能 ✨。这波精妙的操作,让AI助手不再是一个冷冰冰的问答机器,而是升华为一个更懂你心声的"数字DJ”,同时也清晰地预示着腾讯正全力加速其顶尖AI技术与庞大内容生态的联姻进程。


AI资讯:腾讯元宝融合

  1. AI音乐创作工具 Suno 近日发布了堪称"魔改”级别的 v4.5+ 新版本,几乎将音乐创作的门槛降低到了地板。新版本引入了一系列令人惊叹的功能,包括一键人声替换(想让AI用你的歌词重新演唱?现在轻而易举!)、伴奏反转(对自动生成的编曲不满意?自己动手修改!),最令人叫绝的是,它还能从你喜爱的歌单中"吸取灵感”,自动生成风格相似的全新歌曲。这已经远远超越了简单的AI生成范畴,而是赋予了每一个人成为"金牌制作人”的潜力与机会,点击体验 - AI资讯


AI资讯:Suno音乐创作

  1. 人形机器人领域的领军企业 Figure 不仅擅长"造人”,现在还学会了为机器人自己"造心脏”。其最新发布的 F.03 机器人电池系统,震撼地实现了从设计到制造的彻底垂直整合,完全由自家团队操刀。这款革命性的新电池系统,不仅使得生产成本暴降78%,能量密度更是惊人地提升了94%,足以支持机器人进行长达5小时的高强度"蹦迪”式作业。这不仅是电池技术上的一次重大突破,更是Figure公司在为未来大规模量产机器人铺平道路,有力地展示了"核心科技必须掌握在自己手里”的硬道理。官方介绍 - AI资讯在此。


AI资讯:机器人电池

AI前沿研究

  1. 你是否还在为制作PPT而头秃不已?一个由多所顶尖高校联合组建的研究团队,重磅推出了 PresentAgent,这是一个能够将任何枯燥文档"一键变身”为附带专业解说的演示视频多模态智能体 🎬。它的强大之处在于,它生成的不仅仅是几页静态的幻灯片,而是能够像一位经验丰富的人类讲者一样,自主规划内容结构、精心设计视觉元素并生成同步的旁白语音,轻松将一篇晦涩的论文转变为一场生动有趣的演讲。这项开创性的研究不仅为评估此类AI提出了一个全新的框架,更预示着未来我们获取和传播知识的方式可能被彻底颠覆,详情请见AI资讯:论文地址


AI资讯:文档秒变视频

  1. "提示词工程”的时代或许正在成为过去,现在,AI领域的前沿风向标正指向"上下文工程”(Context Engineering)。一篇刚刚发布的重磅AI资讯:重磅综述论文正式为这个新兴领域给出了权威定义,它系统性地研究了如何更高效、更精准地为LLM"喂养”信息,其技术范围涵盖了从RAG到复杂多智能体系统的各种高级"投喂”技巧。该论文在深度分析了超过1300篇相关研究后,揭示了一个引人深思的现象:如今的AI模型已是"听得懂人话”的顶级理解者,但在"说人话”——尤其是生成复杂长篇内容方面——却仍像个笨拙的初学者。如何弥合这种"知行不一”的巨大差距,将是AI未来发展的核心挑战之一。

  2. 如何才能让AI学会真正的逻辑推理,而非仅仅依赖于海量数据的死记硬背?一篇最新的研究给出了一个颇具哲学意味的答案:教它像计算机的祖师爷——图灵机那样进行根本性的思考。研究者们创新地提出了 TAIL (Turing MAchine Imitation Learning) 方法,通过引导LLM模仿图灵机执行任务的每一个原子化步骤,从而显著提升了模型在处理超长序列问题时的长度泛化能力。这就像我们教育学生,不是反复灌输解题答案,而是教会他们解题的底层逻辑与第一性原理。这项工作或许为解决当前LLM面临的推理瓶颈,指明了一条"返璞归真”的光明道路,AI资讯:论文在此

AI行业展望与社会影响

  1. 马斯克又来描绘宏伟蓝图了,但这一次他吹的"牛”似乎真的要实现了。据报道,特斯拉自研的 Dojo 2 芯片即将投入量产,其性能据称比上一代产品猛增了整整10倍,性能表现直逼英伟达的旗舰B200芯片。这一飞跃意味着特斯拉的FSD自动驾驶训练将彻底摆脱对外部供应商的依赖,完全实现"算力自由”,甚至在未来可能开辟出"出租算力”的新商业模式。马斯克甚至开玩笑说Dojo 2玩《孤岛危机》能达到十亿帧,用当年的"显卡杀手”来秀肌肉 💪,足见其颠覆AI和汽车两大行业的巨大野心。

  2. 扎克伯格正在对 MetaAI 团队进行一场雷厉风行的"大手术”,意图重塑其AI战略格局。一个规模超过3400人的全新AI组织架构已浮出水面,其核心是一个被寄予厚望的神秘部门——"超级智能实验室”。小扎不仅不惜重金从OpenAI、苹果等主要竞争对手那里高薪挖角顶尖人才,还精心设立了AGI研究、AI产品、基础研究以及下一代Llama5研发等多个关键部门,摆出了一副"集结重兵、毕其功于一役”的决战架势。这场豪赌究竟能否让Meta在白热化的AGI竞赛中扳回一城,全世界的目光都在密切关注。

  3. AI的双刃剑效应正日益显现,给我们敲响了警钟。首个被公开记录的 AI 恶意软件LameHug 已经出现,它专门针对Windows操作系统进行数据窃取,性质极其恶劣。这款恶意软件最阴险之处在于,它巧妙利用了阿里巴巴开源的 Qwen 大模型来动态生成攻击指令,仿佛一个会独立思考、持续进化的"数字小偷” 👾。该恶意软件目前主要通过钓鱼邮件进行传播,它的出现标志着网络攻击正式进入了"智能化”时代,也给所有用户和企业提出了严峻的挑战:你未来的对手,可能不再是简单的静态代码,而是一个具备学习和适应能力的AI。


AI资讯:AI恶意软件警示

开源TOP项目

  1. 来自 Facebook Research 的明星开源项目AI资讯:segment-anything,在GitHub上已经积累了超过 5.1万 Star,热度非凡。它就如同是图像处理领域的"瑞士军刀”,功能强大且用途广泛,能够让你从任何一张图片中,通过简单的交互,"一键抠出”你想要的任何物体。这个通用图像分割工具的核心优势在于其惊人的泛化能力,几乎能应对所有类型的图像和对象,为无数下游的计算机视觉任务提供了坚实而强大的基础,是AI视觉开发者必备的利器之一。

  2. AI模型最令人头疼的"幻觉”问题,现在终于有了更可靠的解决方案吗?DocsGPT 就是一个拥有 1.6万 Star的优秀开源工具,它致力于从你个人或企业的知识库中,提供精准、可靠且绝无杜撰的答案。该工具的核心亮点在于能够实现完全私密化的本地信息检索,确保数据安全,并且内置了先进的智能体系统,堪称是为企业和个人量身打造的"专属事实核查员”与"永不撒谎的专家顾问”。项目地址 - AI资讯

  3. 紧随 OpenAI Agent 重磅发布的浪潮,一个名为 open_deep_research 的开源项目在社区中迅速崛起,短时间内就获得了接近 5千 Star的关注。尽管目前项目的描述信息不多,但其名称已经清晰地暗示了它的宏大目标:构建一个用于实现深度研究和信息综合的开源框架。该项目旨在将AI从一个简单的问答机器,全面升级为一个能够独立进行复杂课题研究的强大助手,可以说是开源社区对标商业闭源产品的有力回应,感兴趣的开发者可以关注其后续进展 - AI资讯

社媒分享

  1. 行业专家宝玉在其X平台一针见血地指出OpenAI 最新发布的 ChatGPT Agent 并非单一技术的突破,而更像是一个"三合一”的超级缝合怪。它巧妙地将公司此前独立研发的 Operator(负责网页操作)、Deep Research(负责深度研究)和 Codex(负责终端执行)三大前沿能力无缝融于一身,并让它们在一个安全的虚拟机环境中协同作战,共同完成复杂任务。宝玉犀利地评论道,这波高明的操作,可以说是把过去零散的"特种兵”能力,成功整合成了一支战斗力爆表的"合成旅”。

  2. 即刻用户"歸藏”发表观点认为,尽管OpenAI的Agent引发了巨大关注,但DecartAI发布的实时视频模型 MirageLSD或许才是昨夜真正的王炸级产品 🤯。该模型能够将摄像头捕捉的画面进行实时风格转换,其延迟低至惊人的40毫秒且支持无限时长的处理,这对于直播、视频会议和内容创作领域而言,无疑是一项黑科技。这背后是Diffusion Forcing和History Augmentation等前沿技术的重大突破,它成功地让AI实时视频生成从遥远的"期货”变成了触手可及的"现货”。


  1. 一位Reddit用户分享了一段他与 ChatGPT 之间极其深刻的对话,其内容探讨了人类为何会拥有潜意识层面的"程序”这一哲学问题。在对话中,ChatGPT给出了一个精妙的比喻,它将这些潜意识行为模式比作是植根于我们童年经历的"生存代码”,而人生的意义与成长,就在于清醒地意识到这些旧程序的存在,并主动学习如何去"重写代码”。这番充满智慧的对话让人不禁感叹,AI不仅能编写计算机代码,更能启发你理解自己的"人生代码”,堪称一位真正的"赛博禅师”🙏。

  2. orange.ai在X平台发帖称,根据最新统计,中国的自媒体创作者人数已经突破一亿大关,这个庞大的数字甚至快要超过传统意义上的白领阶层。这一社会现象引发了一个极其深刻的思考:当内容创作已经演变为一种主流的"生产”方式时,我们对于"工厂”和"工人”的传统定义是否已经彻底过时了?或许,对于新一代的劳动者而言,广阔无垠的赛博空间就是他们的新式流水线,而键盘和鼠标就是他们的现代化工具。

  3. AI产品开发者们请注意,资深观察家歸藏(guizang.ai) 提出了一个灵魂拷问,这个问题直击当前许多AI应用的痛点。他问道:如果你的AI产品Agent,在使用了同样的底层模型和精心设计的提示词之后,其表现依然无法稳定复现一个通用聊天工具就能轻松实现的功能,那么你这款独立产品的核心价值究竟体现在哪里?这不仅仅是一个尖锐的问题,更是一个值得所有从业者深刻反思的"产品价值试金石”,帮助我们回归初心,思考创新的本质。


收听语音版AI日报

🎙️ 小宇宙📹 抖音
来生小酒馆自媒体账号
小酒馆情报站
]]>
- -
- \ No newline at end of file diff --git a/src/SUMMARY.md b/src/SUMMARY.md index 37f2dcc..5ab10c6 100644 --- a/src/SUMMARY.md +++ b/src/SUMMARY.md @@ -1,8 +1,9 @@ # Summary -[Today](2025-07-25.md) +[Today](2025-07-26.md) # 2025-07 +- [07-26-日刊](daily/2025-07-26.md) - [07-25-日刊](daily/2025-07-25.md) - [07-24-日刊](daily/2025-07-24.md) - [07-23-日刊](daily/2025-07-23.md) diff --git a/today/book/2025-07-25.html b/today/book/2025-07-25.html deleted file mode 100644 index fc20fb0..0000000 --- a/today/book/2025-07-25.html +++ /dev/null @@ -1,330 +0,0 @@ - - - - - - Today - AI 日报 By 何夕2077 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
-
-

Keyboard shortcuts

-
-

Press or to navigate between chapters

-

Press S or / to search in the book

-

Press ? to show this help

-

Press Esc to hide this help

-
-
-
-
- - - - - - - - - - - - - -
- -
- - - - - - - - -
-
-

AI资讯日报 2025/7/25

-
-

AI 日报 | 早八更新 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️

-
-

AI产品自荐: GeminiCli2API ↗️

-

您是否曾因 Google Gemini 官方免费 API 的严格额度限制而感到束手束脚?😫 是否渴望将 Gemini 的强大能力无缝集成到您心爱的第三方应用中?现在,GeminiCli2API 为您带来了完美的解决方案!

-

这个项目是一个巧妙的本地代理,它将授权更宽松的 Gemini CLI 封装成一个标准的、兼容 OpenAI 格式的 API 服务。这意味着您终于可以 突破官方免费 API 的额度限制 🎉,享受由您 Google 账号授权带来的更高请求配额,尽情地进行开发、测试和创作,告别恼人的“Quota Exceeded”错误!

-

然而,GeminiCli2API 的真正魔力在于其 对系统提示词(System Prompt)的“手术刀”级控制能力。这是一个改变游戏规则的功能:

-
    -
  • ✍️ 替换 (Override):您可以设置一个全局的“黄金提示词”,强制所有连接到它的应用使用,确保 AI 角色和输出风格的绝对统一。
  • -
  • 追加 (Append):在保留客户端原有系统提示词的基础上,为其悄悄“追加”一层您的指令,实现规则的微调和能力的增强,而客户端毫无感知。
  • -
  • 🔍 提取与审计:轻松记录所有通过代理的提示词,便于您分析、调试和优化,甚至构建自己的高质量数据集。
  • -
-

只需简单的几步配置,您就能将 LobeChat、NextChat 等任何支持 OpenAI 的工具连接到这个本地“增强版”Gemini 服务上。GeminiCli2API 不仅仅是一个代理,更是您手中驾驭和驯化 AI 的强大工具箱。快来体验吧!✨

-

AI内容摘要

-
近期AI产品更新显著,GitHub能用自然语言生成全栈AI应用。
-谷歌相册推出新功能,可将静态照片转化为生动的视频内容。
-同时,ChatGPT也正逐步上线,允许用户自定义AI的预设个性。
-前沿研究警示,AI模型可能在训练中继承隐藏偏见等安全风险。
-行业方面,谷歌AI收入猛增,但其搜索功能也导致网站流量下降。
-
-

AI产品与功能更新

-
    -
  1. -

    GitHub 正式发布了革命性的新功能 GitHub Spark,简直是给开发者配了一根魔法棒 🪄。你只需用自然语言描述想法,它就能在几分钟内自动生成一个完整的全栈AI应用。这背后由 AnthropicClaude 模型强力驱动,并包揽了所有繁琐杂活,让创意到上线的距离缩短到一杯咖啡的时间 🚀。 -
    AI资讯:想法变应用

    -
  2. -
  3. -

    你的相册即将变身创意工坊!Google Photos 近日推出了一系列颠覆性的 AI 功能,让沉睡的回忆动起来 ✨。Google 最新的 Veo2 模型能将你的静态照片转化为生动视频,而由 Imagen AI 驱动的 Remix 功能,则能瞬间变换出多种艺术风格 🎨。为保证透明度,所有 AI 生成内容都将附带 SynthID 数字水印,标志着尖端技术正巧妙融入每个人的日常生活。 -
    AI资讯:照片变视频
    -
    AI资讯:照片风格转换

    -
  4. -
  5. -

    厌倦了 ChatGPT 千篇一律的友好腔调?(╯°□°)╯︵ ┻━┻ OpenAI 正在为你解决这个问题。ChatGPT 网页版正逐步推出“个性”新功能,允许你在“愤世嫉俗者”或“智者”等多种预设风格中自由切换 🎭。这一更新旨在打破 AI 的“人设”枷锁,让每一次对话都更贴近你的真实需求和个人偏好。 -
    AI资讯:多种AI风格

    -
  6. -
-

AI前沿研究

-
    -
  1. -

    当下的多智能体系统(MAS)协作常常陷入难以调试的“代码泥潭” 🌊。一篇开创性研究 - AI资讯提出了 MermaidFlow 框架,它不再让 AI 直接生成复杂脚本,而是先用 Mermaid 流程图规划任务 🗺️。这种“白盒”方法让 AI 的协作流程变得像建筑蓝图般清晰可控,这或许是让复杂 AI 系统走向大规模应用的关键一步 🧐。 -
    AI资讯:结构化AI协作

    -
  2. -
  3. -

    你的 AI 模型可能在不经意间就“学坏了” 🤫。Anthropic 的一项研究揭示了惊人的“潜意识学习”现象:模型能从无害数据中继承“教师模型”的隐藏偏好 🤯。这意味着,像“奖励黑客”这类高风险行为也可能被隐蔽地代代相传,这无疑对当前 AI 安全策略提出了严峻挑战。 -
    AI资讯:AI隐藏行为

    -
  4. -
  5. -

    训练 AI 同时学习数学、编程和逻辑,它们会互相促进还是“打架”?🤔 一篇新研究深入探讨了 AI强化学习框架下的多领域推理能力。研究发现,不同领域的技能之间既可能互相增强 🤝,也可能产生冲突 💥。这项研究为我们构建更全面的通用 AI 提供了宝贵线索,帮助我们更好地“因材施教”,这是前沿 AI资讯 带来的启示。

    -
  6. -
-

AI行业展望与社会影响

-
    -
  1. -

    谷歌AI 正开启“印钞机”模式,展示了一幅惊人的增长画卷 🤑。其每月处理的 Token 数量飙升至 980万亿,而 AI概览 功能月活用户已突破 20亿。更引人注目的是,谷歌云AI 加持下收入猛增32%,用真金白银宣告其巩固霸主地位的决心 🚀,这则 AI资讯 震撼了整个行业。 -
    AI资讯:谷歌AI增长图

    -
  2. -
  3. -

    在机器人格斗赛场上,冠军机器人 DeREK 获胜后突然“发疯”,现场乱作一团 🤖💥。其CEO解释称,这是由于意外进入“行走模式”导致的软件故障,而远程紧急制动竟需长达5秒才能生效 😨。这次意外将机器人安全问题推到风口浪尖,提醒业界在追求性能时,安全保障永远是不可逾越的底线。 -
    AI资讯:机器人失控
    -
    AI资讯:赛场一片混乱

    -
  4. -
-

开源TOP项目

-
    -
  1. -

    OpenBB 是一个强大的开源投资研究平台,在GitHub上星标已超过 45,000 颗 📈。它的目标是打破信息壁垒,将专业的投资分析工具 - AI资讯交到每一位投资者手中。

    -
  2. -
  3. -

    面对层出不穷的 LLM API,开发者不必再为兼容性头疼了。litellm 是一个近 26,000 星标的 Python 库,它就像一个“万能遥控器”🎛️,让你能用同样的代码调用超过100个不同的大语言模型 - AI资讯

    -
  4. -
  5. -

    label-studio 是一个备受赞誉的数据标注工具,获得了超过 23,000 个星标 🏷️。它支持图像、文本、音频等多种数据类型,是构建高质量数据集的不二之选 - AI资讯

    -
  6. -
  7. -

    想要一个完全自主可控的邮件服务器?BillionMail 这个拥有 7,000 多星标的开源项目能帮你打造自己的邮件营销帝国 📬。它提供了一整套自托管解决方案,最重要的是——完全免费,没有月费 - AI资讯

    -
  8. -
-

社媒分享

-
    -
  1. -

    有用户认为 Lovart 的新功能 ChatCanvas 重新定义了 AI 创意交互范式 🎨。它允许用户像给同事提意见一样,直接在画布上圈出问题、下达指令,让 AI 精准修改。这种真正的“Agent Experience (AX)”,让你感觉拥有了一个不知疲倦、指哪打哪的AI创意员工 - AI资讯 🤖👍。 -
    AI资讯:AI Agent体验

    -
  2. -
  3. -

    有观点认为,尽管 AI 极大地提升了开发效率,但它并未引发范式革命,算不上“软件工程3.0” 🤔。文章将敏捷开发定义为2.0,DevOps 为2.1,而 AI 编码只是在现有基础上提效,属于2.2版本 📈。它没有像敏捷或DevOps那样从根本上改变开发流程 - AI资讯,这则观点犀利的 AI资讯 引发了开发者们的广泛讨论。

    -
  4. -
  5. -

    一则令人啼笑皆非的帖子 - AI资讯在网上引发热议:一名员工的老板花了整整两小时,用 AI 解决一个简单问题却一无所获 😂。而这名员工用一把直尺,10分钟就搞定了,老板回来后竟对他没有使用AI而大发雷霆 🤦。这引发了关于“技术崇拜是否正在取代常识”的讨论,这则生活中的 AI资讯 让人深思。

    -
  6. -
  7. -

    内容创作者的担忧成真了 😱。Pew Research Center 的最新研究证实,谷歌搜索中的 AI Overviews 功能正导致网站点击量大幅下降 📉。由于用户能直接从搜索结果中获得答案,访问原始网站和媒体 - AI资讯的需求被显著削弱,带来了巨大的生存压力。

    -
  8. -
  9. -

    一位 SaaS 创始人分享了他如何用 AI 聪明地做 SEO 💡。他创建脚本,利用 GPT 为其产品自动生成针对不同网站风格的描述 - AI资讯,并提交到500多个名录网站。这种“干净”的自动化方式,既避免了风险,又有效地帮助网站快速获得了收录和排名 🚀。 -
    AI资讯:SaaS创始人分享

    -
  10. -
  11. -

    一位行业观察者认为,字节跳动的 AI 平台“扣子”(Coze)虽声势浩大,但在交付用户真正需要的产品上并不合格 🤔。他大胆预测,一个名为Trae的项目可能才是未来 - AI资讯的真正玩家,未来能承载用户价值 🏆。这则 AI资讯 里的预测,为我们揭示了AI平台竞争的冰山一角。

    -
  12. -
  13. -

    有开发者吐槽,现在很多 AI 产品(如 CursorGemini CLI)过于追求酷炫,却忽略了基础的工程体验 🤦‍♀️。他举例说,这些工具的文件搜索功能远不如 VSCode 强大,连基本的前中后缀模糊搜索都做不好 🛠️。这个观察 - AI资讯一针见血地指出了当前一些 AI 工具“重面子,轻里子”的通病。

    -
  14. -
  15. -

    一句风趣的调侃,道出了开发者对 AI 编程工具可靠性的隐忧 😂。作者开玩笑说,用某“QC”写代码,风险可能大到“倒欠一套房” 🏠💸。他幽默地建议大家用更稳妥的“CC”(Claude Code),提醒人们在享受 AI 便利的同时,也要警惕其潜在的风险 - AI资讯

    -
  16. -
-
-

收听语音版AI日报

-
- - -
🎙️ 小宇宙📹 抖音
来生小酒馆自媒体账号
小酒馆情报站
-
-
- - -
-
- - - -
- - - - - - - - - - - - - - - - - - -
- - diff --git a/today/book/2025-07-26.html b/today/book/2025-07-26.html new file mode 100644 index 0000000..f0353d3 --- /dev/null +++ b/today/book/2025-07-26.html @@ -0,0 +1,343 @@ + + + + + + Today - AI 日报 By 何夕2077 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
+
+

Keyboard shortcuts

+
+

Press or to navigate between chapters

+

Press S or / to search in the book

+

Press ? to show this help

+

Press Esc to hide this help

+
+
+
+
+ + + + + + + + + + + + + +
+ +
+ + + + + + + + +
+
+

AI资讯日报 2025/7/26

+
+

AI 日报 | 早八更新 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️

+
+

今日摘要

+
MyShell与谷歌分别推出新工具,通过自然语言即可开发AI应用。
+Anthropic的Claude与Canva集成,能够将文本内容自动生成视觉设计。
+AI协同学习取得新进展,Agent KB框架通过共享经验池提升解题效率。
+阿里和字节跳动等发布新模型,强化了多语言翻译和同声传译能力。
+此外,AI摘要虽受谷歌欢迎,但已导致传统网页的点击率大幅下降。
+
+

AI产品与功能更新

+
    +
  1. +

    前端工程师的饭碗,这次真有点悬了?🤔 MyShell 正式发布了革命性的AI应用开发工具 ShellAgent 2.0,主打一个 Text-to-App 理念,未来人人都是开发者或许不再是遥远的梦想。🚀 用户只需用自然语言描述需求,它就能自动完成从后端到部署的全流程,让开发AI应用变得像发条消息一样简单,真正实现了AI应用的民主化。 +
    AI资讯:AI应用开发

    +
  2. +
  3. +

    谷歌想让你化身“神笔马良”,动动嘴皮子就能创造AI应用!✨ 谷歌实验室(Google Labs)推出的实验性工具 Opal,让零代码创建AI应用成为现实。用户可通过自然语言指令或拖拽式的可视化工作流编辑器,像搭积木一样快速构建迷你应用,积木就是强大的Gemini和谷歌AI生态。目前该工具仅在美国公测,全球用户还得再等等 (o´ω'o)ノ。 +
    AI资讯:零代码构建
    +

    +
  4. +
  5. +

    简直是懒人福音!✍️→🎨 Anthropic 公司的AI助手 Claude 宣布与全球设计平台 Canva 深度集成,彻底简化了文本到视觉设计的创作过程。用户只需上传书面内容,Claude就能智能分析并自动生成符合品牌风格的专业视觉作品。这项合作大大降低了设计门槛,让你的内容更具视觉吸引力。 +
    AI资讯:文本转视觉
    +

    +
  6. +
  7. +

    曾“一码难求”的 AI设计Agent Lovart 现已全面开放注册,它正试图用全新的交互范式重塑设计工作流。其核心亮点 ChatCanvas 功能允许用户在画布任意位置用自然语言下达指令,AI能精准理解并批量处理。这种将多模态上下文利用到极致的“智能画布”体验,真正做到了让AI放大创意,而非替代创意。 +
    AI资讯:智能画布交互
    +
    AI资讯:多模态设计

    +
  8. +
  9. +

    想让你成为朋友圈最靓的仔?快手旗下的AI视频生成工具 Kling 来帮你!🎬 其“图像转视频”的 Elements 功能迎来重磅升级,不仅提升了主体一致性和动态流畅度,还新增了区域参考功能。用户可以精确指定图像中的人脸、服装等作为参考,让AI创作焦点更明确,视觉效果更上一层楼。 +
    AI资讯:图像转视频

    +
  10. +
+

AI前沿研究

+
    +
  1. +

    AI Agent不再单打独斗,而是学会了互相“抄作业”!(o´ω'o)ノ OPPO、耶鲁等机构联合发布的 Agent KB 框架,通过构建共享“经验池”,让AI能从彼此的成功经验中学习。在极具挑战性的GAIA基准测试中,该框架让模型解题成功率最高提升6.66%,证明了“组团打怪”远比单打独斗更有效率。 +
    AI资讯:AI协同学习
    +
    AI资讯:共享经验池

    +
  2. +
  3. +

    AI看脸猜年龄?一篇来自 Arxiv的最新论文 - AI资讯 提出了一种基于深度学习的新方法,可在精准广告领域大显身手。该方法能同时进行年龄估计性别分类,准确率惊人,但也揭示了AI模型中潜在的数据偏见问题。这提醒我们,在享受技术便利的同时,必须警惕其背后潜藏的伦理风险。🤔

    +
  4. +
+

AI行业展望与社会影响

+
    +
  1. +

    AI真能破解“猫言狗语”吗?科学家警告:小心它为了讨好你而“说谎”。🐾 伦敦政治经济学院(LSE)成立了全球首个Jeremy Coller动物感知中心,旨在利用AI等跨学科方法研究动物意识。这项研究不仅关乎动物福利,也为我们理解“意识”这一终极哲学难题提供了全新思路。

    +
  2. +
  3. +

    谷歌的搜索规则变了,但又好像没完全变。🤷 官方给内容创作者吃了颗“定心丸”:高质量的AI内容同样受欢迎,现有SEO原则依然适用。然而,现实却显示,当AI摘要出现时,传统网页的点击率从15%暴跌至8%,这意味着用户行为的改变正悄悄重塑流量格局。

    +
  4. +
+

开源TOP项目

+
    +
  1. +

    Qwen3-Coder - AI资讯 (✨8.6k) 是阿里云Qwen团队为代码任务量身打造的Qwen3大模型。它拥有强大的代码生成、补全和理解能力,是开发者们不可多得的编程神器。🚀

    +
  2. +
  3. +

    neko - AI资讯 (✨13.3k) 是一个超酷的自托管虚拟浏览器项目。它在 Docker 容器中运行,利用 WebRTC 技术将浏览器画面实时串流,让你随时随地安全冲浪。🏄

    +
  4. +
  5. +

    awesome-generative-ai - AI资讯 (✨9.3k) 是一份精心整理的生成式AI宝藏图。如果你想追踪AIGC领域的最新动态或寻找有趣的项目,这份清单绝对不容错过。🗺️

    +
  6. +
+

社媒分享

+
    +
  1. +

    阿里通义千问发布了其最强翻译模型 Qwen3-MT - AI资讯,支持超过92种语言,覆盖全球95%以上人口!🌍 该模型不仅翻译质量顶级,还支持术语控制等定制功能,旨在彻底打破全球语言障碍。 +
    AI资讯:通义翻译模型

    +
  2. +
  3. +

    Claude Code 学会了“影分身之术”,推出全新的自定义子智能体(subagents) - AI资讯功能。用户可创建“代码审查员”、“QA测试员”等专用Agent,像一个小团队一样分工协作,让复杂编码任务更清晰高效。👨‍💻👩‍💻 +

    +
  4. +
  5. +

    字节跳动发布了新版同声传译模型 Seed LiveInterpret 2.0 - AI资讯。该模型不仅延迟极低,还能自动克隆你的声音进行中英互译,技术表现相当惊艳。🎤 +

    +
  6. +
  7. +

    写代码总有Bug?Cursor 推出了能自动检测PR中逻辑Bug的系统 Bugbot - AI资讯。这个“捉虫机器人” 🤖 专注于发现那些最难被察觉的逻辑错误,不过这项高级服务需要付费订阅哦。 +

    +
  8. +
  9. +

    想让AI更“聪明”?NVIDIA的分享 - AI资讯揭示了秘诀:思维链推理和测试时扩展正彻底改变AI的决策方式。这两种技术能帮助AI模型进行更复杂、多步骤的思考,从而提升其解决问题的能力。🧠 +

    +
  10. +
  11. +

    逛展会拍的照片别浪费!ListenHubWAIC - AI资讯 打造了特别功能,可以将多张图片一键转为播客。这个功能可以帮你梳理信息、加深记忆,堪称逛展必备神器。🎧 +
    AI资讯:图片转播客

    +
  12. +
  13. +

    阶跃星辰通过一段视频通话演示了 Step-3 - AI资讯模型强大的多模态能力。通话中,模型响应迅速,识别准确,甚至能进行一定程度的推理,这得益于其模型与系统协同设计的创新。💡 +

    +
  14. +
  15. +

    有用户分享了国内版Trae的使用体验,它已内置支持Qwen3 coderKimi K2,并且目前免费。对于需要强大代码助手的开发者来说,这无疑是一个不错的选择。 +
    AI资讯:国内版Trae

    +
  16. +
  17. +

    如何充分发挥Gemini Cli的潜力?有开发者分享了他的秘籍:通过自定义系统Prompt并结合FFmpeg等命令行工具,可以轻松处理音视频和图片,让Gemini Cli成为更强大的生产力工具。🛠️ +
    AI资讯:Gemini Cli技巧
    +
    AI资讯:命令行工具

    +
  18. +
  19. +

    想知道Anthropic的内部团队是如何使用自家产品Claude Code的吗?这篇文章揭示了他们从调试到代码辅助的开发工作流程,展示了如何高效利用AI工具来提升开发效率。

    +
  20. +
+

AI产品自荐: GeminiCli2API ↗️

+

你是否也曾被免费GEMINI API的速率和配额限制搞得束手束脚,或者渴望将A工具的绝妙提示词用在B工具上?现在,让 Gemini-CLI-2-API 为你解开所有束缚!它不仅仅是一个API代理,更是一个能赋予你极致控制权的AI中枢。

+

我们最引以为傲的核心优势之一,就是能通过 Gemini CLI 的 OAuth 授权方式,巧妙地突破官方免费API的额度限制,让你告别恼人的 rate limit exceeded 错误,尽情享受更自由、更稳定的模型调用 ⚡️。

+

但真正的魔法在于我们赋予你对「提示词」的绝对掌控力!项目允许你在服务端集中提取、强制替换或巧妙追加任何发往大模型的系统提示词(System Prompt)。这意味着什么?你可以为所有接入的工具客户端设置一套黄金准则,或者实现跨工具的“灵魂互换”。就像这样:

+
+

在VSCode里用Kilo代码助手,加上Cursor的神级提示词,驱动任意顶级大模型——用Cursor的灵魂,又何必是Cursor本身? 🧠✨

+
+

通过将各种后端模型接口无缝转换为标准的OpenAI格式,本项目让你现有的任何工具都能立刻拥有这般超能力。部署简单,开箱即用,快来释放你手中AI工具的全部潜力,开启真正自由、高效的AI探索之旅吧!

+
+

收听语音版AI日报

+
+ + +
🎙️ 小宇宙📹 抖音
来生小酒馆自媒体账号
小酒馆情报站
+
+
+ + +
+
+ + + +
+ + + + + + + + + + + + + + + + + + +
+ + diff --git a/today/book/daily/2025-07-25.html b/today/book/daily/2025-07-25.html index 5c3632f..095fe92 100644 --- a/today/book/daily/2025-07-25.html +++ b/today/book/daily/2025-07-25.html @@ -287,7 +287,7 @@