diff --git a/rss.xml b/rss.xml index bcaefaa..524e9cc 100644 --- a/rss.xml +++ b/rss.xml @@ -5,9 +5,42 @@ https://ai.hubtoday.app/ 近 7 天的AI日报 zh-cn - Tue, 23 Dec 2025 23:55:12 GMT + Wed, 24 Dec 2025 23:14:33 GMT + + <![CDATA[2025-12-25日刊]]> + https://ai.hubtoday.app//2025-12/2025-12-25/ + https://ai.hubtoday.app//2025-12/2025-12-25/ + Thu, 25 Dec 2025 07:14:32 GMT + AI资讯日报 2025/12/25

AI资讯 | 每日早读 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️ | 进群交流🤙

今日摘要

快手KlingAvatar升级,阿里Qwen3克隆音色
+TACO优化机器人推理,TAVID同步生成视听
+谷歌Gemini3推理登顶,DeepSeek联动元宝
+Plane开源替代JIRA,Fabric增强人类能力
+GLM4.7生成网页惊艳,Firecrawl上线Agent
+

产品与功能更新

  1. KlingAvatar2.0 让数字人拥有灵魂。 +快手可灵团队(AI资讯)发布了💃生动的KlingAvatar2.0,数字人演技炸裂。新模型支持(✧∀✧)5分钟长视频,动作流畅不崩坏。通过时空级联框架,画面细节🔍大幅提升。共推理导演系统让🎥多角色互动更精准,情感表达(T_T)超细腻。体验地址(AI资讯)让每个人都能创作。

  2. 阿里开源 Fun-Audio-Chat 交互模型。 +阿里云推出🚀开源语音模型Fun-Audio-Chat(AI资讯),交互体验(≧∇≦)超级自然。它能在低延迟下理解情绪,支持打断和🗣️全双工对话。采用双分辨率架构,推理速度⚡快且成本减半。8B版本性能(👍)超越同级,是打造智能助手的🛠️绝佳选择。

  3. Qwen3 发布音色创造与克隆神器。 +阿里Qwen3系列🔊发布两大语音神器(AI资讯),效果惊艳全球。Voice Design支持用📝自然语言创造独一无二的声音角色。Voice Clone仅需3秒(⏱️)即可复刻音色,支持10种语言(🌍)输出。评测数据显示,其表现力🎯超越了GPT-4o-Audio等顶流模型
    AI资讯:Qwen3语音克隆模型性能对比图

前沿研究

  1. TACO 框架解决具身推理不稳定。 +中国电信TeleAI团队🤖直面VLA模型推理不稳定的痛点。新框架TACO(AI资讯)利用反探索原理,大幅提升🛡️机器人操作成功率。通过耦合伪计数,让模型(🧠)自我验证动作合理性。真实机器人实验中,长周期任务成功率📈提升了25%。

  2. TAVID 实现文本驱动视听生成。 +想要🤖人机对话更逼真?看看TAVID框架(AI资讯)。它实现了👀面部与声音的同步生成,拒绝割裂感。双向映射器让🧩视听模态紧密耦合,交互(🤝)更流畅。

  3. DCL-ENAS 极速搜索神经架构。 +神经架构搜索(🔍)太费算力?DCL-ENAS(AI资讯)来破局。利用双重对比学习,无需标签🏷️也能看懂架构优劣。仅需7.7个GPU日(⚡),就在心律失常分类上超越了📝人工设计模型。

  4. LongVideoAgent 读懂小时级长视频。 +让AI看懂📺小时级长视频,LongVideoAgent(AI资讯)采用多智能体协作。主智能体(👑)指挥定位与视觉提取,分工明确。强化学习加持下,推理路径(🗺️)清晰且高效。

  5. KeyTailor 关键帧提升视频试穿质量。 +视频试穿(👗)总有瑕疵?KeyTailor(AI资讯)利用关键帧驱动注入细节。不仅保留衣服动态(🌬️),背景也📦稳如泰山。配套发布的ViT-HD数据集,让高清试穿(✨)触手可及。

行业展望与社会影响

  1. 谷歌 2025 年的绝地反击战。 +谁说谷歌掉队了?2025年它打了一场(🥊)漂亮的翻身仗(AI资讯)Gemini 3逻辑推理👑登顶,TPU Ironwood算力⚡剑指英伟达。从AlphaFold获诺奖到🏆奥数金牌,科研实力(🔬)毋庸置疑。Genie 3世界模型(🌍)更是引爆了具身智能的想象空间。

  2. DeepSeek 官方点赞腾讯元宝。 +DeepSeek官方(❤️)点赞了腾讯元宝(AI资讯),上演罕见双向奔赴。元宝用户规模(📈)暴涨百倍,成DeepSeek深度思考的最佳搭档。接入腾讯生态后,搜图、听歌🎵一站式搞定,AI正(🚀)融入日常。

开源TOP项目

  1. Plane:JIRA 的开源替代品。 +这是一个🔥替代JIRA的开源项目管理工具(AI资讯),界面(✨)清爽且功能强大。它能轻松追踪Issue和周期,⭐Star数已破41k。

  2. Fabric:AI 增强人类能力框架。 +用AI🧠增强人类能力的开源框架(AI资讯),模块化设计(🧩)非常灵活。它汇集了大量众包提示词,让AI解决问题(✅)更高效,⭐Star数36k。

  3. Rendercv:学术简历生成器。 +学术党(🎓)福音!基于Typst的简历生成器(AI资讯),轻松搞定LaTeX级排版。告别繁琐格式,专注于📄内容本身,⭐Star数8.3k。

  4. Vendure:现代化无头电商平台。 +基于TypeScript构建的🛒现代化电商平台(AI资讯),高度可定制(🛠️)。采用NestJS和GraphQL,开发者体验(😎)极佳,⭐Star数7.2k。

社媒分享

  1. GLM 4.7 网页设计惊艳众人。 +被GLM 4.7生成的🎨网页设计狠狠惊艳(AI资讯),交互(💫)太丝滑了。无论是视差滚动还是高对比度风格,代码(💻)都一次跑通。

  2. Qwen-Image-Edit 获赞最佳开源绘图。 +阿里开源的🎨Qwen绘画模型(AI资讯)被赞是开源最佳。不仅美学提升(🌸),还能写中文和逻辑推理。内置流行LoRA,比Flux Dev(🆚)更懂指令。
    AI资讯:Qwen模型生成的带有中文的插画

  3. Firecrawl 推出免费 Agent 服务。 +爬虫神器🕷️Firecrawl推出了Agent服务(AI资讯),每天免费5次。试着检索论文并存为📊CSV,质量(👌)相当不错。
    AI资讯:Firecrawl Agent检索论文生成表格

  4. AI Skills 与 SubAgent 的爆发。 +AI Skills正在(🔥)爆发,自动刷抖音(AI资讯)找对象都不是梦。SubAgent解决了🧠上下文污染问题,让复杂任务分发(🔀)更高效。
    AI资讯:Claude Skills配置自动任务界面

  5. Apify Actor 助力数据变现。 +将网页变身📚LLM数据的Apify Actor(AI资讯),专为RAG优化。参加百万美金💰挑战赛,开发者(👨‍💻)变现的好机会。
    AI资讯:Apify将网页转化为结构化数据


AI资讯日报语音版

🎙️ 小宇宙📹 抖音
来生小酒馆自媒体账号
小酒馆情报站
]]>
+ +
+ <![CDATA[2025-12-24日刊]]> https://ai.hubtoday.app//2025-12/2025-12-24/ @@ -198,44 +231,5 @@ Claude发布Skills规则,访问网页版↗️ | 进群交流🤙

今日摘要

腾讯混元世界模型1.5上线支持文字图片生成互动世界
-字节Seedance实现100%视听同步已上线即梦豆包
-OpenAI发布FrontierScience基准GPT-5.2奥赛77%
-姚顺雨任腾讯首席AI科学家向刘炽平汇报
-英伟达收购Slurm开发商SchedMD强化算力调度护城河
-

产品与功能更新

  1. 腾讯混元世界模型1.5上线。 -国内首个🎮实时互动体验平台开放体验(AI资讯)了!输入文字或图片就能瞬间生成互动世界,用键鼠或手柄(✧∀✧)自由探索。该模型还首次开源训练体系,从数据到推理部署全覆盖。

  2. Kling 2.6语音控制功能正式发布。 -快影AI📢上线了Voice Control,用你的专属声音创作更具魅力的个性化内容(AI资讯)。官方同步开启创意大赛🏆现金最高1000美金,提交作品就有机会登上首页推荐。
    AI资讯:Kling 2.6语音控制功能宣传图

  3. 字节Seedance 1.5 Pro发布。 -新一代音视频模型实现🎬100%视听同步,角色口型、语调与表演节奏高度拟合。支持多语种方言自然表达,还能执行希区柯克变焦等高难度镜头运动(AI资讯)。已在即梦AI和豆包平台上线。

  4. Meta推出SAM Audio模型。 -继图像分割后,Meta将"🔊分割一切"理念延伸到音频领域。支持文本、视觉和时间跨度三种提示方式,能像抠图(AI资讯)一样精准分离声音。已在Segment Anything Playground开放试用。
    AI资讯:SAM Audio模型声音分离示意图

  5. 小米MiMo大模型对开发者开放。 -小米宣布开放🤖MiMo系列大模型和CarIoT硬件生态。AIoT平台连接设备突破10.4亿,开发者规模达120万(AI资讯)。MiMo-V2-Flash已开源,在Agent测评跻身全球开源模型TOP2。
    AI资讯:小米人车家全生态发布会现场

  6. Meta推出AI听力增强眼镜。 -新款眼镜采用开放式扬声器设计,可以放大👓与你交谈的人的声音。特别适合咖啡馆或繁忙街道等嘈杂环境(AI资讯)使用,让日常交流更轻松。

前沿研究

  1. OpenAI发布FrontierScience基准。 -专为评估专家级科学能力构建,包含物理、化学、生物学数百道原创题目。GPT-5.2在奥赛赛道得分77%,研究赛道🔬25%,均领先其他前沿模型。Gemini 3 Pro在奥赛赛道与GPT-5.2表现相当(AI资讯)

  2. FreeKV框架提升LLM推理效率。 -针对长上下文KV缓存问题,该框架实现算法-系统协同优化。通过投机检索和双缓冲流式召回,达到🚀近无损精度,相比SOTA方法最高提速13倍(AI资讯)

  3. Titans让AI有了真正的记忆力。 -谷歌Jeff Dean点赞的论文,解决了(✧∀✧)AI的"金鱼记忆"问题。短期记忆+长期记忆+持久记忆三种机制各司其职,在200万token超长文本理解任务中准确率96%+,吊打Mamba2的5.4%(AI资讯)

行业展望与社会影响

  1. 姚顺雨出任腾讯首席AI科学家。 -官宣!腾讯升级大模型研发架构,95后明星学者姚顺雨任职"CEO/总裁办公室"首席AI科学家,向刘炽平汇报。同时兼任AI Infra部、大语言模型部负责人,将📈全面强化腾讯大模型研发体系(AI资讯)

  2. 英伟达收购Slurm开发商SchedMD。 -这波低调出手被评价为"护城河又宽了"💪SchedMD开发的Slurm是全球超半数TOP500超算在用的资源调度工具,Meta、Mistral、Thinking Machines都离不开。哪怕用AMD芯片,只要需要算力调度就绕不开英伟达(AI资讯)

  3. AI上下文管理引发隐私争议。 -把全部人生笔记上传给第三方服务器,你放心吗?社区讨论显示,虽然🔥把Obsidian笔记喂给Claude能获得个性化建议,但多数人倾向寻求本地LLM等可控方案(AI资讯)。另有人警告依赖AI摘要会侵蚀真正的知识掌握。

  4. GitHub Actions开始收取平台费。 -自2026年起,私有仓库和自托管runner的调度将按$0.002/分钟计费💸即使算力在用户自己服务器上也要交"税"。小型团队相对受伤更重,社区已开始评估迁往GitLab或Forgejo等替代方案(AI资讯)

  5. AI能否让形式验证成为主流? -讨论焦点在于:规范本身难以形式化,需求又频繁变动。乐观者指出Opus、GPT-5.2等🤖大模型显著加速了证明工程,悲观者则认为文化与经济障碍才是普及的真正阻碍(AI资讯)

开源TOP项目

  1. 摩尔线程开源LiteGS基础库。 -在SIGGRAPH Asia 2025斩获银奖🥈的3DGS重建算法已开源!60秒任务34秒交卷,仅需原版10%训练时间即可达到同等质量。从GPU系统到算法设计全链路优化,代码在GitHub开放(AI资讯)。⭐已引发学术界关注。

  2. 英伟达发布Nemotron 3开源模型。 -MoE架构支持百万token上下文,包含Nano(30B)、Super(100B)、Ultra(500B)三个规模。Nano版已发布,吞吐量比前代🚀提升4倍,被评为同类型中最开放高效的模型(AI资讯)

  3. 小米MiMo-V2-Flash开源发布。 -309B总参数,15B激活,专为极致推理效率自研的MoE大语言模型。代码和Agent能力强💡生成速度快,API限时免费可接入Claude Code、Cursor等工具(AI资讯)。⭐开发者反响热烈。
    AI资讯:小米MiMo-V2-Flash性能对比图

  4. Chatterbox开源TTS系统。 -号称最先进的开源文本转语音系统,已获得⭐15614星标,项目地址resemble-ai/chatterbox(AI资讯)

  5. 微软开源TRELLIS.2图生3D模型。 -4B参数规模,支持图片生成3D模型。在线体验地址已开放,社区反馈效果褒贬不一( ̄▽ ̄)"有人觉得还不如之前版本,模型在Hugging Face发布(AI资讯)
    AI资讯:微软TRELLIS.2生成的3D模型效果图

  6. 美团开源LongCat虚拟人模型。 -类似字节OmniHuman和快手Avatar,支持音频驱动照片生成视频🎤特别适用于主播和MV场景,项目主页和模型已在Hugging Face发布(AI资讯)

社媒分享

  1. Prompt Caching技术深度解读。 -缓存的不是文本是"思维状态"🧠本质是复用KV矩阵,节省约90%Token费用,长文本首字延迟降低85%。实测显示Anthropic手动模式命中率100%(AI资讯),OpenAI自动模式仅50%。
    AI资讯:Prompt Caching技术原理示意图

  2. Gemini 3 Flash已开放使用。 -相比Pro版本速度提升显著,前端效果基本没变(✧∀✧)美学依旧领先其他模型。ZenMux首发目前免费,使用地址点这里(AI资讯)

  3. Vibe Coding时代的护城河思考。 -技术不再是核心竞争力了🤔拿一波流量很容易,但建立护城河需要多花时间思考。有人看到缺陷,有人看到机会(AI资讯),这些机会不是给挑刺的人准备的。

  4. GPT Image 1.5图像能力测试。 -只是单纯的绘画模型,而不是Banana Pro那样的🌍世界模型。社区评价"谷歌这次领先了一代",天气卡片生成效果可参考宝玉的测试(AI资讯)
    AI资讯:GPT Image 1.5生成的城市天气卡片

  5. AI硬件创意Stickerbox走红。 -语音输入→AI自动绘图→即时打印贴纸🖨️帮孩子把脑海里的故事变成现实!儿童安全模式无屏幕交互,这个逻辑马上会迁移到3D打印领域(AI资讯)


AI资讯日报语音版

🎙️ 小宇宙📹 抖音
来生小酒馆自媒体账号
小酒馆情报站
]]> - -
- \ No newline at end of file