diff --git a/rss.xml b/rss.xml
index 122d19d..ccb290f 100644
--- a/rss.xml
+++ b/rss.xml
@@ -5,9 +5,48 @@
https://ai.hubtoday.app/
腾讯混元世界模型1.5上线。
+国内首个🎮实时互动体验平台开放体验(AI资讯)了!输入文字或图片就能瞬间生成互动世界,用键鼠或手柄(✧∀✧)自由探索。该模型还首次开源训练体系,从数据到推理部署全覆盖。 Kling 2.6语音控制功能正式发布。
+快影AI📢上线了Voice Control,用你的专属声音创作更具魅力的个性化内容(AI资讯)。官方同步开启创意大赛🏆现金最高1000美金,提交作品就有机会登上首页推荐。 字节Seedance 1.5 Pro发布。
+新一代音视频模型实现🎬100%视听同步,角色口型、语调与表演节奏高度拟合。支持多语种方言自然表达,还能执行希区柯克变焦等高难度镜头运动(AI资讯)。已在即梦AI和豆包平台上线。 Meta推出SAM Audio模型。
+继图像分割后,Meta将"🔊分割一切"理念延伸到音频领域。支持文本、视觉和时间跨度三种提示方式,能像抠图(AI资讯)一样精准分离声音。已在Segment Anything Playground开放试用。 小米MiMo大模型对开发者开放。
+小米宣布开放🤖MiMo系列大模型和CarIoT硬件生态。AIoT平台连接设备突破10.4亿,开发者规模达120万(AI资讯)。MiMo-V2-Flash已开源,在Agent测评跻身全球开源模型TOP2。 Meta推出AI听力增强眼镜。
+新款眼镜采用开放式扬声器设计,可以放大👓与你交谈的人的声音。特别适合咖啡馆或繁忙街道等嘈杂环境(AI资讯)使用,让日常交流更轻松。 OpenAI发布FrontierScience基准。
+专为评估专家级科学能力构建,包含物理、化学、生物学数百道原创题目。GPT-5.2在奥赛赛道得分77%,研究赛道🔬25%,均领先其他前沿模型。Gemini 3 Pro在奥赛赛道与GPT-5.2表现相当(AI资讯)。 FreeKV框架提升LLM推理效率。
+针对长上下文KV缓存问题,该框架实现算法-系统协同优化。通过投机检索和双缓冲流式召回,达到🚀近无损精度,相比SOTA方法最高提速13倍(AI资讯)。 Titans让AI有了真正的记忆力。
+谷歌Jeff Dean点赞的论文,解决了(✧∀✧)AI的"金鱼记忆"问题。短期记忆+长期记忆+持久记忆三种机制各司其职,在200万token超长文本理解任务中准确率96%+,吊打Mamba2的5.4%(AI资讯)。 姚顺雨出任腾讯首席AI科学家。
+官宣!腾讯升级大模型研发架构,95后明星学者姚顺雨任职"CEO/总裁办公室"首席AI科学家,向刘炽平汇报。同时兼任AI Infra部、大语言模型部负责人,将📈全面强化腾讯大模型研发体系(AI资讯)。 英伟达收购Slurm开发商SchedMD。
+这波低调出手被评价为"护城河又宽了"💪SchedMD开发的Slurm是全球超半数TOP500超算在用的资源调度工具,Meta、Mistral、Thinking Machines都离不开。哪怕用AMD芯片,只要需要算力调度就绕不开英伟达(AI资讯)。 AI上下文管理引发隐私争议。
+把全部人生笔记上传给第三方服务器,你放心吗?社区讨论显示,虽然🔥把Obsidian笔记喂给Claude能获得个性化建议,但多数人倾向寻求本地LLM等可控方案(AI资讯)。另有人警告依赖AI摘要会侵蚀真正的知识掌握。 GitHub Actions开始收取平台费。
+自2026年起,私有仓库和自托管runner的调度将按$0.002/分钟计费💸即使算力在用户自己服务器上也要交"税"。小型团队相对受伤更重,社区已开始评估迁往GitLab或Forgejo等替代方案(AI资讯)。 AI能否让形式验证成为主流?
+讨论焦点在于:规范本身难以形式化,需求又频繁变动。乐观者指出Opus、GPT-5.2等🤖大模型显著加速了证明工程,悲观者则认为文化与经济障碍才是普及的真正阻碍(AI资讯)。 摩尔线程开源LiteGS基础库。
+在SIGGRAPH Asia 2025斩获银奖🥈的3DGS重建算法已开源!60秒任务34秒交卷,仅需原版10%训练时间即可达到同等质量。从GPU系统到算法设计全链路优化,代码在GitHub开放(AI资讯)。⭐已引发学术界关注。 英伟达发布Nemotron 3开源模型。
+MoE架构支持百万token上下文,包含Nano(30B)、Super(100B)、Ultra(500B)三个规模。Nano版已发布,吞吐量比前代🚀提升4倍,被评为同类型中最开放高效的模型(AI资讯)。 小米MiMo-V2-Flash开源发布。
+309B总参数,15B激活,专为极致推理效率自研的MoE大语言模型。代码和Agent能力强💡生成速度快,API限时免费可接入Claude Code、Cursor等工具(AI资讯)。⭐开发者反响热烈。 Chatterbox开源TTS系统。
+号称最先进的开源文本转语音系统,已获得⭐15614星标,项目地址resemble-ai/chatterbox(AI资讯)。 微软开源TRELLIS.2图生3D模型。
+4B参数规模,支持图片生成3D模型。在线体验地址已开放,社区反馈效果褒贬不一( ̄▽ ̄)"有人觉得还不如之前版本,模型在Hugging Face发布(AI资讯)。 美团开源LongCat虚拟人模型。
+类似字节OmniHuman和快手Avatar,支持音频驱动照片生成视频🎤特别适用于主播和MV场景,项目主页和模型已在Hugging Face发布(AI资讯)。 Prompt Caching技术深度解读。
+缓存的不是文本是"思维状态"🧠本质是复用KV矩阵,节省约90%Token费用,长文本首字延迟降低85%。实测显示Anthropic手动模式命中率100%(AI资讯),OpenAI自动模式仅50%。 Gemini 3 Flash已开放使用。
+相比Pro版本速度提升显著,前端效果基本没变(✧∀✧)美学依旧领先其他模型。ZenMux首发目前免费,使用地址点这里(AI资讯)。 Vibe Coding时代的护城河思考。
+技术不再是核心竞争力了🤔拿一波流量很容易,但建立护城河需要多花时间思考。有人看到缺陷,有人看到机会(AI资讯),这些机会不是给挑刺的人准备的。 GPT Image 1.5图像能力测试。
+只是单纯的绘画模型,而不是Banana Pro那样的🌍世界模型。社区评价"谷歌这次领先了一代",天气卡片生成效果可参考宝玉的测试(AI资讯)。 AI硬件创意Stickerbox走红。
+语音输入→AI自动绘图→即时打印贴纸🖨️帮孩子把脑海里的故事变成现实!儿童安全模式无屏幕交互,这个逻辑马上会迁移到3D打印领域(AI资讯)。AI资讯 | 每日早读 | 全网数据聚合 | 前沿科学探索 | 行业自由发声 | 开源创新力量 | AI与人类未来 | 访问网页版↗️ | 进群交流🤙今日摘要
腾讯混元世界模型1.5上线支持文字图片生成互动世界
+字节Seedance实现100%视听同步已上线即梦豆包
+OpenAI发布FrontierScience基准GPT-5.2奥赛77%
+姚顺雨任腾讯首席AI科学家向刘炽平汇报
+英伟达收购Slurm开发商SchedMD强化算力调度护城河
+产品与功能更新



前沿研究
行业展望与社会影响
开源TOP项目


社媒分享


AI资讯日报语音版
]]>🎙️ 小宇宙 📹 抖音 来生小酒馆 自媒体账号 

OpenAI泄露Olive Oil Cake等新模型代号疑为GPT-5.2真身12月11日或发布
-微软Excel网页版启用AI智能体模式支持自然语言建模明年1月扩展桌面端
-马斯克xAI推出Halftime工具可在电影中实时植入品牌广告引发版权争议
-Qwen-Image-i2L仅需单张图片即可生成风格化LoRA文件四种版本开源
-AutoGLM全面开源9B模型支持50+中文App操作定义AI手机安卓时刻
-OpenAI紧急端出「下午茶」,新模型泄露。 -Notion平台意外曝光🍰神秘内部代号Olive Oil Cake(AI资讯),疑为GPT-5.2真身。同时,Chestnut和Hazelnut(AI资讯)两款下一代图像模型也浮出水面(✧∀✧),告别黄调滤镜,细节暴增。市场押注12月11日发布,旨在阻击🔥谷歌Gemini 3。
微软Excel网页版启用智能体模式。 -Microsoft365商业用户现可体验🤖AI智能体模式(来源:AI资讯日报)。该模式支持自然语言指令,自主完成假设分析、预算建模。金融建模场景下,AI推理逻辑全程透明(✧∀✧)。明年1月将扩展至桌面端,个人版用户同步开放权限。
马斯克xAI推出Halftime工具,电影植入广告。 -xAI新工具可在《律政英雄》等剧情中实时植入品牌广告(AI资讯),角色突然举起🥤可口可乐。观众可通过"了解更多"按钮跳转产品页,查看完毕后广告消失🚀。该技术由滑铁卢大学学生开发,版权问题尚未明确,引发业界争议。
豆包手机助手技术揭秘,00后工程师深度测试。
-大模型实习生在小红书发布千字实测(AI资讯),拆解豆包的混合感知路由与OS级虚拟化。标准模式响应低于500ms⚡,Pro模式具备自我反思能力。测试证实,系统通过任务层级隔离(✧∀✧)物理保障隐私安全,未读取物理屏幕流。
Qwen-Image-i2L:单张图片即可生成LoRA模型。
-DiffSynth-Studio团队发布Qwen-Image-i2L(AI资讯),仅需一张图片🎨即可自动生成风格化LoRA文件。模型提供四种版本:Precise定位精准、Stylish强调画风、Realism还原真实、Balanced通用型。开源协议MIT+Apache-2.0,支持离线运行⚡,可直接集成至Stable Diffusion等模型。
具身思维树架构:融合物理仿真与VLM推理。 -论文Embodied Tree of Thoughts(AI资讯)提出EToT框架,将操作规划建模为树搜索⚡。系统通过先验分支生成候选路径,反思分支利用VLM诊断失败并修正。物理仿真器充当具身世界模型🚀,确保计划符合刚体动力学与碰撞约束(✧∀✧)。长期任务中显著优于基线方法。
强化学习探究技能习得中的反馈角色。 -研究使用强化学习探索反馈机制(AI资讯),通过RL智能体控制水槽中旋转圆柱体的阻力🌊。实验发现:高维流场反馈可快速发现高性能策略⚡,但重放动作序列时无需反馈仍保持性能。无反馈训练在阻力最大化任务中失败,但阻力最小化仍成功(✧∀✧),揭示学习条件的复杂性。
单张图片生成完整3D场景,自我进化框架。 -论文EvoScene(AI资讯)提出免训练框架,通过三阶段迭代重建🎨3D场景。系统结合3D生成模型的几何推理与视频生成模型的视觉知识,逐步改进结构与外观🚀。实验显示,EvoScene在几何稳定性、视图一致纹理方面优于基线,生成即用3D网格(✧∀✧)。
空中视觉语言导航统一框架,仅需单目RGB。 -论文Aerial VLN(AI资讯)提出无人机导航框架,仅依赖自我中心单目RGB🚁与自然语言指令。模型通过提示引导多任务学习⚡,联合优化空间感知、轨迹推理与动作预测。关键帧选择策略减少视觉冗余,动作合并机制缓解长尾监督不平衡(✧∀✧)。基准测试中显著优于RGB-only基线。
欧盟正式调查谷歌AI摘要内容使用权。 -欧盟委员会启动调查🔍,审查谷歌AI概览功能(AI资讯)是否未经许可使用网站内容。调查聚焦YouTube视频生成答案及网络出版商内容补偿问题⚡。欧盟指控谷歌凭借流量控制权施加不公平条款,限制竞争对手训练AI模型(✧∀✧)。谷歌回应称此举或扼杀创新。
春晚赞助战:宇树与智元竞价过亿。 -2026年马年春晚成为🤖具身智能公司竞逐高地(AI资讯)。知情人士透露,智元机器人报价6000万元,宇树科技直接提至1亿元🔥。智元回应"不是真的",但业内人士称多家公司仍在争抢⚡。最终赞助商需综合考量品牌形象与发展因素(✧∀✧),竞争态势尤为激烈。
Beyond Vibe Coding指南:纠正AI辅助开发误区。
-Google工程负责人Addy Osmani发布新书(AI资讯),批判"Vibe Coding"🚀只完成70%工作,剩余30%需工程底蕴。核心方法论包括:先规划后编码、上下文工程替代提示词工程⚡、CLI智能体与多智能体编排。未来开发者需从编码者转型为决策人(✧∀✧),专注精准描述意图。
小米招聘AI教育岗位,进军K12市场。
-小米集团发布多个AI教育岗位(AI资讯),包括产品经理(26K-50K)与商务经理。岗位聚焦"人车家"生态,为手机、平板等终端提供🎓个性化学习体验。今年7月REDMI Pad2已预装教育中心,内置15万门同步课程与AI作业辅导功能🚀。
AutoGLM全面开源,AI原生手机标杆。
-智谱AutoGLM项目(AI资讯)正式开源⭐4.9k🚀,包含Phone Agent框架与9B模型。系统采用ADB控制、VLM视觉理解、智能规划三大技术⚡,支持50+中文App操作。MIT协议开源,可离线运行,无隐私泄露风险(✧∀✧)。业界认为定义了AI手机"安卓时刻"。
AGENTS.md格式:编码智能体统一标准。 -开源项目AGENTS.md(AI资讯)⭐9.3k发布,提供简单开放格式🚀指导AI编码智能体。该标准旨在统一智能体行为描述,降低开发门槛⚡。支持多种编程语言,社区贡献活跃(✧∀✧)。项目已集成至主流AI开发工具链。
Google ADK示例智能体集合,开发模板库。 -Google发布ADK-samples项目(AI资讯)⭐7.2k🚀,包含多种智能体构建示例。涵盖任务规划、工具调用、多智能体协作等场景⚡。开发者可直接复用模板,加速AI应用落地(✧∀✧)。项目持续更新,支持最新ADK特性。
微软ML-For-Beginners:经典机器学习课程。 -微软开源ML-For-Beginners(AI资讯)⭐81.1k项目🚀,提供12周26课52测验系统化学习路径。课程覆盖监督学习、无监督学习、强化学习等经典算法⚡。支持多语言文档,适合零基础入门(✧∀✧)。社区活跃,全球学习者广泛使用。
Reddit热议:麦当劳AI广告翻车启示录。
-荷兰麦当劳推出全AI制作圣诞广告🎄,主题为"最糟糕的圣诞季",遭大规模抵制后下架。来源:(AI资讯)显示,代理商TBWA承认失败🔥。网友引用《星球大战》台词讽刺:"会说话≠聪明"⚡。事件印证技术只是放大人类天才或愚蠢的工具(✧∀✧)。
Reddit讨论:AI朋友为何总显得生硬。 -用户在Reddit(AI资讯)分享开发经验🚀,认为多数AI伴侣要么过于情绪化要么太临床。作者尝试构建"不修复你"的AI朋友⚡,能自然处理玩笑、讽刺、深夜胡思乱想。征集社区意见:音调、记忆、不完美性哪个最重要(✧∀✧)?
OpenAI聘请Slack CEO担任首席营收官。Wired报道(AI资讯)🚀,OpenAI任命Slack CEO为新任CRO。此举被视为加强商业化能力的关键信号⚡,Slack在企业协作市场经验丰富。社区猜测OpenAI将强化B端产品策略(✧∀✧),与Gemini等竞品争夺企业客户。
即刻分享:Gemini制作历史事件海报新玩法。
-用户在即刻(AI资讯)展示🎨Nano Banana Pro生成能力,制作SpaceX猎鹰重型助推器着陆、梅西夺冠等历史瞬间海报🚀。提示词要求博物馆级别3D微缩场景⚡,背景使用淡水墨纹理,底部自动检索事件金句。网友赞叹"可将偶像高光时刻画出来"(✧∀✧)。
Reddit工程实践:保持LLM上下文质量的编辑技巧。Reddit帖子(AI资讯)分享🚀"时间旅行对话"技巧:长对话出现不良回复时⚡,编辑原始提示词避免错误传播。作者称此法特别适用图像生成(✧∀✧),防止错误缩进等问题污染上下文。提醒:编辑选项有时不可用,原因未明。
| 🎙️ 小宇宙 | 📹 抖音 |
|---|---|
| 来生小酒馆 | 自媒体账号 |
![]() | ![]() |