update
This commit is contained in:
@@ -1,117 +1,117 @@
|
||||
## AI资讯日报 2025/12/18
|
||||
|
||||
> `AI资讯` | `每日早读` | `全网数据聚合` | `前沿科学探索` | `行业自由发声` | `开源创新力量` | `AI与人类未来` | [访问网页版↗️](https://ai.hubtoday.app/) | [进群交流🤙](https://source.hubtoday.app/logo/wechat-qun.jpg)
|
||||
|
||||
|
||||
|
||||
### **今日摘要**
|
||||
|
||||
```
|
||||
腾讯混元世界模型1.5上线支持文字图片生成互动世界
|
||||
字节Seedance实现100%视听同步已上线即梦豆包
|
||||
OpenAI发布FrontierScience基准GPT-5.2奥赛77%
|
||||
姚顺雨任腾讯首席AI科学家向刘炽平汇报
|
||||
英伟达收购Slurm开发商SchedMD强化算力调度护城河
|
||||
```
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
### 产品与功能更新
|
||||
|
||||
1. **腾讯混元世界模型1.5上线。**
|
||||
国内首个🎮实时互动体验平台[开放体验(AI资讯)](https://3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay)了!输入文字或图片就能瞬间生成互动世界,用键鼠或手柄(✧∀✧)自由探索。该模型还**首次开源训练体系**,从数据到推理部署全覆盖。<br/><br/>
|
||||
|
||||
2. **Kling 2.6语音控制功能正式发布。**
|
||||
快影AI📢上线了Voice Control,用你的专属声音创作更具魅力的[个性化内容(AI资讯)](https://forms.gle/wipMhRUgP8WfHDrw9)。官方同步开启创意大赛🏆现金最高1000美金,提交作品就有机会登上首页推荐。<br/><br/>
|
||||
|
||||
3. **字节Seedance 1.5 Pro发布。**
|
||||
新一代音视频模型实现🎬100%视听同步,角色口型、语调与表演节奏高度拟合。支持多语种方言自然表达,还能执行希区柯克变焦等高难度[镜头运动(AI资讯)](https://www.aibase.com/zh/news/23764)。已在即梦AI和豆包平台上线。<br/><video src="https://upload.chinaz.com/video/2025/1217/6390156849466857607546185.mp4"></video><br/>
|
||||
|
||||
4. **Meta推出SAM Audio模型。**
|
||||
继图像分割后,Meta将"🔊分割一切"理念延伸到音频领域。支持文本、视觉和时间跨度三种提示方式,能像[抠图(AI资讯)](https://ai.meta.com/blog/sam-audio/)一样精准分离声音。已在Segment Anything Playground开放试用。<br/><br/>
|
||||
|
||||
5. **小米MiMo大模型对开发者开放。**
|
||||
小米宣布开放🤖MiMo系列大模型和CarIoT硬件生态。AIoT平台连接设备突破**10.4亿**,开发者规模达[120万(AI资讯)](https://www.qbitai.com/2025/12/361460.html)。MiMo-V2-Flash已开源,在Agent测评跻身全球开源模型TOP2。<br/><br/>
|
||||
|
||||
6. **Meta推出AI听力增强眼镜。**
|
||||
新款眼镜采用开放式扬声器设计,可以放大👓与你交谈的人的声音。特别适合咖啡馆或繁忙街道等[嘈杂环境(AI资讯)](https://www.aibase.com/zh/news/23763)使用,让日常交流更轻松。<br/><br/>
|
||||
|
||||
### 前沿研究
|
||||
|
||||
1. **OpenAI发布FrontierScience基准。**
|
||||
专为评估专家级科学能力构建,包含物理、化学、生物学数百道原创题目。GPT-5.2在奥赛赛道得分**77%**,研究赛道🔬25%,均领先其他前沿模型。Gemini 3 Pro在奥赛赛道与GPT-5.2[表现相当(AI资讯)](https://cdn.openai.com/pdf/2fcd284c-b468-4c21-8ee0-7a783933efcc/frontierscience-paper.pdf)。<br/><br/>
|
||||
|
||||
2. **FreeKV框架提升LLM推理效率。**
|
||||
针对长上下文KV缓存问题,该框架实现算法-系统协同优化。通过投机检索和双缓冲流式召回,达到🚀近无损精度,相比SOTA方法[最高提速13倍(AI资讯)](https://arxiv.org/abs/2505.13109)。<br/>
|
||||
|
||||
3. **Titans让AI有了真正的记忆力。**
|
||||
谷歌Jeff Dean点赞的论文,解决了(✧∀✧)AI的"金鱼记忆"问题。短期记忆+长期记忆+持久记忆三种机制各司其职,在**200万token**超长文本理解任务中准确率96%+,吊打[Mamba2的5.4%(AI资讯)](https://arxiv.org/abs/2501.00663)。<br/>
|
||||
|
||||
### 行业展望与社会影响
|
||||
|
||||
1. **姚顺雨出任腾讯首席AI科学家。**
|
||||
官宣!腾讯升级大模型研发架构,95后明星学者姚顺雨任职"CEO/总裁办公室"首席AI科学家,向刘炽平汇报。同时兼任AI Infra部、大语言模型部负责人,将📈全面强化腾讯大模型[研发体系(AI资讯)](https://www.jiqizhixin.com/articles/2025-12-17-17)。<br/><br/>
|
||||
|
||||
2. **英伟达收购Slurm开发商SchedMD。**
|
||||
这波低调出手被评价为"护城河又宽了"💪SchedMD开发的Slurm是全球超半数TOP500超算在用的资源调度工具,Meta、Mistral、Thinking Machines都离不开。哪怕用AMD芯片,只要需要算力调度就[绕不开英伟达(AI资讯)](https://blogs.nvidia.com/blog/nvidia-acquires-schedmd/)。<br/><br/>
|
||||
|
||||
3. **AI上下文管理引发隐私争议。**
|
||||
把全部人生笔记上传给第三方服务器,你放心吗?社区讨论显示,虽然🔥把Obsidian笔记喂给Claude能获得个性化建议,但多数人倾向寻求本地LLM等[可控方案(AI资讯)](https://newshacker.me/story?id=46299552)。另有人警告依赖AI摘要会侵蚀真正的知识掌握。<br/>
|
||||
|
||||
4. **GitHub Actions开始收取平台费。**
|
||||
自2026年起,私有仓库和自托管runner的调度将按$0.002/分钟计费💸即使算力在用户自己服务器上也要交"税"。小型团队相对受伤更重,社区已开始评估迁往GitLab或[Forgejo等替代方案(AI资讯)](https://newshacker.me/story?id=46291500)。<br/>
|
||||
|
||||
5. **AI能否让形式验证成为主流?**
|
||||
讨论焦点在于:规范本身难以形式化,需求又频繁变动。乐观者指出Opus、GPT-5.2等🤖大模型显著加速了证明工程,悲观者则认为文化与经济障碍才是[普及的真正阻碍(AI资讯)](https://newshacker.me/story?id=46294574)。<br/>
|
||||
|
||||
### 开源TOP项目
|
||||
|
||||
1. **摩尔线程开源LiteGS基础库。**
|
||||
在SIGGRAPH Asia 2025斩获银奖🥈的3DGS重建算法已开源!60秒任务**34秒交卷**,仅需原版10%训练时间即可达到同等质量。从GPU系统到算法设计全链路优化,代码在[GitHub开放(AI资讯)](https://github.com/MooreThreads/LiteGS)。⭐已引发学术界关注。<br/><br/>
|
||||
|
||||
2. **英伟达发布Nemotron 3开源模型。**
|
||||
MoE架构支持百万token上下文,包含Nano(30B)、Super(100B)、Ultra(500B)三个规模。Nano版已发布,吞吐量比前代🚀提升4倍,被评为同类型中[最开放高效的模型(AI资讯)](https://nvidianews.nvidia.com/news/nvidia-debuts-nemotron-3-family-of-open-models)。<br/><br/>
|
||||
|
||||
3. **小米MiMo-V2-Flash开源发布。**
|
||||
309B总参数,15B激活,专为极致推理效率自研的MoE大语言模型。代码和Agent能力强💡生成速度快,API限时免费可接入Claude Code、[Cursor等工具(AI资讯)](http://platform.xiaomimimo.com/#/docs/welcome)。⭐开发者反响热烈。<br/><br/>
|
||||
|
||||
4. **Chatterbox开源TTS系统。**
|
||||
号称最先进的开源文本转语音系统,已获得⭐15614星标,项目地址[resemble-ai/chatterbox(AI资讯)](https://github.com/resemble-ai/chatterbox)。<br/>
|
||||
|
||||
5. **微软开源TRELLIS.2图生3D模型。**
|
||||
4B参数规模,支持图片生成3D模型。在线体验地址已开放,社区反馈效果褒贬不一( ̄▽ ̄)"有人觉得还不如之前版本,模型在[Hugging Face发布(AI资讯)](https://huggingface.co/microsoft/TRELLIS.2-4B)。<br/><br/>
|
||||
|
||||
6. **美团开源LongCat虚拟人模型。**
|
||||
类似字节OmniHuman和快手Avatar,支持音频驱动照片生成视频🎤特别适用于主播和MV场景,项目主页和模型已在[Hugging Face发布(AI资讯)](https://huggingface.co/meituan-longcat/LongCat-Video-Avatar)。<br/><video src="https://video.twimg.com/amplify_video/2001207859737223168/vid/avc1/1216x768/vvKHUCqB7buvDb3d.mp4?tag=21"></video><br/>
|
||||
|
||||
### 社媒分享
|
||||
|
||||
1. **Prompt Caching技术深度解读。**
|
||||
缓存的不是文本是"思维状态"🧠本质是复用KV矩阵,节省约90%Token费用,长文本首字延迟降低85%。实测显示Anthropic手动模式[命中率100%(AI资讯)](https://ngrok.com/blog/prompt-caching),OpenAI自动模式仅50%。<br/><br/>
|
||||
|
||||
2. **Gemini 3 Flash已开放使用。**
|
||||
相比Pro版本速度提升显著,前端效果基本没变(✧∀✧)美学依旧领先其他模型。ZenMux首发目前免费,[使用地址点这里(AI资讯)](https://zenmux.ai/google/gemini-3-flash-preview-free?utm_source=twitter-zt)。<br/><video src="https://video.twimg.com/amplify_video/2001220765950394368/vid/avc1/3016x1576/EcxVvTU1YALmMAyw.mp4?tag=21"></video><br/>
|
||||
|
||||
3. **Vibe Coding时代的护城河思考。**
|
||||
技术不再是核心竞争力了🤔拿一波流量很容易,但建立护城河需要多花时间思考。有人看到缺陷,有人[看到机会(AI资讯)](https://x.com/op7418/status/2001230834192540085),这些机会不是给挑刺的人准备的。<br/>
|
||||
|
||||
4. **GPT Image 1.5图像能力测试。**
|
||||
只是单纯的绘画模型,而不是Banana Pro那样的🌍世界模型。社区评价"谷歌这次领先了一代",天气卡片生成效果可参考[宝玉的测试(AI资讯)](https://x.com/dotey/status/2001164443284054049)。<br/><br/>
|
||||
|
||||
5. **AI硬件创意Stickerbox走红。**
|
||||
语音输入→AI自动绘图→即时打印贴纸🖨️帮孩子把脑海里的故事变成现实!儿童安全模式无屏幕交互,这个逻辑马上会迁移到[3D打印领域(AI资讯)](https://x.com/Yangyixxxx/status/2001194271966220767)。<br/><video src="https://video.twimg.com/amplify_video/2000830775437221894/vid/avc1/1920x1080/kx8N5lm5BKx4Om00.mp4?tag=21"></video><br/>
|
||||
|
||||
---
|
||||
|
||||
## **AI资讯日报语音版**
|
||||
|
||||
| 🎙️ **小宇宙** | 📹 **抖音** |
|
||||
| --- | --- |
|
||||
| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [自媒体账号](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
|
||||
|  |  |
|
||||
|
||||
|
||||
|
||||
## AI资讯日报 2025/12/18
|
||||
|
||||
> `AI资讯` | `每日早读` | `全网数据聚合` | `前沿科学探索` | `行业自由发声` | `开源创新力量` | `AI与人类未来` | [访问网页版↗️](https://ai.hubtoday.app/) | [进群交流🤙](https://source.hubtoday.app/logo/wechat-qun.jpg)
|
||||
|
||||
|
||||
|
||||
### **今日摘要**
|
||||
|
||||
```
|
||||
腾讯混元世界模型1.5上线支持文字图片生成互动世界
|
||||
字节Seedance实现100%视听同步已上线即梦豆包
|
||||
OpenAI发布FrontierScience基准GPT-5.2奥赛77%
|
||||
姚顺雨任腾讯首席AI科学家向刘炽平汇报
|
||||
英伟达收购Slurm开发商SchedMD强化算力调度护城河
|
||||
```
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
### 产品与功能更新
|
||||
|
||||
1. **腾讯混元世界模型1.5上线。**
|
||||
国内首个🎮实时互动体验平台[开放体验(AI资讯)](https://3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay)了!输入文字或图片就能瞬间生成互动世界,用键鼠或手柄(✧∀✧)自由探索。该模型还**首次开源训练体系**,从数据到推理部署全覆盖。
|
||||
|
||||
2. **Kling 2.6语音控制功能正式发布。**
|
||||
快影AI📢上线了Voice Control,用你的专属声音创作更具魅力的[个性化内容(AI资讯)](https://forms.gle/wipMhRUgP8WfHDrw9)。官方同步开启创意大赛🏆现金最高1000美金,提交作品就有机会登上首页推荐。<br/><br/>
|
||||
|
||||
3. **字节Seedance 1.5 Pro发布。**
|
||||
新一代音视频模型实现🎬100%视听同步,角色口型、语调与表演节奏高度拟合。支持多语种方言自然表达,还能执行希区柯克变焦等高难度[镜头运动(AI资讯)](https://www.aibase.com/zh/news/23764)。已在即梦AI和豆包平台上线。<br/></video><br/>
|
||||
|
||||
4. **Meta推出SAM Audio模型。**
|
||||
继图像分割后,Meta将"🔊分割一切"理念延伸到音频领域。支持文本、视觉和时间跨度三种提示方式,能像[抠图(AI资讯)](https://ai.meta.com/blog/sam-audio/)一样精准分离声音。已在Segment Anything Playground开放试用。<br/><br/>
|
||||
|
||||
5. **小米MiMo大模型对开发者开放。**
|
||||
小米宣布开放🤖MiMo系列大模型和CarIoT硬件生态。AIoT平台连接设备突破**10.4亿**,开发者规模达[120万(AI资讯)](https://www.qbitai.com/2025/12/361460.html)。MiMo-V2-Flash已开源,在Agent测评跻身全球开源模型TOP2。<br/><br/>
|
||||
|
||||
6. **Meta推出AI听力增强眼镜。**
|
||||
新款眼镜采用开放式扬声器设计,可以放大👓与你交谈的人的声音。特别适合咖啡馆或繁忙街道等[嘈杂环境(AI资讯)](https://www.aibase.com/zh/news/23763)使用,让日常交流更轻松。
|
||||
|
||||
### 前沿研究
|
||||
|
||||
1. **OpenAI发布FrontierScience基准。**
|
||||
专为评估专家级科学能力构建,包含物理、化学、生物学数百道原创题目。GPT-5.2在奥赛赛道得分**77%**,研究赛道🔬25%,均领先其他前沿模型。Gemini 3 Pro在奥赛赛道与GPT-5.2[表现相当(AI资讯)](https://cdn.openai.com/pdf/2fcd284c-b468-4c21-8ee0-7a783933efcc/frontierscience-paper.pdf)。
|
||||
|
||||
2. **FreeKV框架提升LLM推理效率。**
|
||||
针对长上下文KV缓存问题,该框架实现算法-系统协同优化。通过投机检索和双缓冲流式召回,达到🚀近无损精度,相比SOTA方法[最高提速13倍(AI资讯)](https://arxiv.org/abs/2505.13109)。<br/>
|
||||
|
||||
3. **Titans让AI有了真正的记忆力。**
|
||||
谷歌Jeff Dean点赞的论文,解决了(✧∀✧)AI的"金鱼记忆"问题。短期记忆+长期记忆+持久记忆三种机制各司其职,在**200万token**超长文本理解任务中准确率96%+,吊打[Mamba2的5.4%(AI资讯)](https://arxiv.org/abs/2501.00663)。<br/>
|
||||
|
||||
### 行业展望与社会影响
|
||||
|
||||
1. **姚顺雨出任腾讯首席AI科学家。**
|
||||
官宣!腾讯升级大模型研发架构,95后明星学者姚顺雨任职"CEO/总裁办公室"首席AI科学家,向刘炽平汇报。同时兼任AI Infra部、大语言模型部负责人,将📈全面强化腾讯大模型[研发体系(AI资讯)](https://www.jiqizhixin.com/articles/2025-12-17-17)。
|
||||
|
||||
2. **英伟达收购Slurm开发商SchedMD。**
|
||||
这波低调出手被评价为"护城河又宽了"💪SchedMD开发的Slurm是全球超半数TOP500超算在用的资源调度工具,Meta、Mistral、Thinking Machines都离不开。哪怕用AMD芯片,只要需要算力调度就[绕不开英伟达(AI资讯)](https://blogs.nvidia.com/blog/nvidia-acquires-schedmd/)。
|
||||
|
||||
3. **AI上下文管理引发隐私争议。**
|
||||
把全部人生笔记上传给第三方服务器,你放心吗?社区讨论显示,虽然🔥把Obsidian笔记喂给Claude能获得个性化建议,但多数人倾向寻求本地LLM等[可控方案(AI资讯)](https://newshacker.me/story?id=46299552)。另有人警告依赖AI摘要会侵蚀真正的知识掌握。<br/>
|
||||
|
||||
4. **GitHub Actions开始收取平台费。**
|
||||
自2026年起,私有仓库和自托管runner的调度将按$0.002/分钟计费💸即使算力在用户自己服务器上也要交"税"。小型团队相对受伤更重,社区已开始评估迁往GitLab或[Forgejo等替代方案(AI资讯)](https://newshacker.me/story?id=46291500)。<br/>
|
||||
|
||||
5. **AI能否让形式验证成为主流?**
|
||||
讨论焦点在于:规范本身难以形式化,需求又频繁变动。乐观者指出Opus、GPT-5.2等🤖大模型显著加速了证明工程,悲观者则认为文化与经济障碍才是[普及的真正阻碍(AI资讯)](https://newshacker.me/story?id=46294574)。<br/>
|
||||
|
||||
### 开源TOP项目
|
||||
|
||||
1. **摩尔线程开源LiteGS基础库。**
|
||||
在SIGGRAPH Asia 2025斩获银奖🥈的3DGS重建算法已开源!60秒任务**34秒交卷**,仅需原版10%训练时间即可达到同等质量。从GPU系统到算法设计全链路优化,代码在[GitHub开放(AI资讯)](https://github.com/MooreThreads/LiteGS)。⭐已引发学术界关注。
|
||||
|
||||
2. **英伟达发布Nemotron 3开源模型。**
|
||||
MoE架构支持百万token上下文,包含Nano(30B)、Super(100B)、Ultra(500B)三个规模。Nano版已发布,吞吐量比前代🚀提升4倍,被评为同类型中[最开放高效的模型(AI资讯)](https://nvidianews.nvidia.com/news/nvidia-debuts-nemotron-3-family-of-open-models)。
|
||||
|
||||
3. **小米MiMo-V2-Flash开源发布。**
|
||||
309B总参数,15B激活,专为极致推理效率自研的MoE大语言模型。代码和Agent能力强💡生成速度快,API限时免费可接入Claude Code、[Cursor等工具(AI资讯)](http://platform.xiaomimimo.com/#/docs/welcome)。⭐开发者反响热烈。<br/><br/>
|
||||
|
||||
4. **Chatterbox开源TTS系统。**
|
||||
号称最先进的开源文本转语音系统,已获得⭐15614星标,项目地址[resemble-ai/chatterbox(AI资讯)](https://github.com/resemble-ai/chatterbox)。<br/>
|
||||
|
||||
5. **微软开源TRELLIS.2图生3D模型。**
|
||||
4B参数规模,支持图片生成3D模型。在线体验地址已开放,社区反馈效果褒贬不一( ̄▽ ̄)"有人觉得还不如之前版本,模型在[Hugging Face发布(AI资讯)](https://huggingface.co/microsoft/TRELLIS.2-4B)。<br/><br/>
|
||||
|
||||
6. **美团开源LongCat虚拟人模型。**
|
||||
类似字节OmniHuman和快手Avatar,支持音频驱动照片生成视频🎤特别适用于主播和MV场景,项目主页和模型已在[Hugging Face发布(AI资讯)](https://huggingface.co/meituan-longcat/LongCat-Video-Avatar)。<br/><video src="https://source.hubtoday.app/images/2025/12/news_01kcpd367rer4b9kf3vg7cr815.mp4"></video><br/>
|
||||
|
||||
### 社媒分享
|
||||
|
||||
1. **Prompt Caching技术深度解读。**
|
||||
缓存的不是文本是"思维状态"🧠本质是复用KV矩阵,节省约90%Token费用,长文本首字延迟降低85%。实测显示Anthropic手动模式[命中率100%(AI资讯)](https://ngrok.com/blog/prompt-caching),OpenAI自动模式仅50%。<br/><br/>
|
||||
|
||||
2. **Gemini 3 Flash已开放使用。**
|
||||
相比Pro版本速度提升显著,前端效果基本没变(✧∀✧)美学依旧领先其他模型。ZenMux首发目前免费,[使用地址点这里(AI资讯)](https://zenmux.ai/google/gemini-3-flash-preview-free?utm_source=twitter-zt)。<br/><video src="https://source.hubtoday.app/images/2025/12/news_01kcpd4h1mfg49ajttvj3wmqnp.mp4"></video><br/>
|
||||
|
||||
3. **Vibe Coding时代的护城河思考。**
|
||||
技术不再是核心竞争力了🤔拿一波流量很容易,但建立护城河需要多花时间思考。有人看到缺陷,有人[看到机会(AI资讯)](https://x.com/op7418/status/2001230834192540085),这些机会不是给挑刺的人准备的。<br/>
|
||||
|
||||
4. **GPT Image 1.5图像能力测试。**
|
||||
只是单纯的绘画模型,而不是Banana Pro那样的🌍世界模型。社区评价"谷歌这次领先了一代",天气卡片生成效果可参考[宝玉的测试(AI资讯)](https://x.com/dotey/status/2001164443284054049)。<br/><br/>
|
||||
|
||||
5. **AI硬件创意Stickerbox走红。**
|
||||
语音输入→AI自动绘图→即时打印贴纸🖨️帮孩子把脑海里的故事变成现实!儿童安全模式无屏幕交互,这个逻辑马上会迁移到[3D打印领域(AI资讯)](https://x.com/Yangyixxxx/status/2001194271966220767)。<br/><video src="https://source.hubtoday.app/images/2025/12/news_01kcpd5tyqepkvgyhm4wcxqbdb.mp4"></video><br/>
|
||||
|
||||
---
|
||||
|
||||
## **AI资讯日报语音版**
|
||||
|
||||
| 🎙️ **小宇宙** | 📹 **抖音** |
|
||||
| --- | --- |
|
||||
| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [自媒体账号](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
|
||||
|  |  |
|
||||
|
||||
|
||||
|
||||
|
||||
Reference in New Issue
Block a user