Create daily summary file for 2025-12-18
This commit is contained in:
114
daily/2025-12-18.md
Normal file
114
daily/2025-12-18.md
Normal file
@@ -0,0 +1,114 @@
|
||||
## AI资讯日报 2025/12/18
|
||||
|
||||
> `AI资讯` | `每日早读` | `全网数据聚合` | `前沿科学探索` | `行业自由发声` | `开源创新力量` | `AI与人类未来` | [访问网页版↗️](https://ai.hubtoday.app/) | [进群交流🤙](https://source.hubtoday.app/logo/wechat-qun.jpg)
|
||||
|
||||
|
||||
|
||||
### **今日摘要**
|
||||
|
||||
```
|
||||
腾讯混元1.5实现720P实时虚拟场景探索保留三维记忆
|
||||
Kling2.6语音驱动视频小米MiMo开源混合专家模型
|
||||
Seedance1.5音视频同步SAM Audio分割提取声音元素
|
||||
GPT5.2科学推理超专家NVIDIA收Slurm掌控算力调度
|
||||
谷歌Titans三层记忆突破上下文腾讯姚顺雨任首席AI科学家
|
||||
```
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
|
||||
### 产品与功能更新
|
||||
|
||||
1. **腾讯混元世界模型1.5发布,开启实时交互虚拟世界时代。**
|
||||
用户通过文字或图片,即刻[生成可探索的虚拟场景(AI资讯)](https://3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay)。模型支持720P🎮24帧实时生成,离开后重返区域仍保持三维结构记忆。[技术报告(AI资讯)](https://github.com/Tencent-Hunyuan/HY-WorldPlay)首次公开完整训练体系,为游戏开发与虚拟现实✨开辟新赛道。<br/><br/>
|
||||
|
||||
2. **Kling 2.6语音控制功能正式上线,创作者可赢万元奖金。**
|
||||
用户使用个性化语音驱动视频创作,参赛作品最高可获1000美元现金💰与16000积分奖励。比赛截至12月31日,优秀作品将登上[Kling官网(AI资讯)](https://app.klingai.com/global/activity-zone?id=829893582643003441)首页展示。<br/><br/>
|
||||
|
||||
3. **小米宣布MiMo大模型向开发者全面开放,人车家生态加速融合。**
|
||||
月活用户达7.42亿🚀,IoT连接设备破10.4亿台。MiMo-V2-Flash开源[混合专家模型(AI资讯)](http://platform.xiaomimimo.com/#/docs/welcome)以极致推理速度和Agent能力,跻身全球开源TOP2,CarIoT硬件生态已与比亚迪等车企深度合作(✧∀✧)。<br/><br/>
|
||||
|
||||
4. **字节跳动Seedance 1.5 Pro实现100%视听同步。**
|
||||
该模型支持音视频联合生成,用户输入文本或图像即可生成内容。精准口型与语调拟合💡,支持多语种方言自然表达,[即梦AI平台(AI资讯)](https://www.aibase.com/zh/news/23764)已可体验。<br/><br/>
|
||||
|
||||
5. **Meta推出SAM Audio,让声音像图像般可分割。**
|
||||
用户通过文字、视觉或时间提示,一键提取音频元素🎸,如剔除交通噪音或狗叫声。基于[PE-AV引擎(AI资讯)](https://ai.meta.com/blog/sam-audio/)同步理解视觉与音频,模型已开放下载供研究者使用。<br/><br/>
|
||||
|
||||
6. **Meta新款AI眼镜放大对话音量,Messenger桌面版2025年停服。**
|
||||
开放式扬声器设计帮助用户在嘈杂环境清晰听到对话。Messenger桌面应用因缺乏竞争力将于12月15日下线,用户需转至[Facebook网站(AI资讯)](https://www.aibase.com/zh/news/23763)继续使用,无账户者可访问Messenger.com登录。<br/><br/>
|
||||
|
||||
### 前沿研究
|
||||
|
||||
1. **OpenAI发布FrontierScience基准,GPT-5.2展现专家级科学推理能力。**
|
||||
该基准包含700道物理化学生物[高难度题目(AI资讯)](https://cdn.openai.com/pdf/2fcd284c-b468-4c21-8ee0-7a783933efcc/frontierscience-paper.pdf),设奥赛与研究两赛道🔥。GPT-5.2在奥赛赛道获77%得分,研究赛道25%,均领先其他前沿模型。<br/><br/>
|
||||
|
||||
2. **NVIDIA收购SchedMD,算力调度王牌Slurm归入生态体系。**
|
||||
全球过半TOP500超算使用Slurm系统,Meta与Mistral等巨头均依赖其[资源调度能力(AI资讯)](https://blogs.nvidia.com/blog/nvidia-acquires-schedmd/)。英伟达承诺保持开源属性,影响力从硬件延伸至调度层💪,即使AMD芯片用户也绕不开其生态辐射。<br/><br/>
|
||||
|
||||
3. **美团开源LongCat-Video-Avatar,音频驱动虚拟人创作。**
|
||||
类似字节OmniHuman与快手Avatar技术路线,支持[照片生成视频(AI资讯)](https://meigen-ai.github.io/LongCat-Video-Avatar/),适用主播与MV场景。模型已在Hugging Face🎤发布。<br/><br/>
|
||||
|
||||
4. **谷歌Titans模型让AI拥有真正记忆力,解决金鱼记忆难题。**
|
||||
通过短期、长期与持久三层记忆系统,模型在[Needle in Haystack任务(AI资讯)](https://arxiv.org/abs/2501.00663)中16000字文章准确率达96%🧠。超GPT-4在百万字文档推理表现,用1/70参数量击败Llama3.1。<br/><br/>
|
||||
|
||||
5. **FreeKV算法实现13倍推理加速,解决KV缓存检索瓶颈。**
|
||||
腾讯混元团队提出[Context Forcing蒸馏方案(AI资讯)](https://arxiv.org/abs/2505.13109),在保持精度下以24帧/秒生成720P视频✨。混合CPU与GPU内存布局消除碎片传输,双缓冲流式回忆进一步提效。<br/><br/>
|
||||
|
||||
### 行业展望与社会影响
|
||||
|
||||
1. **腾讯任命姚顺雨为首席AI科学家,组织架构全面升级。**
|
||||
新成立AI Infra部与AI Data部,姚顺雨向刘炽平汇报兼任[大语言模型部负责人(AI资讯)](https://www.jiqizhixin.com/articles/2025-12-17-17)。95后智能体领域青年研究者(✧∀✧),代表作包括思维树ToT与ReAct框架,论文引用量超1.9万。<br/><br/>
|
||||
|
||||
2. **摩尔线程LiteGS斩获SIGGRAPH Asia银奖,训练效率提升10倍。**
|
||||
在60秒高质量重建挑战中,平均PSNR达27.58🏆,耗时仅34秒。[开源基础库(AI资讯)](https://github.com/MooreThreads/LiteGS)通过Warp-Based Raster与混合精度策略,仅需原版10%训练时间达同等质量。<br/><br/>
|
||||
|
||||
3. **GitHub Actions对自托管runner收费,引发迁移争议。**
|
||||
2026年起私有仓库按$0.002/分钟收取[平台费(AI资讯)](https://newshacker.me/story?id=46291500),虽公开仓库免费但自托管调度被征税💸。评论认为此举财政性惩罚第三方方案,GitLab与Forgejo成替代选项。<br/><br/>
|
||||
|
||||
4. **AI是否让形式验证成为主流?规范可写性成最大争议。**
|
||||
最新大模型如[Opus与GPT-5(AI资讯)](https://newshacker.me/story?id=46294574)加速Lean与TLA+证明生成🤔,但业务需求模糊易变难以写成数学定理。讨论聚焦渐进嵌入CI与property测试,而非强制每人写正式证明。<br/><br/>
|
||||
|
||||
5. **微软开源TRELLIS.2图生3D模型,参数规模仅4B。**
|
||||
[Hugging Face空间(AI资讯)](https://huggingface.co/spaces/microsoft/TRELLIS.2)可在线体验,但效果被质疑不如前版🎨。模型支持单张图片生成手办级3D资产。<br/><br/>
|
||||
|
||||
### 开源TOP项目
|
||||
|
||||
1. **Resemble-ai开源Chatterbox,最先进文本转语音系统。**
|
||||
[GitHub仓库(AI资讯)](https://github.com/resemble-ai/chatterbox)⭐15.6k,代表开源TTS技术前沿水准🎤。<br/><br/>
|
||||
|
||||
2. **ChatGPT_DAN越狱提示词项目备受关注。**
|
||||
[开源仓库(AI资讯)](https://github.com/0xk1h0/ChatGPT_DAN)⭐10.3k,提供绕过限制的提示策略🔥。<br/><br/>
|
||||
|
||||
3. **Zerobyte基于restic构建自托管备份自动化工具。**
|
||||
[项目地址(AI资讯)](https://github.com/nicotsx/zerobyte)⭐3k,简化备份流程降低运维成本💾。<br/><br/>
|
||||
|
||||
4. **NVIDIA开源Gym为大模型训练构建强化学习环境。**
|
||||
[NeMo Gym项目(AI资讯)](https://github.com/NVIDIA-NeMo/Gym)⭐172,专注LLM训练场景优化✨。<br/><br/>
|
||||
|
||||
### 社媒分享
|
||||
|
||||
1. **AI消费能力是真正超能力?Obsidian笔记与隐私成争议焦点。**
|
||||
用户把全部笔记上传[Claude获个性化建议(AI资讯)](https://newshacker.me/story?id=46299552),Slurm与Suno验证上下文工程价值🧠。但隐私担忧让许多人转向本地LLM方案,讨论分为"云端便利"与"数据主权"两派(✧∀✧)。<br/><br/>
|
||||
|
||||
2. **Prompt Caching技术成本直降90%,延迟缩减85%。**
|
||||
ngrokHQ团队[技术博客(AI资讯)](https://ngrok.com/blog/prompt-caching)揭示核心是复用KV矩阵🚀,OpenAI全自动黑盒命中率50%,Anthropic手动白盒达100%,成为RAG应用降本增效关键技术。<br/><br/>
|
||||
|
||||
3. **Gemini 3 Flash速度大幅提升,ZenMux首发免费体验。**
|
||||
相比Pro版本前端效果不变,美学依旧领先其他模型💡。[使用地址(AI资讯)](https://zenmux.ai/google/gemini-3-flash-preview-free?utm_source=twitter-zt)现已开放。<br/><br/>
|
||||
|
||||
4. **Vibe Coding让技术不再是核心竞争力。**
|
||||
AI辅助编程降低开发门槛🎮,拿流量容易但建立护城河需思考。GPT-Image 1.5与Banana Pro对比,谷歌世界模型领先一代(✧∀✧)。<br/><br/>
|
||||
|
||||
---
|
||||
|
||||
## **AI资讯日报语音版**
|
||||
|
||||
| 🎙️ **小宇宙** | 📹 **抖音** |
|
||||
| --- | --- |
|
||||
| [来生小酒馆](https://www.xiaoyuzhoufm.com/podcast/683c62b7c1ca9cf575a5030e) | [自媒体账号](https://www.douyin.com/user/MS4wLjABAAAAwpwqPQlu38sO38VyWgw9ZjDEnN4bMR5j8x111UxpseHR9DpB6-CveI5KRXOWuFwG)|
|
||||
|  |  |
|
||||
|
||||
|
||||
|
||||
Reference in New Issue
Block a user