Update daily summary file for 2025-12-18

This commit is contained in:
何夕2077
2025-12-17 22:56:54 +08:00
parent c51b69fade
commit 0321f52c25

View File

@@ -7,11 +7,11 @@
### **今日摘要**
```
腾讯混元1.5实现720P实时虚拟场景探索保留三维记忆
Kling2.6语音驱动视频小米MiMo开源混合专家模型
Seedance1.5音视频同步SAM Audio分割提取声音元素
GPT5.2科学推理超专家NVIDIA收Slurm掌控算力调度
谷歌Titans三层记忆突破上下文腾讯姚顺雨任首席AI科学家
腾讯混元世界模型1.5上线支持文字图片生成互动世界
字节Seedance实现100%视听同步已上线即梦豆包
OpenAI发布FrontierScience基准GPT-5.2奥赛77%
姚顺雨任腾讯首席AI科学家向刘炽平汇报
英伟达收购Slurm开发商SchedMD强化算力调度护城河
```
@@ -21,85 +21,88 @@ GPT5.2科学推理超专家NVIDIA收Slurm掌控算力调度
### 产品与功能更新
1. **腾讯混元世界模型1.5发布,开启实时交互虚拟世界时代**
用户通过文字或图片,即刻[生成可探索的虚拟场景(AI资讯)](https://3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay)。模型支持720P🎮24帧实时生成,离开后重返区域仍保持三维结构记忆。[技术报告(AI资讯)](https://github.com/Tencent-Hunyuan/HY-WorldPlay)首次公开完整训练体系,为游戏开发与虚拟现实✨开辟新赛道。<br/>![AI资讯:腾讯混元模型实时渲染虚拟城市场景](https://upload.chinaz.com/2025/1217/6390157850607985799179975.png)<br/>
1. **腾讯混元世界模型1.5上线**
国内首个🎮实时互动体验平台[开放体验(AI资讯)](https://3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay)了!输入文字或图片就能瞬间生成互动世界,用键鼠或手柄(✧∀✧)自由探索。该模型还**首次开源训练体系**,从数据到推理部署全覆盖。<br/>![AI资讯腾讯混元世界模型1.5互动场景演示](https://upload.chinaz.com/2025/1217/6390157850607985799179975.png)<br/>
2. **Kling 2.6语音控制功能正式上线,创作者可赢万元奖金**
用户使用个性化语音驱动视频创作,参赛作品最高可获1000美元现金💰与16000积分奖励。比赛截至12月31日,优秀作品将登上[Kling官网(AI资讯)](https://app.klingai.com/global/activity-zone?id=829893582643003441)首页展示。<br/>![AI资讯:Kling 2.6语音控制功能界面展示](https://pbs.twimg.com/media/G8Wmw-8WwAoviMl?format=jpg&name=orig)<br/>
2. **Kling 2.6语音控制功能正式发布**
快影AI📢上线了Voice Control用你的专属声音创作更具魅力的[个性化内容(AI资讯)](https://forms.gle/wipMhRUgP8WfHDrw9)。官方同步开启创意大赛🏆现金最高1000美金提交作品就有机会登上首页推荐。<br/>![AI资讯Kling 2.6语音控制功能宣传图](https://pbs.twimg.com/media/G8Wmw-8WwAoviMl?format=jpg&name=orig)<br/>
3. **小米宣布MiMo大模型向开发者全面开放,人车家生态加速融合**
月活用户达7.42亿🚀,IoT连接设备破10.4亿台。MiMo-V2-Flash开源[混合专家模型(AI资讯)](http://platform.xiaomimimo.com/#/docs/welcome)以极致推理速度和Agent能力,跻身全球开源TOP2,CarIoT硬件生态已与比亚迪等车企深度合作(✧∀✧)。<br/>![AI资讯:小米人车家全生态架构图](https://www.qbitai.com/wp-content/uploads/replace/d65cdca3a9a7f4248b18d37b4ee93adc.jpeg)<br/>
3. **字节Seedance 1.5 Pro发布**
新一代音视频模型实现🎬100%视听同步,角色口型、语调与表演节奏高度拟合。支持多语种方言自然表达,还能执行希区柯克变焦等高难度[镜头运动(AI资讯)](https://www.aibase.com/zh/news/23764)。已在即梦AI和豆包平台上线。<br/><video src="https://upload.chinaz.com/video/2025/1217/6390156849466857607546185.mp4"></video><br/>
4. **字节跳动Seedance 1.5 Pro实现100%视听同步**
该模型支持音视频联合生成,用户输入文本或图像即可生成内容。精准口型与语调拟合💡,支持多语种方言自然表达,[即梦AI平台(AI资讯)](https://www.aibase.com/zh/news/23764)已可体验。<br/>![AI资讯:Seedance 1.5 Pro生成的赛博朋克短片](https://upload.chinaz.com/2025/1217/6390156841976672109115362.png)<br/>
4. **Meta推出SAM Audio模型**
继图像分割后Meta将"🔊分割一切"理念延伸到音频领域。支持文本、视觉和时间跨度三种提示方式,能像[抠图(AI资讯)](https://ai.meta.com/blog/sam-audio/)一样精准分离声音。已在Segment Anything Playground开放试用。<br/>![AI资讯SAM Audio模型声音分离示意图](https://app.circle.so/rails/active_storage/representations/redirect/eyJfcmFpbHMiOnsibWVzc2FnZSI6IkJBaHBCSFc2cndjPSIsImV4cCI6bnVsbCwicHVyIjoiYmxvYl9pZCJ9fQ==--51dff6fda766cc98c9d3b0a17685baae270beb2c/eyJfcmFpbHMiOnsibWVzc2FnZSI6IkJBaDdCem9MWm05eWJXRjBTU0lJY0c1bkJqb0dSVlE2Q25OaGRtVnlld1k2Q25OMGNtbHdWQT09IiwiZXhwIjpudWxsLCJwdXIiOiJ2YXJpYXRpb24ifX0=--c94871ba5479e24de62982019557cdcc73e92248/image.png)<br/>
5. **Meta推出SAM Audio,让声音像图像般可分割**
用户通过文字、视觉或时间提示,一键提取音频元素🎸,如剔除交通噪音或狗叫声。基于[PE-AV引擎(AI资讯)](https://ai.meta.com/blog/sam-audio/)同步理解视觉与音频,模型已开放下载供研究者使用。<br/>![AI资讯:SAM Audio多模态声音分割示意图](https://app.circle.so/rails/active_storage/representations/redirect/eyJfcmFpbHMiOnsibWVzc2FnZSI6IkJBaHBCSFc2cndjPSIsImV4cCI6bnVsbCwicHVyIjoiYmxvYl9pZCJ9fQ==--51dff6fda766cc98c9d3b0a17685baae270beb2c/eyJfcmFpbHMiOnsibWVzc2FnZSI6IkJBaDdCem9MWm05eWJXRjBTU0lJY0c1bkJqb0dSVlE2Q25OaGRtVnlld1k2Q25OMGNtbHdWQT09IiwiZXhwIjpudWxsLCJwdXIiOiJ2YXJpYXRpb24ifX0=--c94871ba5479e24de62982019557cdcc73e92248/image.png)<br/>
5. **小米MiMo大模型对开发者开放**
小米宣布开放🤖MiMo系列大模型和CarIoT硬件生态。AIoT平台连接设备突破**10.4亿**,开发者规模达[120万(AI资讯)](https://www.qbitai.com/2025/12/361460.html)。MiMo-V2-Flash已开源在Agent测评跻身全球开源模型TOP2。<br/>![AI资讯小米人车家全生态发布会现场](https://www.qbitai.com/wp-content/uploads/replace/d65cdca3a9a7f4248b18d37b4ee93adc.jpeg)<br/>
6. **Meta新款AI眼镜放大对话音量,Messenger桌面版2025年停服**
开放式扬声器设计帮助用户在嘈杂环境清晰听到对话。Messenger桌面应用因缺乏竞争力将于12月15日下线,用户需转至[Facebook网站(AI资讯)](https://www.aibase.com/zh/news/23763)继续使用,无账户者可访问Messenger.com登录。<br/>![AI资讯:Meta AI眼镜外观](https://upload.chinaz.com/2025/1217/6390156746137072553849246.png)<br/>
6. **Meta推出AI听力增强眼镜**
新款眼镜采用开放式扬声器设计,可以放大👓与你交谈的人的声音。特别适合咖啡馆或繁忙街道等[嘈杂环境(AI资讯)](https://www.aibase.com/zh/news/23763)使用,让日常交流更轻松。<br/>![AI资讯Meta AI听力增强眼镜产品](https://upload.chinaz.com/2025/1217/6390156746137072553849246.png)<br/>
### 前沿研究
1. **OpenAI发布FrontierScience基准,GPT-5.2展现专家级科学推理能力**
该基准包含700道物理化学生物[高难度题目(AI资讯)](https://cdn.openai.com/pdf/2fcd284c-b468-4c21-8ee0-7a783933efcc/frontierscience-paper.pdf),设奥赛与研究两赛道🔥。GPT-5.2在奥赛赛道获77%得分,研究赛道25%,均领先其他前沿模型。<br/>![AI资讯:FrontierScience奥赛赛道化学题示例](https://image.jiqizhixin.com/uploads/editor/68592592-ba1e-4793-9f42-520310fc6cea/640.jpeg)<br/>
1. **OpenAI发布FrontierScience基准。**
专为评估专家级科学能力构建,包含物理化学生物学数百道原创题目。GPT-5.2在奥赛赛道得分**77%**研究赛道🔬25%均领先其他前沿模型。Gemini 3 Pro在奥赛赛道与GPT-5.2[表现相当(AI资讯)](https://cdn.openai.com/pdf/2fcd284c-b468-4c21-8ee0-7a783933efcc/frontierscience-paper.pdf)。<br/>![AI资讯FrontierScience奥赛赛道物理题目示例](https://image.jiqizhixin.com/uploads/editor/48755239-e6a1-430a-80eb-b2a5d40f6fe0/640.jpeg)<br/>
2. **NVIDIA收购SchedMD,算力调度王牌Slurm归入生态体系**
全球过半TOP500超算使用Slurm系统,Meta与Mistral等巨头均依赖其[资源调度能力(AI资讯)](https://blogs.nvidia.com/blog/nvidia-acquires-schedmd/)。英伟达承诺保持开源属性,影响力从硬件延伸至调度层💪,即使AMD芯片用户也绕不开其生态辐射。<br/>![AI资讯:Slurm工作负载管理系统架构图](https://www.qbitai.com/wp-content/uploads/replace/6d7a0dc63f8ecc1e9e5462e243c64eae.png)<br/>
2. **FreeKV框架提升LLM推理效率**
针对长上下文KV缓存问题该框架实现算法-系统协同优化。通过投机检索和双缓冲流式召回达到🚀近无损精度相比SOTA方法[最高提速13倍(AI资讯)](https://arxiv.org/abs/2505.13109)<br/>
3. **美团开源LongCat-Video-Avatar,音频驱动虚拟人创作**
类似字节OmniHuman与快手Avatar技术路线,支持[照片生成视频(AI资讯)](https://meigen-ai.github.io/LongCat-Video-Avatar/),适用主播与MV场景。模型已在Hugging Face🎤发布。<br/>![AI资讯:LongCat-Video-Avatar生成的主播虚拟形象](https://pbs.twimg.com/amplify_video/2001207859737223168/vid/avc1/1216x768/vvKHUCqB7buvDb3d.mp4)<br/>
4. **谷歌Titans模型让AI拥有真正记忆力,解决金鱼记忆难题。**
通过短期、长期与持久三层记忆系统,模型在[Needle in Haystack任务(AI资讯)](https://arxiv.org/abs/2501.00663)中16000字文章准确率达96%🧠。超GPT-4在百万字文档推理表现,用1/70参数量击败Llama3.1。<br/>![AI资讯:Titans三层记忆系统原理示意图](https://pbs.twimg.com/media/G8VBKOZa4AIh5TV?format=jpg&name=orig)<br/>
5. **FreeKV算法实现13倍推理加速,解决KV缓存检索瓶颈。**
腾讯混元团队提出[Context Forcing蒸馏方案(AI资讯)](https://arxiv.org/abs/2505.13109),在保持精度下以24帧/秒生成720P视频✨。混合CPU与GPU内存布局消除碎片传输,双缓冲流式回忆进一步提效。<br/>![AI资讯:FreeKV算法性能对比图表](https://image.jiqizhixin.com/uploads/editor/33601d63-d4c8-4752-8e58-544a80953b7e/640.png)<br/>
3. **Titans让AI有了真正的记忆力**
谷歌Jeff Dean点赞的论文解决了(✧∀✧)AI的"金鱼记忆"问题。短期记忆+长期记忆+持久记忆三种机制各司其职,在**200万token**超长文本理解任务中准确率96%+,吊打[Mamba2的5.4%(AI资讯)](https://arxiv.org/abs/2501.00663)<br/>
### 行业展望与社会影响
1. **腾讯任命姚顺雨为首席AI科学家,组织架构全面升级**
新成立AI Infra部与AI Data部,姚顺雨向刘炽平汇报兼任[大语言模型部负责人(AI资讯)](https://www.jiqizhixin.com/articles/2025-12-17-17)。95后智能体领域青年研究者(✧∀✧),代表作包括思维树ToT与ReAct框架,论文引用量超1.9万。<br/>![AI资讯:姚顺雨职腾讯首席AI科学家](https://image.jiqizhixin.com/uploads/editor/ea09200c-d17e-4f7a-85c1-902d0099ab72/640.png)<br/>
1. **姚顺雨出任腾讯首席AI科学家**
官宣腾讯升级大模型研发架构95后明星学者姚顺雨任职"CEO/总裁办公室"首席AI科学家向刘炽平汇报。同时兼任AI Infra部、大语言模型部负责人将📈全面强化腾讯大模型[研发体系(AI资讯)](https://www.jiqizhixin.com/articles/2025-12-17-17)。<br/>![AI资讯姚顺雨职腾讯架构示意图](https://image.jiqizhixin.com/uploads/editor/ea09200c-d17e-4f7a-85c1-902d0099ab72/640.png)<br/>
2. **摩尔线程LiteGS斩获SIGGRAPH Asia银奖,训练效率提升10倍**
在60秒高质量重建挑战中,平均PSNR达27.58🏆,耗时仅34秒。[开源基础库(AI资讯)](https://github.com/MooreThreads/LiteGS)通过Warp-Based Raster与混合精度策略,仅需原版10%训练时间达同等质量。<br/>![AI资讯:LiteGS技术架构流程](https://www.qbitai.com/wp-content/uploads/replace/a04169a236943b665ee3fb878e8f9337.png)<br/>
2. **英伟达收购Slurm开发商SchedMD**
这波低调出手被评价为"护城河又宽了"💪SchedMD开发的Slurm是全球超半数TOP500超算在用的资源调度工具Meta、Mistral、Thinking Machines都离不开。哪怕用AMD芯片只要需要算力调度就[绕不开英伟达(AI资讯)](https://blogs.nvidia.com/blog/nvidia-acquires-schedmd/)。<br/>![AI资讯英伟达收购SchedMD公告](https://www.qbitai.com/wp-content/uploads/replace/a204026aab15dc4a46ad49c6e6e3a56d.png)<br/>
3. **GitHub Actions对自托管runner收费,引发迁移争议。**
2026年起私有仓库按$0.002/分钟收取[平台费(AI资讯)](https://newshacker.me/story?id=46291500),虽公开仓库免费但自托管调度被征税💸。评论认为此举财政性惩罚第三方方案,GitLab与Forgejo成替代选项。<br/>![AI资讯:GitHub Actions控制平面收费公告截图](https://newshacker.me/story?id=46291500)<br/>
3. **AI上下文管理引发隐私争议。**
把全部人生笔记上传给第三方服务器你放心吗社区讨论显示虽然🔥把Obsidian笔记喂给Claude能获得个性化建议但多数人倾向寻求本地LLM等[可控方案(AI资讯)](https://newshacker.me/story?id=46299552)。另有人警告依赖AI摘要会侵蚀真正的知识掌握。<br/>
4. **AI是否让形式验证成为主流?规范可写性成最大争议**
最新大模型如[Opus与GPT-5(AI资讯)](https://newshacker.me/story?id=46294574)加速Lean与TLA+证明生成🤔,但业务需求模糊易变难以写成数学定理。讨论聚焦渐进嵌入CI与property测试,而非强制每人写正式证明。<br/>![AI资讯:形式验证工具链对比表](https://newshacker.me/story?id=46294574)<br/>
4. **GitHub Actions开始收取平台费**
自2026年起私有仓库和自托管runner的调度将按$0.002/分钟计费💸即使算力在用户自己服务器上也要交"税"。小型团队相对受伤更重社区已开始评估迁往GitLab或[Forgejo等替代方案(AI资讯)](https://newshacker.me/story?id=46291500)<br/>
5. **微软开源TRELLIS.2图生3D模型,参数规模仅4B。**
[Hugging Face空间(AI资讯)](https://huggingface.co/spaces/microsoft/TRELLIS.2)可在线体验,但效果被质疑不如前版🎨。模型支持单张图片生成手办级3D资产。<br/>![AI资讯:TRELLIS.2生成的芙莉莲3D模型](https://pbs.twimg.com/media/G8WwYWUa4AECA67?format=jpg&name=orig)<br/>
5. **AI能否让形式验证成为主流**
讨论焦点在于规范本身难以形式化需求又频繁变动。乐观者指出Opus、GPT-5.2等🤖大模型显著加速了证明工程,悲观者则认为文化与经济障碍才是[普及的真正阻碍(AI资讯)](https://newshacker.me/story?id=46294574)<br/>
### 开源TOP项目
1. **Resemble-ai开源Chatterbox,最先进文本转语音系统**
[GitHub仓库(AI资讯)](https://github.com/resemble-ai/chatterbox)⭐15.6k,代表开源TTS技术前沿水准🎤。<br/>![AI资讯:Chatterbox项目主页截图](https://github.com/resemble-ai/chatterbox)<br/>
1. **摩尔线程开源LiteGS基础库**
在SIGGRAPH Asia 2025斩获银奖🥈的3DGS重建算法已开源60秒任务**34秒交卷**仅需原版10%训练时间即可达到同等质量。从GPU系统到算法设计全链路优化代码在[GitHub开放(AI资讯)](https://github.com/MooreThreads/LiteGS)。⭐已引发学术界关注。<br/>![AI资讯摩尔线程LiteGS性能对比图](https://www.qbitai.com/wp-content/uploads/replace/a04169a236943b665ee3fb878e8f9337.png)<br/>
2. **ChatGPT_DAN越狱提示词项目备受关注**
[开源仓库(AI资讯)](https://github.com/0xk1h0/ChatGPT_DAN)⭐10.3k,提供绕过限制的提示策略🔥。<br/>![AI资讯:ChatGPT DAN提示词示例](https://github.com/0xk1h0/ChatGPT_DAN)<br/>
2. **英伟达发布Nemotron 3开源模型**
MoE架构支持百万token上下文包含Nano(30B)、Super(100B)、Ultra(500B)三个规模。Nano版已发布吞吐量比前代🚀提升4倍被评为同类型中[最开放高效的模型(AI资讯)](https://nvidianews.nvidia.com/news/nvidia-debuts-nemotron-3-family-of-open-models)。<br/>![AI资讯Nemotron 3模型架构图](https://www.qbitai.com/wp-content/uploads/replace/5292b82c224dcdbfa98ecd2226ebb704.png)<br/>
3. **Zerobyte基于restic构建自托管备份自动化工具**
[项目地址(AI资讯)](https://github.com/nicotsx/zerobyte)⭐3k,简化备份流程降低运维成本💾。<br/>![AI资讯:Zerobyte备份流程示意图](https://github.com/nicotsx/zerobyte)<br/>
3. **小米MiMo-V2-Flash开源发布**
309B总参数15B激活专为极致推理效率自研的MoE大语言模型。代码和Agent能力强💡生成速度快API限时免费可接入Claude Code、[Cursor等工具(AI资讯)](http://platform.xiaomimimo.com/#/docs/welcome)。⭐开发者反响热烈。<br/>![AI资讯小米MiMo-V2-Flash性能对比图](https://pbs.twimg.com/media/G8S0R4WaEAA85Ms?format=jpg&name=orig)<br/>
4. **NVIDIA开源Gym为大模型训练构建强化学习环境**
[NeMo Gym项目(AI资讯)](https://github.com/NVIDIA-NeMo/Gym)⭐172,专注LLM训练场景优化✨。<br/>![AI资讯:NVIDIA Gym架构示意图](https://github.com/NVIDIA-NeMo/Gym)<br/>
4. **Chatterbox开源TTS系统**
号称最先进的开源文本转语音系统已获得⭐15614星标项目地址[resemble-ai/chatterbox(AI资讯)](https://github.com/resemble-ai/chatterbox)<br/>
5. **微软开源TRELLIS.2图生3D模型。**
4B参数规模支持图片生成3D模型。在线体验地址已开放社区反馈效果褒贬不一( ̄▽ ̄)"有人觉得还不如之前版本,模型在[Hugging Face发布(AI资讯)](https://huggingface.co/microsoft/TRELLIS.2-4B)。<br/>![AI资讯微软TRELLIS.2生成的3D模型效果图](https://pbs.twimg.com/media/G8WwYWUa4AECA67?format=jpg&name=orig)<br/>
6. **美团开源LongCat虚拟人模型。**
类似字节OmniHuman和快手Avatar支持音频驱动照片生成视频🎤特别适用于主播和MV场景项目主页和模型已在[Hugging Face发布(AI资讯)](https://huggingface.co/meituan-longcat/LongCat-Video-Avatar)。<br/><video src="https://video.twimg.com/amplify_video/2001207859737223168/vid/avc1/1216x768/vvKHUCqB7buvDb3d.mp4?tag=21"></video><br/>
### 社媒分享
1. **AI消费能力是真正超能力?Obsidian笔记与隐私成争议焦点**
用户把全部笔记上传[Claude获个性化建议(AI资讯)](https://newshacker.me/story?id=46299552),Slurm与Suno验证上下文工程价值🧠。但隐私担忧让许多人转向本地LLM方案,讨论分为"云端便利"与"数据主权"两派(✧∀✧)。<br/>![AI资讯:Obsidian知识库示例截图](https://newshacker.me/story?id=46299552)<br/>
1. **Prompt Caching技术深度解读**
缓存的不是文本是"思维状态"🧠本质是复用KV矩阵节省约90%Token费用长文本首字延迟降低85%。实测显示Anthropic手动模式[命中率100%(AI资讯)](https://ngrok.com/blog/prompt-caching)OpenAI自动模式仅50%。<br/>![AI资讯Prompt Caching技术原理示意图](https://pbs.twimg.com/media/G8X5XJXbgAEsVvv?format=jpg&name=orig)<br/>
2. **Prompt Caching技术成本直降90%,延迟缩减85%**
ngrokHQ团队[技术博客(AI资讯)](https://ngrok.com/blog/prompt-caching)揭示核心是复用KV矩阵🚀,OpenAI全自动黑盒命中率50%,Anthropic手动白盒达100%,成为RAG应用降本增效关键技术。<br/>![AI资讯:Prompt Caching工作原理图](https://pbs.twimg.com/media/G8X5XJXbgAEsVvv?format=jpg&name=orig)<br/>
2. **Gemini 3 Flash已开放使用**
相比Pro版本速度提升显著前端效果基本没变(✧∀✧)美学依旧领先其他模型。ZenMux首发目前免费[使用地址点这里(AI资讯)](https://zenmux.ai/google/gemini-3-flash-preview-free?utm_source=twitter-zt)。<br/><video src="https://video.twimg.com/amplify_video/2001220765950394368/vid/avc1/3016x1576/EcxVvTU1YALmMAyw.mp4?tag=21"></video><br/>
3. **Gemini 3 Flash速度大幅提升,ZenMux首发免费体验**
相比Pro版本前端效果不变,美学依旧领先其他模型💡。[使用地址(AI资讯)](https://zenmux.ai/google/gemini-3-flash-preview-free?utm_source=twitter-zt)现已开放。<br/>![AI资讯:Gemini 3 Flash界面演示](https://video.twimg.com/amplify_video/2001220765950394368/vid/avc1/3016x1576/EcxVvTU1YALmMAyw.mp4)<br/>
3. **Vibe Coding时代的护城河思考**
技术不再是核心竞争力了🤔拿一波流量很容易,但建立护城河需要多花时间思考。有人看到缺陷,有人[看到机会(AI资讯)](https://x.com/op7418/status/2001230834192540085),这些机会不是给挑刺的人准备的。<br/>
4. **Vibe Coding让技术不再是核心竞争力**
AI辅助编程降低开发门槛🎮,拿流量容易但建立护城河需思考。GPT-Image 1.5与Banana Pro对比,谷歌世界模型领先一代(✧∀✧)。<br/>![AI资讯:GPT-Image 1.5生成样例](https://pbs.twimg.com/media/G8WQWZmWgAAHtop?format=jpg&name=orig)<br/>
4. **GPT Image 1.5图像能力测试**
只是单纯的绘画模型而不是Banana Pro那样的🌍世界模型。社区评价"谷歌这次领先一代",天气卡片生成效果可参考[宝玉的测试(AI资讯)](https://x.com/dotey/status/2001164443284054049)。<br/>![AI资讯GPT Image 1.5生成的城市天气卡片](https://pbs.twimg.com/media/G8WQWZmWgAAHtop?format=jpg&name=orig)<br/>
5. **AI硬件创意Stickerbox走红。**
语音输入→AI自动绘图→即时打印贴纸🖨帮孩子把脑海里的故事变成现实儿童安全模式无屏幕交互这个逻辑马上会迁移到[3D打印领域(AI资讯)](https://x.com/Yangyixxxx/status/2001194271966220767)。<br/><video src="https://video.twimg.com/amplify_video/2000830775437221894/vid/avc1/1920x1080/kx8N5lm5BKx4Om00.mp4?tag=21"></video><br/>
---