CloudFlare-AI-Insight-Daily/podcast/2025-08-20.md

# 来生小酒馆 2025/8/20

## Full: Podcast Formatting

砸了400亿美金，95%的企业AI投资竟然打了水漂？
AI绘画，提示词真是越长越好吗？
上传一张图片，就能生成一个可以自由探索的虚拟世界？

三问炼心，嘿，亲爱的V，欢迎收听新一期的来生情报站，我是你们的老朋友，何夕2077。

咱们开门见山，先聊聊模型圈的几件大事。首先是DeepSeek，V3.1版本悄悄上线，直接把上下文长度干到了128K。什么概念？十几万字的文档，甚至一整个代码库，你直接扔给它，它都能兜得住。以后别说写周报了，把公司整个季度的会议纪要喂给它，让它自己总结吧。而且这次升级，推理能力提升了43%，瞎编乱造的“幻觉”也少了38%，可以说是相当扎实的一次进步。唯一的小遗憾是，大家心心念念的R2模型，嗯……还在路上，估计是想给我们一个惊喜吧。

另一边，英伟达也放出了个小钢炮——Nemotron Nano 2。别看它只有9B参数，人家可是个练家子，采用了独特的“Transformer-Mamba混合架构”，你可以理解为……既有大力士的力量，又有武林高手的身法。速度比同类模型快6倍，成本还降低了60%，主打一个高效能打。

哦对，还有Gemini API，现在直接支持URL抓取了。网页、PDF、图片链接，你扔给它，它自己就能看，省了开发者不少事儿和钱，属于是降本增效的典范了。

说完了这些硬核的，再来看点好玩的。你还在为怎么写视频提示词而头秃吗？Higgsfield AI推出了一个叫Draw-to-Video的功能，简直是手残党的福音。你不用写小作文了，直接在图片上画个圈、画个箭头，AI就懂你意思，立马给你生成电影级的动态视频。这种“指哪打哪”的傻瓜式操作，让视频创作的门槛……嗯，都快被踩平了。

国内的小红书也没闲着，AIGC团队整了个大活，发布了叫DynamicFace的技术。这技术专门解决换脸视频里，脸一闪一闪、看着特别假的老大难问题。主打的就是一个“可控”和“一致”，让你的创意表达能更精准、更丝滑。

不过，就在大家热情高涨的时候，麻省理工学院的一份研究报告，像是给我们泼了盆不大不小的冷水。报告说，高达95%的企业，AI投资回报率是……零。总计差不多400亿美金，就这么打了水漂。这钱要是给我……估计也打水漂了，但至少能听个响啊。报告分析说，问题不出在技术或者人才，而是现在的AI系统普遍“记性差”，没法真正融入到核心工作流里。说白了，你不能只把它当个工具买回来，得像处对象一样，深度磨合、建立关系才行。

这话说回来，开源社区总能给我们带来希望。腾讯开源了一个叫WeChat-YATT的训练库，专门解决多模态和强化学习的效率瓶颈。昆仑万维更是重量级，直接开源了世界模型Matrix-Game 2.0。谷歌的Genie 3还没影呢，咱们国产的开源版已经能让大家玩起来了。只有1.8B大小，单块GPU就能实时生成可交互的虚拟世界。你传一张图，就能在里面像玩游戏一样到处溜达。这下，我上传一张猫主子的照片，然后进去沉浸式撸猫的梦想，是不是就不远了？

除了这些大项目，GitHub上还有几个有意思的开源小玩意儿。想摆脱商业邮件服务商？可以试试BillionMail。喜欢极简音乐播放器？SPlayer了解一下，界面清爽功能还挺全。还有个叫GhostTrack的项目，能追踪位置和手机号，听着挺酷，但咱们也得时刻提醒自己，技术虽好，隐私和伦理的红线可千万不能踩。哦，对了，还有个叫bytebot的AI桌面管家，动动嘴就能让电脑干活，这才是真正的“君子动口不动手”啊。

最后，分享几条社区里的热点。AI大牛吴恩达免费发了本电子书，专门指导你怎么找AI相关的工作，从简历到面试技巧，一条龙服务，堪称“求职保姆”。社交网络上大家也在热议，AI绘画的提示词是不是越长越好？有网友就发现，他用二三十个词的效果，和别人几百个词的小作文比，好像也差不太多。这事儿吧，就像做菜，有时候调料放多了，反而盖住了食材本身的味道，对吧？

还有，OpenAI在印度推出了个超低价的ChatGPT Go计划，一个月只要4.55美元，让更多人能用上顶级AI。谷歌Gemini也上线了Storybook功能，你可以和孩子一起，用家里的照片创作一本独一无二的故事书。你看，AI不光是生产力工具，也能成为我们生活里温馨有趣的一部分。

今天的情报就到这里，注意隐蔽，赶紧撤离。

---
**本期关键词:**
#DeepSeek V3.1
#Higgsfield AI
#Draw-to-Video
#英伟达
#Nemotron Nano 2
#小红书
#DynamicFace
#腾讯
#WeChat-YATT
#AI投资回报率
#昆仑万维
#Matrix-Game 2.0
#Gemini API
#开源
#吴恩达
#提示词工程
#ChatGPT Go

## Short: Podcast Formatting

砸钱做AI，95%的企业却打了水漂？
AI画画，提示词真是越长越好吗？
随手画一笔就能生成视频，还要导演干嘛？

三问炼心，嘿，亲爱的V，欢迎收听新一期的来生情报站，我是你们的老朋友，何夕2077。闲话少说，情报上膛。

首先，DeepSeek V3.1悄悄上线，上下文窗口直接拉到128K。什么概念？就是你扔给它一本十几万字的小说或者整个代码库，它都能一口气读完，不带喘的。推理能力提升了四成，胡说八道的“幻觉”也少了近四成。唯一美中不足嘛，大家期待的R2模型还在“路上堵着呢”。

另一边，英伟达也放出了个小钢炮Nemotron Nano 2，参数不大，性能可不小。它用了一种混合架构，让处理速度比同类模型快了6倍，成本还削减了60%。主打一个“花小钱，办大事”。说到省钱，Gemini API现在可以直接抓取URL内容了，网页、PDF、图片链接通吃，开发者们可以省下一笔开销，直接让模型自己网上冲浪。

聊完这些硬核的，再看看创意工具。Higgsfield AI的Draw-to-Video简直是懒人福音，不用再绞尽脑汁想提示词，在图片上画个圈、画个箭头，AI就心领神会地让它动起来，创作门槛直接降到地板。国内的小红书也没闲着，发布了DynamicFace技术，专治视频换脸时人脸闪烁、表情不连贯的老毛病，主打一个“可控”和“稳定”。更科幻的是昆仑万维开源的Matrix-Game 2.0，你给它一张图，它就能实时生成一个能让你进去溜达的虚拟世界，就问你科不科幻？

不过，理想很丰满，现实有点骨感。麻省理工学院的研究报告说，高达95%的企业AI投资回报率是零，四百亿美元就这么听了个响。原因不是没钱没人，而是AI系统没法真正融入工作流程，像个记性不好的实习生。这事儿也提醒我们，买个AI工具不叫成功，让它跟你一块儿“成长”才算。就像那个Reddit热帖讨论的，有时候几百词的冗长提示词，效果还不如二十个词的精准指令。看来，跟AI打交道，也得讲究个“有效沟通”。

最后，快速播报几个开源福利：腾讯开源了WeChat-YATT训练库；想自建邮件系统可以看看BillionMail；追求极简音乐播放的可以试试SPlayer；吴恩达老师还贴心地发布了免费的AI求职电子书，一条龙服务。

今天的情报就到这里，注意隐蔽，赶紧撤离。

---
本期关键词:
#DeepSeek V3.1
#128K
#Higgsfield AI
#Draw-to-Video
#英伟达
#Nemotron Nano 2
#小红书
#DynamicFace
#腾讯
#WeChat-YATT
#AI投资
#昆仑万维
#Matrix-Game 2.0
#Gemini API
#URL抓取
#开源