From e97f26710164e0ed71c48e93792760d4bd53fb5f Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?=E4=BD=95=E5=A4=952077?= <274166795@qq.com>
Date: Wed, 20 Aug 2025 00:05:20 +0800
Subject: [PATCH] Create podcast script file for 2025-08-20

---
 podcast/2025-08-20.md | 90 +++++++++++++++++++++++++++++++++++++++++++
 1 file changed, 90 insertions(+)
 create mode 100644 podcast/2025-08-20.md

diff --git a/podcast/2025-08-20.md b/podcast/2025-08-20.md
new file mode 100644
index 0000000..34c6848
--- /dev/null
+++ b/podcast/2025-08-20.md
@@ -0,0 +1,90 @@
+# 来生小酒馆 2025/8/20
+
+## Full: Podcast Formatting 
+
+砸了400亿美金，95%的企业AI投资竟然打了水漂？
+AI绘画，提示词真是越长越好吗？
+上传一张图片，就能生成一个可以自由探索的虚拟世界？
+
+三问炼心，嘿，亲爱的V，欢迎收听新一期的来生情报站，我是你们的老朋友，何夕2077。
+
+咱们开门见山，先聊聊模型圈的几件大事。首先是DeepSeek，V3.1版本悄悄上线，直接把上下文长度干到了128K。什么概念？十几万字的文档，甚至一整个代码库，你直接扔给它，它都能兜得住。以后别说写周报了，把公司整个季度的会议纪要喂给它，让它自己总结吧。而且这次升级，推理能力提升了43%，瞎编乱造的“幻觉”也少了38%，可以说是相当扎实的一次进步。唯一的小遗憾是，大家心心念念的R2模型，嗯……还在路上，估计是想给我们一个惊喜吧。
+
+另一边，英伟达也放出了个小钢炮——Nemotron Nano 2。别看它只有9B参数，人家可是个练家子，采用了独特的“Transformer-Mamba混合架构”，你可以理解为……既有大力士的力量，又有武林高手的身法。速度比同类模型快6倍，成本还降低了60%，主打一个高效能打。
+
+哦对，还有Gemini API，现在直接支持URL抓取了。网页、PDF、图片链接，你扔给它，它自己就能看，省了开发者不少事儿和钱，属于是降本增效的典范了。
+
+说完了这些硬核的，再来看点好玩的。你还在为怎么写视频提示词而头秃吗？Higgsfield AI推出了一个叫Draw-to-Video的功能，简直是手残党的福音。你不用写小作文了，直接在图片上画个圈、画个箭头，AI就懂你意思，立马给你生成电影级的动态视频。这种“指哪打哪”的傻瓜式操作，让视频创作的门槛……嗯，都快被踩平了。
+
+国内的小红书也没闲着，AIGC团队整了个大活，发布了叫DynamicFace的技术。这技术专门解决换脸视频里，脸一闪一闪、看着特别假的老大难问题。主打的就是一个“可控”和“一致”，让你的创意表达能更精准、更丝滑。
+
+不过，就在大家热情高涨的时候，麻省理工学院的一份研究报告，像是给我们泼了盆不大不小的冷水。报告说，高达95%的企业，AI投资回报率是……零。总计差不多400亿美金，就这么打了水漂。这钱要是给我……估计也打水漂了，但至少能听个响啊。报告分析说，问题不出在技术或者人才，而是现在的AI系统普遍“记性差”，没法真正融入到核心工作流里。说白了，你不能只把它当个工具买回来，得像处对象一样，深度磨合、建立关系才行。
+
+这话说回来，开源社区总能给我们带来希望。腾讯开源了一个叫WeChat-YATT的训练库，专门解决多模态和强化学习的效率瓶颈。昆仑万维更是重量级，直接开源了世界模型Matrix-Game 2.0。谷歌的Genie 3还没影呢，咱们国产的开源版已经能让大家玩起来了。只有1.8B大小，单块GPU就能实时生成可交互的虚拟世界。你传一张图，就能在里面像玩游戏一样到处溜达。这下，我上传一张猫主子的照片，然后进去沉浸式撸猫的梦想，是不是就不远了？
+
+除了这些大项目，GitHub上还有几个有意思的开源小玩意儿。想摆脱商业邮件服务商？可以试试BillionMail。喜欢极简音乐播放器？SPlayer了解一下，界面清爽功能还挺全。还有个叫GhostTrack的项目，能追踪位置和手机号，听着挺酷，但咱们也得时刻提醒自己，技术虽好，隐私和伦理的红线可千万不能踩。哦，对了，还有个叫bytebot的AI桌面管家，动动嘴就能让电脑干活，这才是真正的“君子动口不动手”啊。
+
+最后，分享几条社区里的热点。AI大牛吴恩达免费发了本电子书，专门指导你怎么找AI相关的工作，从简历到面试技巧，一条龙服务，堪称“求职保姆”。社交网络上大家也在热议，AI绘画的提示词是不是越长越好？有网友就发现，他用二三十个词的效果，和别人几百个词的小作文比，好像也差不太多。这事儿吧，就像做菜，有时候调料放多了，反而盖住了食材本身的味道，对吧？
+
+还有，OpenAI在印度推出了个超低价的ChatGPT Go计划，一个月只要4.55美元，让更多人能用上顶级AI。谷歌Gemini也上线了Storybook功能，你可以和孩子一起，用家里的照片创作一本独一无二的故事书。你看，AI不光是生产力工具，也能成为我们生活里温馨有趣的一部分。
+
+今天的情报就到这里，注意隐蔽，赶紧撤离。
+
+---
+**本期关键词:**
+#DeepSeek V3.1
+#Higgsfield AI
+#Draw-to-Video
+#英伟达
+#Nemotron Nano 2
+#小红书
+#DynamicFace
+#腾讯
+#WeChat-YATT
+#AI投资回报率
+#昆仑万维
+#Matrix-Game 2.0
+#Gemini API
+#开源
+#吴恩达
+#提示词工程
+#ChatGPT Go
+
+## Short: Podcast Formatting 
+
+砸钱做AI，95%的企业却打了水漂？
+AI画画，提示词真是越长越好吗？
+随手画一笔就能生成视频，还要导演干嘛？
+
+三问炼心，嘿，亲爱的V，欢迎收听新一期的来生情报站，我是你们的老朋友，何夕2077。闲话少说，情报上膛。
+
+首先，DeepSeek V3.1悄悄上线，上下文窗口直接拉到128K。什么概念？就是你扔给它一本十几万字的小说或者整个代码库，它都能一口气读完，不带喘的。推理能力提升了四成，胡说八道的“幻觉”也少了近四成。唯一美中不足嘛，大家期待的R2模型还在“路上堵着呢”。
+
+另一边，英伟达也放出了个小钢炮Nemotron Nano 2，参数不大，性能可不小。它用了一种混合架构，让处理速度比同类模型快了6倍，成本还削减了60%。主打一个“花小钱，办大事”。说到省钱，Gemini API现在可以直接抓取URL内容了，网页、PDF、图片链接通吃，开发者们可以省下一笔开销，直接让模型自己网上冲浪。
+
+聊完这些硬核的，再看看创意工具。Higgsfield AI的Draw-to-Video简直是懒人福音，不用再绞尽脑汁想提示词，在图片上画个圈、画个箭头，AI就心领神会地让它动起来，创作门槛直接降到地板。国内的小红书也没闲着，发布了DynamicFace技术，专治视频换脸时人脸闪烁、表情不连贯的老毛病，主打一个“可控”和“稳定”。更科幻的是昆仑万维开源的Matrix-Game 2.0，你给它一张图，它就能实时生成一个能让你进去溜达的虚拟世界，就问你科不科幻？
+
+不过，理想很丰满，现实有点骨感。麻省理工学院的研究报告说，高达95%的企业AI投资回报率是零，四百亿美元就这么听了个响。原因不是没钱没人，而是AI系统没法真正融入工作流程，像个记性不好的实习生。这事儿也提醒我们，买个AI工具不叫成功，让它跟你一块儿“成长”才算。就像那个Reddit热帖讨论的，有时候几百词的冗长提示词，效果还不如二十个词的精准指令。看来，跟AI打交道，也得讲究个“有效沟通”。
+
+最后，快速播报几个开源福利：腾讯开源了WeChat-YATT训练库；想自建邮件系统可以看看BillionMail；追求极简音乐播放的可以试试SPlayer；吴恩达老师还贴心地发布了免费的AI求职电子书，一条龙服务。
+
+今天的情报就到这里，注意隐蔽，赶紧撤离。
+
+---
+本期关键词:
+#DeepSeek V3.1
+#128K
+#Higgsfield AI
+#Draw-to-Video
+#英伟达
+#Nemotron Nano 2
+#小红书
+#DynamicFace
+#腾讯
+#WeChat-YATT
+#AI投资
+#昆仑万维
+#Matrix-Game 2.0
+#Gemini API
+#URL抓取
+#开源
\ No newline at end of file