Create podcast script file for 2025-09-10

2025-09-09 23:06:07 +08:00
parent b0994f4550
commit 39e6b3fb10
1 changed files with 84 additions and 0 deletions
--- a/podcast/2025-09-10.md
+++ b/podcast/2025-09-10.md
@@ -0,0 +1,84 @@
+# 来生小酒馆 2025/9/10
+
+## Full: Podcast Formatting 
+
+AI会让“996”成为全球标配吗？
+给AI定规矩，是束缚还是保护？
+当AI工具免费，创意还值钱吗？
+
+三步走，嘿，亲爱的V，欢迎收听新一期的来生情报站，我是你们的老朋友，何夕2077。
+
+好，咱们废话不多说，直接上干货。
+
+先来看看科技巨头们又在搞什么新花样。谷歌那边啊，最近给他们的NotebookLM来了个史诗级的增强。这玩意儿现在可不是个简单的笔记本了，它摇身一变，成了你的私人报告助理。什么意思呢？就是说，它能用超过80种语言，帮你生成结构化的报告，还能智能推荐格式。你甚至可以用提示词去微调语气和风格……这意味着，咱们这些打工人终于可以告别繁琐的格式调整，把精力都放在那些闪光的创意上了，对吧？
+
+同样是谷歌，他们还干了件大事。文生视频模型Veo 3和Veo 3 Fast，现在通过Gemini API全面开放了。重点来了，价格直接大刀阔斧地砍了将近50%，还加上了现在最火的9:16竖屏视频和1080p高清输出。嗯……这基本上就是把高质量AI视频创作的门槛，从珠穆朗玛峰降到了你家门口的台阶上。全球的创作者们，你们的工具箱又变重了。哦对了，谷歌开发者社区还在搞一个AI Studio多模态挑战赛，奖金3000美刀，9月14号截止，有想法的朋友可以去露一手。
+
+说完谷歌，再聊聊阿里。通义千问发布了一个全新的语音识别模型，叫Qwen3-ASR-Flash。这模型啊，不仅在11种语言里识别准确率顶尖，它还有一个……怎么说呢，有点惊人的超能力。它能转录歌声，而且错误率低于8%。你没听错，就是你五音不全的歌声，它也能给你明明白白地转成文字。以后KTV里的麦霸们可得注意了，你唱得好不好，AI可都给你记着呢。
+
+当然，技术跑得快，规矩也得跟上。这不，中国最近就正式发布了30项人工智能国家标准，还有84项在路上。这里面覆盖了从基础软硬件到安全治理的方方面面。特别值得注意的是，针对现在很火的人形机器人，已经有15项专属国标在全力推进了。这就像什么呢？就像大家都在造各种各样的车，而我们开始修高速公路、定交通规则了。这是想把咱们的“中国方案”，推向全球的舞台啊。
+
+说到规则，就不得不提工作与生活的平衡。有个挺有意思的数据，金融科技公司Ramp分析发现，在硅谷的旧金山，周六加班的现象正在急剧增加。嗯，看来AI竞赛这股风，不仅吹热了技术，也把“卷文化”给吹起来了。
+
+不过，别光看大公司，开源社区和社媒上的分享也同样精彩。比如，字节跳动的Seedream 4.0模型，最近就有个万字长文指南火了。它能干嘛呢？能把你的宠物猫P成神话里的瑞兽，能生成角色一致的漫画，还能帮你设计PPT页面。这想象力……简直是创意AI应用的大师课。
+
+还有，B站备受期待的文本转语音模型IndexTTS2也开源了，大家最关心的就是效果到底怎么样，现在源码和模型都有了，你可以自己去试试。
+
+开源社区里还有一堆实用的小宝贝。比如说，Umi-OCR，一个离线的文字识别工具，不需要联网，保护隐私，截图、PDF都能搞定。还有个叫AutoAgent的框架，号称不用写代码就能构建复杂的AI代理。另外还有把普通割草机变智能的OpenMower，还有个被誉为本地版Canva的设计工具jaaz……你看，社区的力量总是能给我们带来惊喜。
+
+最后，有个开发者的分享我觉得很有意思。他在几个AI编程搭档之间反复横跳，发现每个模型都有自己的“脾气”，需要不同的“顺毛”技巧。这说明什么？说明工具再好，关键还是得看你怎么用，找到最适合自己工作流的那个组合，才是王道。
+
+今天的情报就到这里，注意隐蔽，赶紧撤离。
+
+本期关键词:
+#谷歌
+#NotebookLM
+#Veo3
+#阿里
+#Qwen3-ASR
+#语音识别
+#人工智能国家标准
+#人形机器人
+#开源社区
+#Umi-OCR
+#字节跳动
+#Seedream4.0
+
+## Short: Podcast Formatting 
+
+AI让工作更“卷”了吗？
+AI能听懂KTV里的跑调歌手吗？
+为AI制定国标，是铺路还是设障？
+
+嘿，亲爱的V，欢迎收听新一期的来生情报站，我是你们的老朋友，何夕2077。这周的AI圈子可真热闹，既有科技巨头们互相“卷”价格、“卷”功能，也有咱们国家队下场制定规则，咱们赶紧来看看都有哪些新动态。
+
+先看谷歌，他们家最近是懂怎么给打工人减负的。那个NotebookLM，现在能用80多种语言帮你写报告，格式都给你安排得明明白白。另一边，文生视频模型Veo 3不仅价格“腰斩”，还学会了做咱们爱看的9:16竖屏短视频。想练手的朋友也别错过，谷歌AI Studio还有个多模态挑战赛等你拿奖金。
+
+国内这边，阿里通义千问的Qwen3-ASR模型放了个大招，能把歌声转成文字，错误率还极低，以后去KTV可能得自带实时字幕了。巧了，B站也刚开源了自家的文本转语音模型IndexTTS2，效果到底惊不惊艳，大家可以亲自去试试。
+
+说到创意，字节的Seedream 4.0模型被大神挖出了万字长篇指南，能把你的宠物P成神话瑞兽，还能一条龙生成漫画和PPT，感觉想象力才是唯一的限制了。不过工具虽好，也得会用。就有开发者分享，在Gemini、DeepSeek这些模型间反复横跳后，发现每个都有自己的“小脾气”，关键还是得找到最适合自己的那一款。
+
+技术狂奔，规则也得跟上。咱们国家就正式发布了30项人工智能国家标准，连新兴的人形机器人都安排上了15项。与此同时，硅谷的数据显示，AI竞赛正让周六加班成为新常态。看来，AI带来的不只是便利，还有新的思考题啊。
+
+最后，快速盘点一下开源社区的宝藏：需要离线识别文字？有Umi-OCR。想零代码构建AI代理？试试AutoAgent。甚至还有能把你家傻瓜割草机变聪明的OpenMower。总之，工具库又丰富了。
+
+今天的情报就到这里，注意隐蔽，赶紧撤离。
+
+---
+本期关键词:
+#谷歌
+#NotebookLM
+#Veo_3
+#阿里
+#Qwen3-ASR
+#国家标准
+#人形机器人
+#开源
+#Umi-OCR
+#AutoAgent
+#字节跳动
+#Seedream_4.0
+#IndexTTS2
+#隐私
+#996
+#多模态