Create podcast script file for 2025-10-18

2025-10-17 23:12:24 +08:00
parent 330f60dc2a
commit f25d1d6edb
1 changed files with 89 additions and 0 deletions
--- a/podcast/2025-10-18.md
+++ b/podcast/2025-10-18.md
@@ -0,0 +1,89 @@
+# 来生小酒馆 2025/10/18
+
+## Full: Podcast Formatting 
+
+Sora按秒计费，创作会更贵还是更自由？跟AI沟通，该用人话还是代码？你的代码能通过“屎山检测器”吗？三问炼心。
+
+嘿，亲爱的V，欢迎收听新一期的来生情报站，我是你们的老朋友，何夕2077。今天的情报干货满满，咱们不绕弯子，直接开整。
+
+首先，大新闻来了，OpenAI的Sora，对，就是那个能生成以假乱真视频的模型，现在终于不再是镜中花了。它已经正式登陆了微软的Azure平台，进入了公共预览阶段。这意味着啥呢？就是企业和开发者终于能通过API来调用它了。当然，天下没有免费的午餐，价格是按生成时长计费，每秒0.1美元。嗯……这个价格嘛，让高端视频AI从实验室走向商业化，变得更具体了，以后做视频的成本和效率，又得重新算一笔账了。
+
+说到微软，他们最近的动作可真是一环扣一环。这边刚把Sora迎进门，那边就给另一位AI界的社交达人Claude发了张“帝国通行证”。现在，Claude可以直接在你的Microsoft 365生态里自由活动了，什么SharePoint、OneDrive、Outlook、Teams，它都能进去帮你找东西、回邮件。这感觉，就像给你的数字办公生活，配了个全知全能的智能助理，跨应用协作的画面感一下就来了，对吧？
+
+还不止呢，微软还在悄悄测试一个大招，打算让Windows 11的Copilot……直接“下凡”，上手操作你电脑里的本地文件。这个功能虽然目前还藏着掖着，默认禁用，而且用户可以随时接管，但这个信号很明确：AI助手正在从云端走向你的硬盘，要跟操作系统搞深度集成了。离你的电脑变成“贾维斯”……又近了一步。
+
+另一边，Anthropic也没闲着，给Claude推出了一个叫“Agent Skills”的新功能。开发者们对这个功能评价很高，说它能大大提升AI输出的专业性。简单来说，就像是给AI装上一个个“技能包”。你只要准备好结构化的专业知识文件，比如一份“入职手册”，Claude就能加载学习，秒变某个领域的专家。这让AI从“通才”向“专才”的进化，变得简单多了。
+
+诶，话说回来，不止大公司在卷产品，学术圈也是神仙打架。
+
+有个研究就特别有意思，简直有点反直觉。研究发现，咱们在指导AI调用工具的时候，费劲巴拉地写一堆刻板的JSON格式，效果……居然远远不如直接用简单的自然语言描述！用大白话的准确率直接提升了18个百分点，还更稳定。你看，有时候咱们总想让AI学人的规矩，结果发现，让人迁就AI，不如让AI在它熟悉的人类语言环境里自己“思考”，效果反而出奇地好。
+
+还有，百度最近开源了他们的王牌模型PaddleOCR-VL，参数只有0.9B，非常轻量，却在全球文档解析榜单上拿了第一。它能精准识别109种语言的文本、表格、公式，处理复杂文档的能力相当厉害。
+
+对了，还有个圈内小八卦，小米和北大联合发了篇论文，通讯作者里有那位传说被雷总以千万年薪挖角的天才少女罗福莉。但有意思的是，论文里没写她的“小米”身份，这给她的最终去向留了点悬念。
+
+最后，咱们再来看看社区里有什么好玩又实用的新东西。
+
+想自己从零开始训练一个大模型吗？以前觉得得有矿吧？现在不了！GitHub上有个叫minimind的项目，能让你在短短两小时内，就搞出一个26M参数的迷你GPT模型。这简直就是大模型界的“卡丁车”，虽然小，但五脏俱全。
+
+还有，Python开发者们的福音来了，一个叫reflex的框架，能让你用纯Python语言来构建功能齐全的Web应用，完全不用碰JavaScript。后端同学也能轻松搞定全栈了。
+
+当然，最搞笑也最实用的，还得是那个名字略带“恶意”的命令行工具——“屎山代码检测器”，英文名叫fuck-u-code。它能给你的代码评估“屎山等级”，还生成一份精美的报告。感兴趣的可以去试试，看看你的代码是“如沐春风”还是“泥石流”现场。
+
+总之啊，从Sora的商业化，到AI开始理解人话，再到各种开源工具把门槛一降再降，技术的发展速度确实让人目不暇接。但好消息是，这些工具正变得越来越亲民，越来越像我们工作和生活中的伙伴。
+
+今天的情报就到这里，注意隐蔽，赶紧撤离。
+
+---
+**本期关键词:**
+#Sora
+#微软Azure
+#Claude
+#Microsoft365
+#Copilot
+#PaddleOCR-VL
+#AgentSkills
+#Anthropic
+#百度
+#开源
+#文生图
+#自然语言
+#JSON
+#minimind
+#reflex
+#Suno
+#小米
+#fuck-u-code
+
+## Short: Podcast Formatting 
+
+教AI说人话还是学代码？知识是用来学的还是用来加载的？AI写歌赚钱算不算才华？
+
+三问炼心，嘿，亲爱的V，欢迎收听新一期的来生情报站，我是你们的老朋友，何夕2077。闲话少说，情报速递。
+
+首先，微软的AI全家桶又添新丁。OpenAI备受瞩目的视频模型Sora，现在已经登陆微软Azure开放预览，按时长计费，每秒0.1美元，看来以后刷视频真成“烧钱”了。同时，大模型里的“文化人”Claude也拿到了微软365的通行证，可以在你的OneDrive、Outlook里随便“串门”，帮你找文件、回邮件。而微软自家的Copilot也没闲着，正偷偷测试直接操作你本地文件的能力。好家伙，从云端渗透到硬盘，这是要当数字管家的节奏。
+
+那我们该怎么跟这些越来越能干的AI相处呢？谷歌DeepMind更新了《人与AI指南》，教你如何打造“以人为本”而不是“华而不实”的AI。而一项研究发现，指导AI干活，你用大白话跟它说，效果居然比用刻板的JSON格式好得多，准确率提升18%。你看，跟AI打交道，还是得讲“人话”。Anthropic公司更是推出了个叫“Agent Skills”的功能，开发者可以给AI写个“入职手册”，把专业知识打包成技能包，随用随取。以后AI可能不是靠学习，而是靠“加载”技能来变聪明的。
+
+科研圈也是新活不断。百度开源了自家的文档解析模型PaddleOCR-VL，参数不大，本事不小，直接登顶全球榜单。还有研究解决了文生图模型老把主角画跑偏的问题，开发出一种“人物锁定”魔法，让你的AI模特在任何背景下都保持原样。另外，小米和北大联合发了篇论文，传说中雷总重金挖来的天才少女罗福莉也在作者之列，不过论文里没写“小米”俩字，这身份归属还留着悬念呢。
+
+最后，开源社区和社媒上也挺热闹。有人用AI音乐工具Suno V5，几小时做的歌赚了好几万，还贴心地分享了万能提示词教程。一个叫“屎山代码检测器”的工具火了，能给你的代码质量打分出报告，堪称程序员的“魔鬼镜子”。还有开发者用纯Python就能搭网站的reflex框架，以及让你在2小时内从零训练一个迷你GPT的minimind项目，都在降低大家玩转AI的门槛。
+
+今天的情报就到这里，注意隐蔽，赶紧撤离。
+
+---
+**本期关键词:**
+#Sora
+#Claude
+#Copilot
+#PaddleOCR-VL
+#Agent Skills
+#微软Azure
+#Microsoft 365
+#开源
+#文档解析
+#AI音乐
+#自然语言
+#人与AI指南
+#minimind
+#reflex