Create podcast script file for 2025-10-18

This commit is contained in:
何夕2077
2025-10-17 23:12:24 +08:00
parent 330f60dc2a
commit f25d1d6edb

89
podcast/2025-10-18.md Normal file
View File

@@ -0,0 +1,89 @@
# 来生小酒馆 2025/10/18
## Full: Podcast Formatting
Sora按秒计费创作会更贵还是更自由跟AI沟通该用人话还是代码你的代码能通过“屎山检测器”吗三问炼心。
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天的情报干货满满咱们不绕弯子直接开整。
首先大新闻来了OpenAI的Sora就是那个能生成以假乱真视频的模型现在终于不再是镜中花了。它已经正式登陆了微软的Azure平台进入了公共预览阶段。这意味着啥呢就是企业和开发者终于能通过API来调用它了。当然天下没有免费的午餐价格是按生成时长计费每秒0.1美元。嗯……这个价格嘛让高端视频AI从实验室走向商业化变得更具体了以后做视频的成本和效率又得重新算一笔账了。
说到微软他们最近的动作可真是一环扣一环。这边刚把Sora迎进门那边就给另一位AI界的社交达人Claude发了张“帝国通行证”。现在Claude可以直接在你的Microsoft 365生态里自由活动了什么SharePoint、OneDrive、Outlook、Teams它都能进去帮你找东西、回邮件。这感觉就像给你的数字办公生活配了个全知全能的智能助理跨应用协作的画面感一下就来了对吧
还不止呢微软还在悄悄测试一个大招打算让Windows 11的Copilot……直接“下凡”上手操作你电脑里的本地文件。这个功能虽然目前还藏着掖着默认禁用而且用户可以随时接管但这个信号很明确AI助手正在从云端走向你的硬盘要跟操作系统搞深度集成了。离你的电脑变成“贾维斯”……又近了一步。
另一边Anthropic也没闲着给Claude推出了一个叫“Agent Skills”的新功能。开发者们对这个功能评价很高说它能大大提升AI输出的专业性。简单来说就像是给AI装上一个个“技能包”。你只要准备好结构化的专业知识文件比如一份“入职手册”Claude就能加载学习秒变某个领域的专家。这让AI从“通才”向“专才”的进化变得简单多了。
诶,话说回来,不止大公司在卷产品,学术圈也是神仙打架。
有个研究就特别有意思简直有点反直觉。研究发现咱们在指导AI调用工具的时候费劲巴拉地写一堆刻板的JSON格式效果……居然远远不如直接用简单的自然语言描述用大白话的准确率直接提升了18个百分点还更稳定。你看有时候咱们总想让AI学人的规矩结果发现让人迁就AI不如让AI在它熟悉的人类语言环境里自己“思考”效果反而出奇地好。
还有百度最近开源了他们的王牌模型PaddleOCR-VL参数只有0.9B非常轻量却在全球文档解析榜单上拿了第一。它能精准识别109种语言的文本、表格、公式处理复杂文档的能力相当厉害。
对了,还有个圈内小八卦,小米和北大联合发了篇论文,通讯作者里有那位传说被雷总以千万年薪挖角的天才少女罗福莉。但有意思的是,论文里没写她的“小米”身份,这给她的最终去向留了点悬念。
最后,咱们再来看看社区里有什么好玩又实用的新东西。
想自己从零开始训练一个大模型吗以前觉得得有矿吧现在不了GitHub上有个叫minimind的项目能让你在短短两小时内就搞出一个26M参数的迷你GPT模型。这简直就是大模型界的“卡丁车”虽然小但五脏俱全。
还有Python开发者们的福音来了一个叫reflex的框架能让你用纯Python语言来构建功能齐全的Web应用完全不用碰JavaScript。后端同学也能轻松搞定全栈了。
当然最搞笑也最实用的还得是那个名字略带“恶意”的命令行工具——“屎山代码检测器”英文名叫fuck-u-code。它能给你的代码评估“屎山等级”还生成一份精美的报告。感兴趣的可以去试试看看你的代码是“如沐春风”还是“泥石流”现场。
总之啊从Sora的商业化到AI开始理解人话再到各种开源工具把门槛一降再降技术的发展速度确实让人目不暇接。但好消息是这些工具正变得越来越亲民越来越像我们工作和生活中的伙伴。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#Sora
#微软Azure
#Claude
#Microsoft365
#Copilot
#PaddleOCR-VL
#AgentSkills
#Anthropic
#百度
#开源
#文生图
#自然语言
#JSON
#minimind
#reflex
#Suno
#小米
#fuck-u-code
## Short: Podcast Formatting
教AI说人话还是学代码知识是用来学的还是用来加载的AI写歌赚钱算不算才华
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。闲话少说情报速递。
首先微软的AI全家桶又添新丁。OpenAI备受瞩目的视频模型Sora现在已经登陆微软Azure开放预览按时长计费每秒0.1美元看来以后刷视频真成“烧钱”了。同时大模型里的“文化人”Claude也拿到了微软365的通行证可以在你的OneDrive、Outlook里随便“串门”帮你找文件、回邮件。而微软自家的Copilot也没闲着正偷偷测试直接操作你本地文件的能力。好家伙从云端渗透到硬盘这是要当数字管家的节奏。
那我们该怎么跟这些越来越能干的AI相处呢谷歌DeepMind更新了《人与AI指南》教你如何打造“以人为本”而不是“华而不实”的AI。而一项研究发现指导AI干活你用大白话跟它说效果居然比用刻板的JSON格式好得多准确率提升18%。你看跟AI打交道还是得讲“人话”。Anthropic公司更是推出了个叫“Agent Skills”的功能开发者可以给AI写个“入职手册”把专业知识打包成技能包随用随取。以后AI可能不是靠学习而是靠“加载”技能来变聪明的。
科研圈也是新活不断。百度开源了自家的文档解析模型PaddleOCR-VL参数不大本事不小直接登顶全球榜单。还有研究解决了文生图模型老把主角画跑偏的问题开发出一种“人物锁定”魔法让你的AI模特在任何背景下都保持原样。另外小米和北大联合发了篇论文传说中雷总重金挖来的天才少女罗福莉也在作者之列不过论文里没写“小米”俩字这身份归属还留着悬念呢。
最后开源社区和社媒上也挺热闹。有人用AI音乐工具Suno V5几小时做的歌赚了好几万还贴心地分享了万能提示词教程。一个叫“屎山代码检测器”的工具火了能给你的代码质量打分出报告堪称程序员的“魔鬼镜子”。还有开发者用纯Python就能搭网站的reflex框架以及让你在2小时内从零训练一个迷你GPT的minimind项目都在降低大家玩转AI的门槛。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#Sora
#Claude
#Copilot
#PaddleOCR-VL
#Agent Skills
#微软Azure
#Microsoft 365
#开源
#文档解析
#AI音乐
#自然语言
#人与AI指南
#minimind
#reflex