Create podcast script file for 2025-10-18
This commit is contained in:
89
podcast/2025-10-18.md
Normal file
89
podcast/2025-10-18.md
Normal file
@@ -0,0 +1,89 @@
|
||||
# 来生小酒馆 2025/10/18
|
||||
|
||||
## Full: Podcast Formatting
|
||||
|
||||
Sora按秒计费,创作会更贵还是更自由?跟AI沟通,该用人话还是代码?你的代码能通过“屎山检测器”吗?三问炼心。
|
||||
|
||||
嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。今天的情报干货满满,咱们不绕弯子,直接开整。
|
||||
|
||||
首先,大新闻来了,OpenAI的Sora,对,就是那个能生成以假乱真视频的模型,现在终于不再是镜中花了。它已经正式登陆了微软的Azure平台,进入了公共预览阶段。这意味着啥呢?就是企业和开发者终于能通过API来调用它了。当然,天下没有免费的午餐,价格是按生成时长计费,每秒0.1美元。嗯……这个价格嘛,让高端视频AI从实验室走向商业化,变得更具体了,以后做视频的成本和效率,又得重新算一笔账了。
|
||||
|
||||
说到微软,他们最近的动作可真是一环扣一环。这边刚把Sora迎进门,那边就给另一位AI界的社交达人Claude发了张“帝国通行证”。现在,Claude可以直接在你的Microsoft 365生态里自由活动了,什么SharePoint、OneDrive、Outlook、Teams,它都能进去帮你找东西、回邮件。这感觉,就像给你的数字办公生活,配了个全知全能的智能助理,跨应用协作的画面感一下就来了,对吧?
|
||||
|
||||
还不止呢,微软还在悄悄测试一个大招,打算让Windows 11的Copilot……直接“下凡”,上手操作你电脑里的本地文件。这个功能虽然目前还藏着掖着,默认禁用,而且用户可以随时接管,但这个信号很明确:AI助手正在从云端走向你的硬盘,要跟操作系统搞深度集成了。离你的电脑变成“贾维斯”……又近了一步。
|
||||
|
||||
另一边,Anthropic也没闲着,给Claude推出了一个叫“Agent Skills”的新功能。开发者们对这个功能评价很高,说它能大大提升AI输出的专业性。简单来说,就像是给AI装上一个个“技能包”。你只要准备好结构化的专业知识文件,比如一份“入职手册”,Claude就能加载学习,秒变某个领域的专家。这让AI从“通才”向“专才”的进化,变得简单多了。
|
||||
|
||||
诶,话说回来,不止大公司在卷产品,学术圈也是神仙打架。
|
||||
|
||||
有个研究就特别有意思,简直有点反直觉。研究发现,咱们在指导AI调用工具的时候,费劲巴拉地写一堆刻板的JSON格式,效果……居然远远不如直接用简单的自然语言描述!用大白话的准确率直接提升了18个百分点,还更稳定。你看,有时候咱们总想让AI学人的规矩,结果发现,让人迁就AI,不如让AI在它熟悉的人类语言环境里自己“思考”,效果反而出奇地好。
|
||||
|
||||
还有,百度最近开源了他们的王牌模型PaddleOCR-VL,参数只有0.9B,非常轻量,却在全球文档解析榜单上拿了第一。它能精准识别109种语言的文本、表格、公式,处理复杂文档的能力相当厉害。
|
||||
|
||||
对了,还有个圈内小八卦,小米和北大联合发了篇论文,通讯作者里有那位传说被雷总以千万年薪挖角的天才少女罗福莉。但有意思的是,论文里没写她的“小米”身份,这给她的最终去向留了点悬念。
|
||||
|
||||
最后,咱们再来看看社区里有什么好玩又实用的新东西。
|
||||
|
||||
想自己从零开始训练一个大模型吗?以前觉得得有矿吧?现在不了!GitHub上有个叫minimind的项目,能让你在短短两小时内,就搞出一个26M参数的迷你GPT模型。这简直就是大模型界的“卡丁车”,虽然小,但五脏俱全。
|
||||
|
||||
还有,Python开发者们的福音来了,一个叫reflex的框架,能让你用纯Python语言来构建功能齐全的Web应用,完全不用碰JavaScript。后端同学也能轻松搞定全栈了。
|
||||
|
||||
当然,最搞笑也最实用的,还得是那个名字略带“恶意”的命令行工具——“屎山代码检测器”,英文名叫fuck-u-code。它能给你的代码评估“屎山等级”,还生成一份精美的报告。感兴趣的可以去试试,看看你的代码是“如沐春风”还是“泥石流”现场。
|
||||
|
||||
总之啊,从Sora的商业化,到AI开始理解人话,再到各种开源工具把门槛一降再降,技术的发展速度确实让人目不暇接。但好消息是,这些工具正变得越来越亲民,越来越像我们工作和生活中的伙伴。
|
||||
|
||||
今天的情报就到这里,注意隐蔽,赶紧撤离。
|
||||
|
||||
---
|
||||
**本期关键词:**
|
||||
#Sora
|
||||
#微软Azure
|
||||
#Claude
|
||||
#Microsoft365
|
||||
#Copilot
|
||||
#PaddleOCR-VL
|
||||
#AgentSkills
|
||||
#Anthropic
|
||||
#百度
|
||||
#开源
|
||||
#文生图
|
||||
#自然语言
|
||||
#JSON
|
||||
#minimind
|
||||
#reflex
|
||||
#Suno
|
||||
#小米
|
||||
#fuck-u-code
|
||||
|
||||
## Short: Podcast Formatting
|
||||
|
||||
教AI说人话还是学代码?知识是用来学的还是用来加载的?AI写歌赚钱算不算才华?
|
||||
|
||||
三问炼心,嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。闲话少说,情报速递。
|
||||
|
||||
首先,微软的AI全家桶又添新丁。OpenAI备受瞩目的视频模型Sora,现在已经登陆微软Azure开放预览,按时长计费,每秒0.1美元,看来以后刷视频真成“烧钱”了。同时,大模型里的“文化人”Claude也拿到了微软365的通行证,可以在你的OneDrive、Outlook里随便“串门”,帮你找文件、回邮件。而微软自家的Copilot也没闲着,正偷偷测试直接操作你本地文件的能力。好家伙,从云端渗透到硬盘,这是要当数字管家的节奏。
|
||||
|
||||
那我们该怎么跟这些越来越能干的AI相处呢?谷歌DeepMind更新了《人与AI指南》,教你如何打造“以人为本”而不是“华而不实”的AI。而一项研究发现,指导AI干活,你用大白话跟它说,效果居然比用刻板的JSON格式好得多,准确率提升18%。你看,跟AI打交道,还是得讲“人话”。Anthropic公司更是推出了个叫“Agent Skills”的功能,开发者可以给AI写个“入职手册”,把专业知识打包成技能包,随用随取。以后AI可能不是靠学习,而是靠“加载”技能来变聪明的。
|
||||
|
||||
科研圈也是新活不断。百度开源了自家的文档解析模型PaddleOCR-VL,参数不大,本事不小,直接登顶全球榜单。还有研究解决了文生图模型老把主角画跑偏的问题,开发出一种“人物锁定”魔法,让你的AI模特在任何背景下都保持原样。另外,小米和北大联合发了篇论文,传说中雷总重金挖来的天才少女罗福莉也在作者之列,不过论文里没写“小米”俩字,这身份归属还留着悬念呢。
|
||||
|
||||
最后,开源社区和社媒上也挺热闹。有人用AI音乐工具Suno V5,几小时做的歌赚了好几万,还贴心地分享了万能提示词教程。一个叫“屎山代码检测器”的工具火了,能给你的代码质量打分出报告,堪称程序员的“魔鬼镜子”。还有开发者用纯Python就能搭网站的reflex框架,以及让你在2小时内从零训练一个迷你GPT的minimind项目,都在降低大家玩转AI的门槛。
|
||||
|
||||
今天的情报就到这里,注意隐蔽,赶紧撤离。
|
||||
|
||||
---
|
||||
**本期关键词:**
|
||||
#Sora
|
||||
#Claude
|
||||
#Copilot
|
||||
#PaddleOCR-VL
|
||||
#Agent Skills
|
||||
#微软Azure
|
||||
#Microsoft 365
|
||||
#开源
|
||||
#文档解析
|
||||
#AI音乐
|
||||
#自然语言
|
||||
#人与AI指南
|
||||
#minimind
|
||||
#reflex
|
||||
Reference in New Issue
Block a user