Create podcast script file for 2025-08-18
This commit is contained in:
81
podcast/2025-08-18.md
Normal file
81
podcast/2025-08-18.md
Normal file
@@ -0,0 +1,81 @@
|
||||
# 来生小酒馆 2025/8/18
|
||||
|
||||
## Full: Podcast Formatting
|
||||
|
||||
AI的“聪明”,究竟是真懂还是死记硬背?
|
||||
名校学历,在AI时代还值钱吗?
|
||||
当经济停滞,我们该加速还是踩刹车?
|
||||
|
||||
三问待琢磨,嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。
|
||||
|
||||
咱们开门见山啊。最近AI圈上演了一出“皇帝的新衣”,主角呢,是一个叫“分层推理模型”的家伙,简称HRM。之前大家都觉得它特厉害,以为它的推理能力强,是因为那个听起来特别高大上的“分层架构”。结果呢,ARC Prize团队闲着没事儿就去扒了扒它的底……你猜怎么着?人家的高性能,压根儿跟那个架构没太大关系,秘密武器其实是一个叫“外循环”的优化过程。说白了,它更像是在死记硬背特定题目的解法,而不是真的会举一反三。这波操作,可以说是把AI的“伪装”给撕下来了。
|
||||
|
||||
诶,说到这推理能力啊,还有个研究更有意思。上海交大的一个课题组就搞了个测试,叫PersonaEval,专门考验大模型能不能分清对话里到底是谁在说话。这就好比让AI当裁判,结果发现……这裁判有点“脸盲”。就算是顶尖的Gemini-2.5-pro,准确率也才68.8%,咱们人类呢?随随便便就能达到90.8%。所以你看,给AI喂再多知识,它要是连核心的推理都搞不定,那可能连谁是原告谁是被告都分不清,对吧?
|
||||
|
||||
聊完了技术本身,咱们再看看这股浪潮对人的影响。现在美国顶尖大学,像哈佛、MIT,正闹起一股“辍学潮”。这帮精英学子分成了两派,上演了一出现实版的冰与火之歌。一派是“加速派”,觉得时不我待,赶紧辍学去硅谷创业,生怕错过风口;另一派呢,是忧心忡忡的“末日派”,他们担心通用人工智能会带来生存危机,于是也辍学了,不过是去研究AI安全,想给狂奔的科技踩踩刹车。不管是追风还是避险,都说明一个问题,那就是传统的大学文凭,在AI时代确实是面临着不小的冲击。
|
||||
|
||||
社会层面的影响还不止于此。现在美国经济好像也按下了暂停键,进入了一种“大停滞”状态。人们既不轻易买房,也不怎么换工作了,整个社会的流动性降到了冰点。这种“原地锁定”的状态,让年轻人想换个大点的房子难,想为了更好的工作机会搬家也难,长此以往,整个经济的活力都会受到影响。
|
||||
|
||||
当然了,除了这些宏大的叙事,AI也有很多好玩又实用的东西。比如最近GitHub上火了几个开源项目:
|
||||
想给你的AI编程助手装个“超级大脑”?可以看看Archon OS。
|
||||
想几分钟内部署一个AI代理?有个叫parlant的框架很方便。
|
||||
还有白帽黑客专用的AI,叫cai,专门帮你找漏洞。
|
||||
如果你有选择困难症,Super Magic号称是第一个一体化的AI生产力平台,啥都有。
|
||||
哦对,还有一个拿了快5万星的项目叫OpenBB,简直就是给咱们普通人用的“彭博终端”,搞金融数据分析的可以关注下。
|
||||
|
||||
最后分享两个社媒上的小趣闻。一个是有位开发者爸爸,受“Vibe coding”的启发,做了个“小朋友知识卡片生成器”。孩子问个“为什么”,AI立马就能生成图文并茂的卡片,简直是守护好奇心的神器。另一个是篇叫M3-Agent的论文,介绍了一种既能处理图片视频,又有长期记忆的AI代理。嗯……也就是说,未来的AI助手可能真的能记住你上次跟它聊了什么,而不是每次都像失忆一样。
|
||||
|
||||
今天的情报就到这里,注意隐蔽,赶紧撤离。
|
||||
|
||||
---
|
||||
|
||||
**本期关键词:**
|
||||
#分层推理模型
|
||||
#核心推理能力
|
||||
#PersonaEval
|
||||
#辍学潮
|
||||
#AI安全
|
||||
#大停滞
|
||||
#社会流动性
|
||||
#开源项目
|
||||
#AI代理
|
||||
#知识卡片生成器
|
||||
#多模态代理
|
||||
|
||||
## Short: Podcast Formatting
|
||||
|
||||
AI的大脑是真聪明还是假把式?
|
||||
顶尖大学不念了,去搞AI才是正事?
|
||||
当整个社会按下暂停键,AI是推手吗?
|
||||
|
||||
三问炼心,嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。
|
||||
|
||||
最近AI界上演了一出“皇帝的新衣”。那个听起来特厉害的分层推理模型,被ARC Prize团队扒了个底朝天。结果发现,它的高分秘诀不是什么高大上的分层架构,而是靠一个叫“外循环”的优化过程,说白了,就是背题库,而不是真会推理。这操作,属实是有点尴尬。
|
||||
|
||||
说到推理,上海交大的一个研究也很有意思。他们搞了个叫PersonaEval的测试,让AI当裁判,判断对话里到底是谁在说话。结果呢?就连顶尖的Gemini-2.5-pro,准确率也才68.8%,咱们人类可是高达90.8%。看来,想让AI当个明察秋毫的法官,得先教它分清谁是原告谁是被告,核心推理能力才是硬道理。
|
||||
|
||||
模型本身还在努力进化,但它掀起的浪花已经拍到了现实社会。现在美国顶尖大学,比如哈佛、MIT,正流行一股“辍学潮”。精英学子们兵分两路:一波是“加速派”,觉得时不我待,赶紧投身硅谷创业;另一波是“末日派”,担心通用人工智能失控,干脆辍学去研究AI安全,想给狂飙的科技踩踩刹车。
|
||||
|
||||
精英们在加速与刹车之间反复横跳,而普通人的生活却似乎进入了“大停滞”状态。最近数据显示,美国人既不爱买房了,也不轻易换工作了,整个社会的流动性降到了冰点。这种“原地锁定”效应,让经济的活力都打了折扣。
|
||||
|
||||
当然,挑战之下也有机遇。开源社区就热闹非凡,涌现了一堆好东西。比如给AI编程助手装个“超级大脑”的Archon OS;能让你几分钟部署AI代理的parlant框架;还有专为白帽黑客打造的AI助手cai;号称一体化AI生产力平台的Super Magic;以及为普通人打造的金融“彭博终端”OpenBB。
|
||||
|
||||
社媒上也有温情的一面。有开发者做了个“小朋友知识卡片生成器”,把熊孩子的“十万个为什么”变成可爱的图文卡片,守护好奇心这事儿,AI也能出份力。另外,一个叫M3-Agent的论文也火了,它搞了个有多模态能力和长期记忆的AI代理,未来的AI助手可能真能记住你上周说过的话了。
|
||||
|
||||
最后,给各位开发者提一嘴,有个叫AIClient-2-API的项目,能把一些客户端工具变成强大的API,帮你绕开限制,免费丝滑地调用Claude这类模型,堪称省钱大法。
|
||||
|
||||
今天的情报就到这里,注意隐蔽,赶紧撤离。
|
||||
|
||||
---
|
||||
**本期关键词:**
|
||||
#分层推理模型
|
||||
#核心推理能力
|
||||
#AI安全
|
||||
#辍学潮
|
||||
#大停滞
|
||||
#开源
|
||||
#AI代理
|
||||
#多模态
|
||||
#知识管理
|
||||
#金融数据
|
||||
#AIClient2API
|
||||
Reference in New Issue
Block a user