Create podcast script file for 2025-08-09
This commit is contained in:
93
podcast/2025-08-09.md
Normal file
93
podcast/2025-08-09.md
Normal file
@@ -0,0 +1,93 @@
|
||||
# 来生小酒馆 2025/8/9
|
||||
|
||||
## Full: Podcast Formatting
|
||||
|
||||
AI会自动切换大脑,是真智能还是假聪明?
|
||||
当AI教你拍照,你的创意还属于你吗?
|
||||
顶级AI下棋频出昏招,是心态崩了还是另有隐情?
|
||||
|
||||
三问炼心。嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。
|
||||
|
||||
咱们今天的情报啊,可以说是“神仙打架,凡人吃瓜”。
|
||||
|
||||
首先,最大的新闻,GPT-5 来了。而微软呢,动作那叫一个快,几乎是同步宣布,要把GPT-5全面塞进自家的 Copilot、Azure 和 GitHub 全家桶里。这个新模型啊,据说有个智能模式,能根据你给的任务有多复杂,自己切换“大脑”的大小……嗯,听起来就像是,你让它算个“1+1”,它就用计算器;你让它写篇论文,它就立马换上博士的脑子。微软这波操作,是把它和OpenAI的友谊小船,直接升级成了航空母舰编队。
|
||||
|
||||
有新模型,自然就有福利。搞AI编程的工具Cursor,立马给付费用户送上了GPT-5的限时免费体验。同时呢,还推出了一个全新的CLI工具,就是命令行工具。这下好了,各位命令行大神们,可以一边敲着代码,一边在黑乎乎的窗口里召唤AI神龙,这感觉,嗯,很极客,很到位。
|
||||
|
||||
话说回来,AI也不是万能的。谷歌那边计划在Pixel 10手机里搞个“相机教练”功能。啥意思呢?就是你拍照前,AI会跳出来对你的构图、光线指指点点,好像你手机里住了个摄影大师。这功能听着不错,但……细思极恐啊,以后咱们朋友圈里刷到的,会不会都是一个模子刻出来的“AI推荐最佳构图”照片呢?这就有点尴尬了。
|
||||
|
||||
不仅如此,研究人员还发现,现在的大语言模型有个通病,叫“注意力盆地”。什么意思?就是你给它一大段文字,它就跟咱们上学时划重点一样,只记开头和结尾,中间那一大坨……基本就忽略了。不过别担心,科学家们已经找到了“偏方”,一种叫AttnRank的重排方法,不用重新训练模型,就能让它把注意力放回正道上。这可真是“让马儿跑,还不给马儿吃草”的典范啊。
|
||||
|
||||
聊完产品和研究,咱们来看看行业八卦,这可比技术本身好玩多了。
|
||||
|
||||
前两天那个大模型国际象棋比赛,赛前的大热门Grok 4,你猜怎么着?居然被OpenAI的o3剃了个光头,0比4惨败!决赛里的Grok 4啊,简直判若两“机”,失误送到飞起,从“冷酷杀手”直接变成了“棋坛冥灯”。这事儿现在成了圈内津津乐道的“AI心态学”经典案例,大家都在讨论,这AI是不是也需要心理辅导。
|
||||
|
||||
但另一边呢,北京世界机器人大会上,有个叫“爱宝”的通用机器人可就出尽了风头。这家伙,一会儿能打摇滚架子鼓,一会儿又能给你调杯冷饮,啥都会。背后是全球首个全栈自研的GOVLA大模型在支撑。看来,机器人正从那种只能拧螺丝的“专才”,慢慢变成啥都能干的“通才”了。
|
||||
|
||||
说到模型,现在GPT-5、Claude 4和Gemini 2.5可以说是三足鼎立。有评测报告给咱们做了个“选妃指南”:GPT-5呢,像个全能学霸,门门功课都优秀;Claude 4是个编程偏科天才,写代码无人能及;而Gemini 2.5,靠着超大的记忆窗口,处理长篇大论最拿手。所以,选哪个,就看你要它帮你干什么活儿了。
|
||||
|
||||
社交媒体上也是趣事一箩筐。比如有人发现,OpenAI那个听起来很酷的“模型自动切换”功能,居然……坏了,正在修。阿里的Qwen模型呢,生成的图片里居然带着竞品“即梦”的水印,这可真是……数据清洗的时候偷了个懒,结果把老底都给暴露了。
|
||||
|
||||
还有个特逗的,有人用“女儿考了38分”这种小学生逻辑题去测AI,结果一众顶级模型纷纷翻车,只有o3和GPT-5答对了。这再次证明,AI的智商很高,但情商和常识嘛……还有很长的路要走。
|
||||
|
||||
最后,也是最重要的一个提醒。有朋友分享,他用AI浏览器整理数据,结果AI一本正经地胡说八道,数据错得离谱。这就是所谓的“模型幻觉”。所以啊,朋友们,在享受AI便利的同时,千万要保持警惕,人工审核这道关,绝对不能省。
|
||||
|
||||
今天的情报就到这里,注意隐蔽,赶紧撤离。
|
||||
|
||||
本期关键词:
|
||||
#GPT-5
|
||||
#微软
|
||||
#Cursor
|
||||
#CLI
|
||||
#注意力盆地
|
||||
#Grok 4
|
||||
#爱宝
|
||||
#模型幻觉
|
||||
#Codex
|
||||
#Gemini
|
||||
#Claude
|
||||
#AI相机教练
|
||||
#开源
|
||||
#Qwen
|
||||
#o3
|
||||
|
||||
## Short: Podcast Formatting
|
||||
|
||||
AI帮你拍照,是帮手还是“创意杀手”?
|
||||
顶级模型连小学生逻辑题都答错,还可靠吗?
|
||||
机器人学会打鼓调酒,离走进你家还有多远?
|
||||
|
||||
Three questions to be refined and '嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077'. 今天咱们聊聊AI圈这几天的“神仙打架”和“草台班子”趣闻,信息量有点大,坐稳了。
|
||||
|
||||
首先是万众瞩目的GPT-5,微软这次是真爱了,宣布将其全面接入Copilot、Azure等全家桶。新模型最妙的是引入了智能模式,能根据任务复杂度自动切换“大小脑”,干重活儿用大核,回个邮件用小核,主打一个高效节能。
|
||||
|
||||
开发者朋友们也有福了。AI编程工具Cursor,不仅给付费用户限时免费体验GPT-5,还贴心推出了全新的CLI工具,让你可以在命令行里潇洒地召唤AI。社媒上的宝玉也强力推荐,说与GPT-5深度集成的Codex CLI能力已今非昔比,值得升级。
|
||||
|
||||
不过,AI也不是完美的。一篇新研究就揭示了大模型有个叫“注意力盆地”的毛病,说白了,它就像个只看开头结尾、疯狂跳过中间内容的学渣。好在,研究者已经找到了名为AttnRank的“划重点”方法,不用返厂重修就能治好。
|
||||
|
||||
说到“翻车”,最近的趣闻可不少。赛前夺冠热门Grok 4,在国际象棋决赛里居然被0-4横扫,从“冷酷杀手”变成了“棋坛冥灯”。还有阿里的Qwen模型,生成的图片竟然带着竞品的水印,这数据清洗工作……估计是忘了开批处理。更让人哭笑不得的是,一道关于“女儿考了38分”的小学生逻辑题,竟能把Gemini和Claude两大高手纷纷绊倒。看来,AI的智商和人类的常识,偶尔不在一个频道。
|
||||
|
||||
所以,Yangyi也发文提醒,大家在日常使用AI时,务必对“模型幻觉”保持警惕,AI一本正经地胡说八道起来,能把数据整理成一部玄幻小说,人工审查还是很有必要的。
|
||||
|
||||
当然,AI的高光时刻也很耀眼。在北京世界机器人大会上,那个叫“爱宝”的通用机器人惊艳全场,一会儿是摇滚鼓手,一会儿是冷饮店主理人,背后全靠全栈自研的GOVLA大模型撑腰,预示着通用机器人正从科幻走进现实。谷歌也计划在Pixel 10里内置一位“相机教练”,在你按下快门前就提供构图建议。虽然有人担心这会让照片变得千篇一律,但对摄影新手来说,可能是个不错的消息。
|
||||
|
||||
最后快速总结一下顶级模型的对决:综合来看,GPT-5像个全科优等生,Claude 4是编程偏科天才,而Gemini 2.5 Pro凭借超大窗口,在处理长文档时无人能及。但有趣的是,Reddit上有帖子指出,GPT-5 Mini这个“小个子”,在某些榜单上已经悄悄超越了几位“大块头”,完美诠释了“浓缩就是精华”。
|
||||
|
||||
今天的情报就到这里,注意隐蔽,赶紧撤离。
|
||||
|
||||
---
|
||||
**本期关键词:**
|
||||
#GPT-5
|
||||
#微软
|
||||
#Cursor
|
||||
#注意力盆地
|
||||
#模型幻觉
|
||||
#Grok 4
|
||||
#爱宝
|
||||
#相机教练
|
||||
#Copilot
|
||||
#Codex
|
||||
#Gemini
|
||||
#Claude
|
||||
#Qwen
|
||||
#GOVLA
|
||||
Reference in New Issue
Block a user