diff --git a/podcast/2025-08-09.md b/podcast/2025-08-09.md new file mode 100644 index 0000000..1a4c427 --- /dev/null +++ b/podcast/2025-08-09.md @@ -0,0 +1,93 @@ +# 来生小酒馆 2025/8/9 + +## Full: Podcast Formatting + +AI会自动切换大脑,是真智能还是假聪明? +当AI教你拍照,你的创意还属于你吗? +顶级AI下棋频出昏招,是心态崩了还是另有隐情? + +三问炼心。嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。 + +咱们今天的情报啊,可以说是“神仙打架,凡人吃瓜”。 + +首先,最大的新闻,GPT-5 来了。而微软呢,动作那叫一个快,几乎是同步宣布,要把GPT-5全面塞进自家的 Copilot、Azure 和 GitHub 全家桶里。这个新模型啊,据说有个智能模式,能根据你给的任务有多复杂,自己切换“大脑”的大小……嗯,听起来就像是,你让它算个“1+1”,它就用计算器;你让它写篇论文,它就立马换上博士的脑子。微软这波操作,是把它和OpenAI的友谊小船,直接升级成了航空母舰编队。 + +有新模型,自然就有福利。搞AI编程的工具Cursor,立马给付费用户送上了GPT-5的限时免费体验。同时呢,还推出了一个全新的CLI工具,就是命令行工具。这下好了,各位命令行大神们,可以一边敲着代码,一边在黑乎乎的窗口里召唤AI神龙,这感觉,嗯,很极客,很到位。 + +话说回来,AI也不是万能的。谷歌那边计划在Pixel 10手机里搞个“相机教练”功能。啥意思呢?就是你拍照前,AI会跳出来对你的构图、光线指指点点,好像你手机里住了个摄影大师。这功能听着不错,但……细思极恐啊,以后咱们朋友圈里刷到的,会不会都是一个模子刻出来的“AI推荐最佳构图”照片呢?这就有点尴尬了。 + +不仅如此,研究人员还发现,现在的大语言模型有个通病,叫“注意力盆地”。什么意思?就是你给它一大段文字,它就跟咱们上学时划重点一样,只记开头和结尾,中间那一大坨……基本就忽略了。不过别担心,科学家们已经找到了“偏方”,一种叫AttnRank的重排方法,不用重新训练模型,就能让它把注意力放回正道上。这可真是“让马儿跑,还不给马儿吃草”的典范啊。 + +聊完产品和研究,咱们来看看行业八卦,这可比技术本身好玩多了。 + +前两天那个大模型国际象棋比赛,赛前的大热门Grok 4,你猜怎么着?居然被OpenAI的o3剃了个光头,0比4惨败!决赛里的Grok 4啊,简直判若两“机”,失误送到飞起,从“冷酷杀手”直接变成了“棋坛冥灯”。这事儿现在成了圈内津津乐道的“AI心态学”经典案例,大家都在讨论,这AI是不是也需要心理辅导。 + +但另一边呢,北京世界机器人大会上,有个叫“爱宝”的通用机器人可就出尽了风头。这家伙,一会儿能打摇滚架子鼓,一会儿又能给你调杯冷饮,啥都会。背后是全球首个全栈自研的GOVLA大模型在支撑。看来,机器人正从那种只能拧螺丝的“专才”,慢慢变成啥都能干的“通才”了。 + +说到模型,现在GPT-5、Claude 4和Gemini 2.5可以说是三足鼎立。有评测报告给咱们做了个“选妃指南”:GPT-5呢,像个全能学霸,门门功课都优秀;Claude 4是个编程偏科天才,写代码无人能及;而Gemini 2.5,靠着超大的记忆窗口,处理长篇大论最拿手。所以,选哪个,就看你要它帮你干什么活儿了。 + +社交媒体上也是趣事一箩筐。比如有人发现,OpenAI那个听起来很酷的“模型自动切换”功能,居然……坏了,正在修。阿里的Qwen模型呢,生成的图片里居然带着竞品“即梦”的水印,这可真是……数据清洗的时候偷了个懒,结果把老底都给暴露了。 + +还有个特逗的,有人用“女儿考了38分”这种小学生逻辑题去测AI,结果一众顶级模型纷纷翻车,只有o3和GPT-5答对了。这再次证明,AI的智商很高,但情商和常识嘛……还有很长的路要走。 + +最后,也是最重要的一个提醒。有朋友分享,他用AI浏览器整理数据,结果AI一本正经地胡说八道,数据错得离谱。这就是所谓的“模型幻觉”。所以啊,朋友们,在享受AI便利的同时,千万要保持警惕,人工审核这道关,绝对不能省。 + +今天的情报就到这里,注意隐蔽,赶紧撤离。 + +本期关键词: +#GPT-5 +#微软 +#Cursor +#CLI +#注意力盆地 +#Grok 4 +#爱宝 +#模型幻觉 +#Codex +#Gemini +#Claude +#AI相机教练 +#开源 +#Qwen +#o3 + +## Short: Podcast Formatting + +AI帮你拍照,是帮手还是“创意杀手”? +顶级模型连小学生逻辑题都答错,还可靠吗? +机器人学会打鼓调酒,离走进你家还有多远? + +Three questions to be refined and '嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077'. 今天咱们聊聊AI圈这几天的“神仙打架”和“草台班子”趣闻,信息量有点大,坐稳了。 + +首先是万众瞩目的GPT-5,微软这次是真爱了,宣布将其全面接入Copilot、Azure等全家桶。新模型最妙的是引入了智能模式,能根据任务复杂度自动切换“大小脑”,干重活儿用大核,回个邮件用小核,主打一个高效节能。 + +开发者朋友们也有福了。AI编程工具Cursor,不仅给付费用户限时免费体验GPT-5,还贴心推出了全新的CLI工具,让你可以在命令行里潇洒地召唤AI。社媒上的宝玉也强力推荐,说与GPT-5深度集成的Codex CLI能力已今非昔比,值得升级。 + +不过,AI也不是完美的。一篇新研究就揭示了大模型有个叫“注意力盆地”的毛病,说白了,它就像个只看开头结尾、疯狂跳过中间内容的学渣。好在,研究者已经找到了名为AttnRank的“划重点”方法,不用返厂重修就能治好。 + +说到“翻车”,最近的趣闻可不少。赛前夺冠热门Grok 4,在国际象棋决赛里居然被0-4横扫,从“冷酷杀手”变成了“棋坛冥灯”。还有阿里的Qwen模型,生成的图片竟然带着竞品的水印,这数据清洗工作……估计是忘了开批处理。更让人哭笑不得的是,一道关于“女儿考了38分”的小学生逻辑题,竟能把Gemini和Claude两大高手纷纷绊倒。看来,AI的智商和人类的常识,偶尔不在一个频道。 + +所以,Yangyi也发文提醒,大家在日常使用AI时,务必对“模型幻觉”保持警惕,AI一本正经地胡说八道起来,能把数据整理成一部玄幻小说,人工审查还是很有必要的。 + +当然,AI的高光时刻也很耀眼。在北京世界机器人大会上,那个叫“爱宝”的通用机器人惊艳全场,一会儿是摇滚鼓手,一会儿是冷饮店主理人,背后全靠全栈自研的GOVLA大模型撑腰,预示着通用机器人正从科幻走进现实。谷歌也计划在Pixel 10里内置一位“相机教练”,在你按下快门前就提供构图建议。虽然有人担心这会让照片变得千篇一律,但对摄影新手来说,可能是个不错的消息。 + +最后快速总结一下顶级模型的对决:综合来看,GPT-5像个全科优等生,Claude 4是编程偏科天才,而Gemini 2.5 Pro凭借超大窗口,在处理长文档时无人能及。但有趣的是,Reddit上有帖子指出,GPT-5 Mini这个“小个子”,在某些榜单上已经悄悄超越了几位“大块头”,完美诠释了“浓缩就是精华”。 + +今天的情报就到这里,注意隐蔽,赶紧撤离。 + +--- +**本期关键词:** +#GPT-5 +#微软 +#Cursor +#注意力盆地 +#模型幻觉 +#Grok 4 +#爱宝 +#相机教练 +#Copilot +#Codex +#Gemini +#Claude +#Qwen +#GOVLA \ No newline at end of file