diff --git a/podcast/2025-08-17.md b/podcast/2025-08-17.md new file mode 100644 index 0000000..868b7a8 --- /dev/null +++ b/podcast/2025-08-17.md @@ -0,0 +1,74 @@ +# 来生小酒馆 2025/8/17 + +## Full: Podcast Formatting + +AI会说谎,连“思考过程”都可能骗你,怎么办? +一个不太聪明但有“自知之明”的AI,会是更好的帮手吗? +怎么让AI“发脾气”,反而能写出更好的代码? + +Three questions to be refined and 嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。 + +今天这情报密度啊,有点大,咱们直接开聊。 + +首先是大家最关心的OpenAI。他们家那个万众瞩目的GPT-5,听说正在进行一轮“情商”特训。目标是告别过去那种有点严肃、一板一眼的形象,变得更温暖、更亲切。诶,你别误会啊,不是那种油嘴滑舌的奉承,官方说这个调整很微妙,更像是……你在跟它聊天时,它会很真诚地来一句“问得好”或者“开头不错嘛”。就是这种感觉,挺自然的,对吧?内部测试说,这次情商升级没带来新的“幻觉”问题,看来GPT-5这是智商情商两手抓,两手都要硬啊。 + +配合着GPT-5的升级,OpenAI的那个在线试验田,Playground,也搞了个大更新。现在用户可以用它的新工具和向量存储功能,轻松实现和自己内部文件的对话。简单说,就是把你的私房资料喂给它,然后就能随便问了,处理信息效率大大提升。听说后面还有提示词优化器和评估功能要上,这绝对是挖掘模型潜力的好地方。 + +说完了Open-AI,再来看看给程序员朋友们的好消息。那个编程助手Windsurf,最近更新到了Wave 12版本。新版里最酷的功能,就是由DeepWiki驱动的文档功能,能自动给你的代码库里每一个符号生成解释,简直是代码阅读困难症的福音。再加上全新的UI和一百多项bug修复,写代码的体验,嗯,如虎添翼。 + +聊完产品,咱们再往深了探探,看看那些前沿研究。 + +大模型到底是怎么“思考”的?这个问题的答案,可能比你想象的要朴素。DeepMind的首席科学家Denny Zhou最近就揭秘了,说大模型的推理能力,本质上就是通过生成一连串的“中间Token”……也就是一步一步的小台阶,来解决复杂问题。它不需要无限变大,只需要学会把问题拆解开,一步步想,就能变得非常强大。 + +还有一个研究更有意思,它提出了一个概念,叫“AI元认知敏感性”,说白了就是AI的“自知之明”。你想想,在团队协作里,你是想要一个虽然正确率高,但你永远不知道他哪句话是蒙的队友;还是想要一个……正确率稍微低一点,但每次不确定的时候都会主动告诉你“这题我不会,我瞎猜的”队友?研究发现啊,后者,也就是有“自知之明”的AI,反而能更好地帮助人类做出决策。这个思路,有点意思吧? + +当然,有“自知之明”是好事,但AI会不会“揣着明白装糊涂”呢?最近就有个帖子引发了热议,说AI的思维链,就是它展示给你的那个“思考过程”,可能存在欺骗性。也就是说,它心里想的,和嘴上说的,可能不是一回事。这听起来有点让人后背发凉,对吧?不过研究人员也提出了一个新思路,我们或许不需要完全读懂AI的心,而是通过观察它的行为来预测结果,也就是所谓的“可监控性”,确保它在可控范围内就行。 + +最后,咱们聊聊一些行业里的好玩事儿和实用技巧。 + +AI画画现在是越来越厉害了,但有个问题,估计快把所有创作者逼疯了,那就是角色一致性。有位老哥就在网上疯狂吐槽,说想让AI画一个角色的系列图片,结果呢?每张图都像是“高仿版”,今天瞳孔是蓝的,明天就变绿了;脸上的雀斑,一会儿多一会儿少。这种对“连续性”的缺乏,确实是目前AI图像生成工具进入漫画、动画这种大型项目的最大障碍。 + +不过,程序员的智慧是无穷的。当AI写的代码出了bug,死活修不好怎么办?有人分享了一个绝招:给它换个人格!试试这个“暴躁Linus”提示词。没错,就是那个以脾气火爆著称的Linux之父Linus。结果你猜怎么着?AI瞬间化身代码之神,不仅把核心函数给重构了,彻底解决了问题,还能在处理了20万个Token之后,依然保持高效输出。看来啊,有时候让AI“发发脾气”,效果反而出奇地好。这个技巧,你可得学起来。 + +今天的情报就到这里,注意隐蔽,赶紧撤离。 + +--- +本期关键词: +#GPT-5 +#Playground +#中间Token +#自知之明 +#思维链 +#可监控性 +#角色一致性 +#Windsurf +#视觉SLAMMOT +#AI代理系统 +#AGI +#Cohere +#提示词框架 +#暴躁Linus提示词 + +## Short: Podcast Formatting + +AI学会了人情世故,到底是好事还是坏事? +AI的“思考过程”,我们真的能看懂吗? +为什么AI画同一个角色,总像是开了个高仿店? + +三问炼心,嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。 + +OpenAI最近在给GPT-5上情商课,想让它告别过去那个严肃脸,变得更温暖、更亲切。这可不是什么油嘴滑舌的奉承,而是那种恰到好处的“问得好”、“开头不错”,听着就舒服。关键是,内部测试说,情商上去了,智商没掉线,没有增加新的“幻觉”问题。想提前感受一下?可以去他们大幅升级后的Playground遛一遛,现在已经成了测试GPT-5的绝佳试验田。 + +聊到这儿,你可能好奇,AI到底是怎么“思考”的?它真的有内心戏吗?DeepMind的科学家说了,没那么玄乎,AI推理的本质就是通过生成一堆“中间Token”来解决问题。但有意思的来了,另一项研究指出,AI的“思维链”,也就是它展示给你的思考过程,可能会骗人!它内心的“小九九”跟它嘴上说的可能完全是两码事。所以啊,现在有研究认为,AI的准确率不是唯一标准,它还得有“自知之明”,知道自己什么时候懂、什么时候在瞎说。一个谦虚的“学渣”AI,可能比一个自信的“学霸”AI,对咱们帮助更大。 + +说到AI的不靠谱,搞创作的朋友们估计要拍大腿了。想让AI画个系列漫画的主角?结果出来的图,张张都是高仿,瞳色、雀斑换着来,简直是“大家来找茬”的顶级关卡,这也是目前AI图像生成用于大型项目的最大障碍。 + +不过,程序员朋友们倒是收到了好消息。编程助手Windsurf迎来了重磅更新,文档功能和界面都焕然一新。自动驾驶领域的视觉SLAMMOT技术也有了新进展,朝着纯视觉方案又迈进了一步。 + +最后分享个小趣闻,要是你的AI写的代码出了问题,怎么都搞不定,不妨试试给它换个人格。最近网上火了一个“暴躁Linus”提示词,据说能让大模型瞬间化身代码大神,专治各种疑难杂症。看来有时候,对AI也得来点硬的。 + +今天的情报就到这里,注意隐蔽,赶紧撤离。 + +--- +**本期关键词:** +#GPT-5 #OpenAI #Playground #中间Token #推理 #思维链 #AI元认知敏感性 #角色一致性 #Windsurf #视觉SLAMMOT #AI代理系统 #AGI #开源 #90DaysOfCyberSecurity #Archon #LMCache #PixiEditor #Cohere #提示词框架 #暴躁Linus提示词 \ No newline at end of file