来生小酒馆 2025/9/2

Full: Podcast Formatting

AI写代码，是在制造新的“代沟”吗？ AI模型也会有“选择困难症”？当AI学会操作App，我们的手机还属于自己吗？

Three questions to be refined and '嘿，亲爱的V，欢迎收听新一期的来生情报站，我是你们的老朋友，何夕2077'. 诶，今天咱们聊点有意思的。

话说回来，再厉害的模型，也怕更新出岔子，对吧？Anthropic 家的旗舰模型 Claude，前两天就经历了短暂的“降智”时刻。官方后来发了个报告，大大方方承认了，说哎呀不好意思，我们为了提升效率，更新了点东西，结果……把模型给更“傻”了。好在团队反应神速，紧急回滚了版本，让Claude的智力又重回巅峰。你看，这坦诚的“翻车”现场，反而赢得了不少用户的尊重。毕竟，谁家AI还没个闹情绪的时候呢，可以理解，可以理解。

另一边的微软呢，也没闲着，他们搞了个新地方，叫Copilot实验室。听这名字，感觉就是未来AI功能的孵化器和游乐场。打头阵的是一个叫“Copilot音频表达”的工具，能把你的文字变成充满感情的语音。不管是温柔的睡前故事，还是激昂的演讲稿，它都能给你念出来。这个嘛，听起来挺适合我这种懒得自己录音的播客主……是不是可以考虑一下？

说到让AI干活，那阿里的Qwen团队可是放了个大招。他们发布了两个GUI自动化神器，一个叫GUI-Owl，一个叫Mobile-Agent-v3。说白了，就是教AI怎么像人一样，看懂手机和电脑上的各种APP界面，然后自己动手去操作。你想想，以后让AI帮你点外卖、订票、处理工作流程……嗯，听起来是挺方便的，就是不知道它会不会偷偷用我的账号刷短视频。

接着聊点研究。未来的AI医生会是什么样？一份新研究让GPT-5去考了个放射肿瘤学的专业资格试，你猜怎么着？准确率高达92.8%！堪称学霸级的“实习医生”。不过，研究也特别强调了，虽然它很厉害，也很少瞎说，但在处理复杂的临床病例时，还是会犯错。所以啊，AI是个好帮手，但想完全替代人类专家的监督，路还长着呢。

还有个好玩的研究，科学家们去分析了一个超强的象棋AI，叫Leela Chess Zero，想看看它下棋的时候脑子里在想啥。结果发现，它根本不是一路顺风地找到最佳答案，而是充满了“纠结”和“反复”。有时候明明找到了正确答案，诶，它又给扔了，换个思路，直到最后一刻才想明白，“啊，原来还是第一个好”。看来，顶级的AI，也有严重的选择困难症啊！

行业方面呢，也有些新动向。根据Fastly的一项调查，AI写代码这事儿，在资深程序员里头已经相当普遍了。三分之一的资深大佬表示，他们超过一半的代码都是AI生成的，这个产出量是初级开发者的2.5倍。反倒是初级开发者更依赖传统手打。你看，这算不算是一种编码界的“代沟”正在形成呢？

说到开源，最近真是神仙打架。那个大家印象里送外卖的美团，一出手就搞了个开源大模型，叫Longcat-Flash-Chat，在好几个测试里，性能直追甚至超过了DeepSeek和Claude的一些版本，直接让海外技术圈都刮目相看。谁说送外卖的不能搞硬核科技？美团这次真是结结实实地秀了一把肌肉。

另外，如果你觉得玩AI绘画太复杂，那一定要看看Fooocus这个项目，它把Stable Diffusion的操作简化到了极致，让你只需要关心创意和想法就行，体验跟Midjourney差不多，怪不得在GitHub上那么火。还有像Activepieces，一个开源版的Zapier，帮你连接各种应用，打造自己的自动化工作流，也是相当实用。

最后分享几个社交媒体上的好东西。有人发现了一个让AI精准模仿图片里人物动作的秘笈，叫nano banana，据说成功率90%以上，简直是AI艺术家的福音。还有一位博主，慷慨分享了一个生成“二次元单身狗蛋蛋的忧伤”风格图片的模版，那个画面感……怎么说呢，就是那种你在快餐店孤独地吃着饭，手机里是你心爱的二次元老婆，结果一抬头，发现你老婆的coser正和别人在角落里亲密依偎……这种苦涩又讽刺的赛博忧伤，被一个提示词精准拿捏了。只能说，高手在民间啊。

今天的情报就到这里，注意隐蔽，赶紧撤离。

本期关键词: #Anthropic #Claude #微软 #Copilot #阿里巴巴 #GUI自动化 #GPT-5 #AI幻觉 #AI编码 #企业级大模型 #美团 #开源模型 #GUI-Owl #Mobile-Agent-v3 #Leela Chess Zero #Safe-Control #DMP #Fastly #阿里通义 #Longcat-Flash-Chat #Step-Audio 2 mini #Activepieces #Fooocus #上下文工程 #nano banana

Short: Podcast Formatting

AI写代码，是程序员的福音还是“代沟”的开始？ AI模型犯错，是该藏着掖着还是大方承认？当AI学会了“言外之意”，语音助手会变成知心大姐吗？

三问炼心，嘿，亲爱的V，欢迎收听新一期的来生情报站，我是你们的老朋友，何夕2077。今天的情报信息量有点大，咱们直接开聊。

先说说大厂动态。Anthropic前两天给自家的Claude模型升级，结果一不小心给整“降智”了。好在官方反应快，立马承认错误、回滚版本，模型智商重回高地。这波坦诚操作，反倒赢得了不少好感，毕竟谁家的AI还没个闹情绪的时候呢？另一边，微软搞了个新玩意儿叫“Copilot实验室”，听着就像AI功能的游乐场。首发项目是“音频表达”，能让你的文字带上感情，不管是温柔的睡前故事还是激昂的演讲，都能给你念出来。

阿里Qwen团队也没闲着，发布了GUI-Owl和Mobile-Agent-v3，说白了就是教AI怎么像人一样看懂手机屏幕、点点点。这套组合拳，目标直指通用GUI自动化，以后让AI帮你点外卖可能真不是梦。说到外卖，美团这次也跨界了，发布了首个开源大模型Longcat-Flash-Chat，性能相当能打，看来送外卖的也能搞硬核科技。

再看看前沿研究。未来的GPT-5在放射肿瘤学考试里拿了92.8%的高分，堪称学霸级“实习医生”，但处理复杂病例还是会犯错，所以离了人类专家还差得远。还有个有趣的研究发现，AI下棋也跟人一样，会“选择困难症”发作，找到正确答案了还可能先扔掉，最后关头才捡回来。为了让AI更靠谱，研究员们也是拼了，搞出个叫“解码记忆管道”的方法，能把AI幻觉检测的效率提速三倍，让AI的“自我反省”更快更高效。

行业方面，开发者圈子正悄悄发生变化。调查显示，资深程序员有三分之一的人，一半以上的代码都是AI写的，反倒是新手更爱自己敲。这算不算一种编码界的“代沟”？对了，受不了谷歌AI搜索摘要的朋友们有福了，有网友发现，在搜索词后面加个 -fuck，世界瞬间清净。而在国内，企业用大模型跟不要钱似的，上半年Token消耗量暴增363%，阿里通义占了头筹。

最后，开源社区依然是宝藏频出。除了前面说的美团模型，还有能听懂“言外之意”的阶跃星辰Step-Audio 2模型；被称为开源版Zapier的Activepieces；让AI绘画变简单的Fooocus；以及能把电子书变成有声书的abogen。社交媒体上也是各种骚操作，有人分享用工具组合轻松做商业研究，有人教你怎么用nano banana精准复刻图片人物姿势，还有人把“二次元单身狗蛋蛋的忧伤”这种复杂情绪，总结成了可复用的AI绘画模板。不得不说，高手在民间啊。

今天的情报就到这里，注意隐蔽，赶紧撤离。

本期关键词: #Claude #Copilot #GUI自动化 #GPT-5 #AI幻觉 #AI编码 #企业级大模型 #阿里通义 #开源模型 #美团 #Step-Audio #Activepieces #Fooocus #abogen #上下文工程 #nano banana

8.1 KiB Raw Blame History Unescape Escape

来生小酒馆 2025/9/2

Full: Podcast Formatting

Short: Podcast Formatting

8.1 KiB

Raw Blame History