Files
CloudFlare-AI-Insight-Daily/podcast/2025-09-02.md
2025-09-02 00:03:21 +08:00

8.1 KiB
Raw Blame History

来生小酒馆 2025/9/2

Full: Podcast Formatting

AI写代码是在制造新的“代沟”吗 AI模型也会有“选择困难症” 当AI学会操作App我们的手机还属于自己吗

Three questions to be refined and '嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077'. 诶,今天咱们聊点有意思的。

话说回来再厉害的模型也怕更新出岔子对吧Anthropic 家的旗舰模型 Claude前两天就经历了短暂的“降智”时刻。官方后来发了个报告大大方方承认了说哎呀不好意思我们为了提升效率更新了点东西结果……把模型给更“傻”了。好在团队反应神速紧急回滚了版本让Claude的智力又重回巅峰。你看这坦诚的“翻车”现场反而赢得了不少用户的尊重。毕竟谁家AI还没个闹情绪的时候呢可以理解可以理解。

另一边的微软呢也没闲着他们搞了个新地方叫Copilot实验室。听这名字感觉就是未来AI功能的孵化器和游乐场。打头阵的是一个叫“Copilot音频表达”的工具能把你的文字变成充满感情的语音。不管是温柔的睡前故事还是激昂的演讲稿它都能给你念出来。这个嘛听起来挺适合我这种懒得自己录音的播客主……是不是可以考虑一下

说到让AI干活那阿里的Qwen团队可是放了个大招。他们发布了两个GUI自动化神器一个叫GUI-Owl一个叫Mobile-Agent-v3。说白了就是教AI怎么像人一样看懂手机和电脑上的各种APP界面然后自己动手去操作。你想想以后让AI帮你点外卖、订票、处理工作流程……嗯听起来是挺方便的就是不知道它会不会偷偷用我的账号刷短视频。

接着聊点研究。未来的AI医生会是什么样一份新研究让GPT-5去考了个放射肿瘤学的专业资格试你猜怎么着准确率高达92.8%堪称学霸级的“实习医生”。不过研究也特别强调了虽然它很厉害也很少瞎说但在处理复杂的临床病例时还是会犯错。所以啊AI是个好帮手但想完全替代人类专家的监督路还长着呢。

还有个好玩的研究科学家们去分析了一个超强的象棋AI叫Leela Chess Zero想看看它下棋的时候脑子里在想啥。结果发现它根本不是一路顺风地找到最佳答案而是充满了“纠结”和“反复”。有时候明明找到了正确答案它又给扔了换个思路直到最后一刻才想明白“啊原来还是第一个好”。看来顶级的AI也有严重的选择困难症啊

行业方面呢也有些新动向。根据Fastly的一项调查AI写代码这事儿在资深程序员里头已经相当普遍了。三分之一的资深大佬表示他们超过一半的代码都是AI生成的这个产出量是初级开发者的2.5倍。反倒是初级开发者更依赖传统手打。你看,这算不算是一种编码界的“代沟”正在形成呢?

说到开源最近真是神仙打架。那个大家印象里送外卖的美团一出手就搞了个开源大模型叫Longcat-Flash-Chat在好几个测试里性能直追甚至超过了DeepSeek和Claude的一些版本直接让海外技术圈都刮目相看。谁说送外卖的不能搞硬核科技美团这次真是结结实实地秀了一把肌肉。

另外如果你觉得玩AI绘画太复杂那一定要看看Fooocus这个项目它把Stable Diffusion的操作简化到了极致让你只需要关心创意和想法就行体验跟Midjourney差不多怪不得在GitHub上那么火。还有像Activepieces一个开源版的Zapier帮你连接各种应用打造自己的自动化工作流也是相当实用。

最后分享几个社交媒体上的好东西。有人发现了一个让AI精准模仿图片里人物动作的秘笈叫nano banana据说成功率90%以上简直是AI艺术家的福音。还有一位博主慷慨分享了一个生成“二次元单身狗蛋蛋的忧伤”风格图片的模版那个画面感……怎么说呢就是那种你在快餐店孤独地吃着饭手机里是你心爱的二次元老婆结果一抬头发现你老婆的coser正和别人在角落里亲密依偎……这种苦涩又讽刺的赛博忧伤被一个提示词精准拿捏了。只能说高手在民间啊。

今天的情报就到这里,注意隐蔽,赶紧撤离。

本期关键词: #Anthropic #Claude #微软 #Copilot #阿里巴巴 #GUI自动化 #GPT-5 #AI幻觉 #AI编码 #企业级大模型 #美团 #开源模型 #GUI-Owl #Mobile-Agent-v3 #Leela Chess Zero #Safe-Control #DMP #Fastly #阿里通义 #Longcat-Flash-Chat #Step-Audio 2 mini #Activepieces #Fooocus #上下文工程 #nano banana

Short: Podcast Formatting

AI写代码是程序员的福音还是“代沟”的开始 AI模型犯错是该藏着掖着还是大方承认 当AI学会了“言外之意”语音助手会变成知心大姐吗

三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天的情报信息量有点大咱们直接开聊。

先说说大厂动态。Anthropic前两天给自家的Claude模型升级结果一不小心给整“降智”了。好在官方反应快立马承认错误、回滚版本模型智商重回高地。这波坦诚操作反倒赢得了不少好感毕竟谁家的AI还没个闹情绪的时候呢另一边微软搞了个新玩意儿叫“Copilot实验室”听着就像AI功能的游乐场。首发项目是“音频表达”能让你的文字带上感情不管是温柔的睡前故事还是激昂的演讲都能给你念出来。

阿里Qwen团队也没闲着发布了GUI-Owl和Mobile-Agent-v3说白了就是教AI怎么像人一样看懂手机屏幕、点点点。这套组合拳目标直指通用GUI自动化以后让AI帮你点外卖可能真不是梦。说到外卖美团这次也跨界了发布了首个开源大模型Longcat-Flash-Chat性能相当能打看来送外卖的也能搞硬核科技。

再看看前沿研究。未来的GPT-5在放射肿瘤学考试里拿了92.8%的高分堪称学霸级“实习医生”但处理复杂病例还是会犯错所以离了人类专家还差得远。还有个有趣的研究发现AI下棋也跟人一样会“选择困难症”发作找到正确答案了还可能先扔掉最后关头才捡回来。为了让AI更靠谱研究员们也是拼了搞出个叫“解码记忆管道”的方法能把AI幻觉检测的效率提速三倍让AI的“自我反省”更快更高效。

行业方面开发者圈子正悄悄发生变化。调查显示资深程序员有三分之一的人一半以上的代码都是AI写的反倒是新手更爱自己敲。这算不算一种编码界的“代沟”对了受不了谷歌AI搜索摘要的朋友们有福了有网友发现在搜索词后面加个 -fuck世界瞬间清净。而在国内企业用大模型跟不要钱似的上半年Token消耗量暴增363%,阿里通义占了头筹。

最后开源社区依然是宝藏频出。除了前面说的美团模型还有能听懂“言外之意”的阶跃星辰Step-Audio 2模型被称为开源版Zapier的Activepieces让AI绘画变简单的Fooocus以及能把电子书变成有声书的abogen。社交媒体上也是各种骚操作有人分享用工具组合轻松做商业研究有人教你怎么用nano banana精准复刻图片人物姿势还有人把“二次元单身狗蛋蛋的忧伤”这种复杂情绪总结成了可复用的AI绘画模板。不得不说高手在民间啊。

今天的情报就到这里,注意隐蔽,赶紧撤离。

本期关键词: #Claude #Copilot #GUI自动化 #GPT-5 #AI幻觉 #AI编码 #企业级大模型 #阿里通义 #开源模型 #美团 #Step-Audio #Activepieces #Fooocus #abogen #上下文工程 #nano banana