8.1 KiB
来生小酒馆 2025/9/2
Full: Podcast Formatting
AI写代码,是在制造新的“代沟”吗? AI模型也会有“选择困难症”? 当AI学会操作App,我们的手机还属于自己吗?
Three questions to be refined and '嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077'. 诶,今天咱们聊点有意思的。
话说回来,再厉害的模型,也怕更新出岔子,对吧?Anthropic 家的旗舰模型 Claude,前两天就经历了短暂的“降智”时刻。官方后来发了个报告,大大方方承认了,说哎呀不好意思,我们为了提升效率,更新了点东西,结果……把模型给更“傻”了。好在团队反应神速,紧急回滚了版本,让Claude的智力又重回巅峰。你看,这坦诚的“翻车”现场,反而赢得了不少用户的尊重。毕竟,谁家AI还没个闹情绪的时候呢,可以理解,可以理解。
另一边的微软呢,也没闲着,他们搞了个新地方,叫Copilot实验室。听这名字,感觉就是未来AI功能的孵化器和游乐场。打头阵的是一个叫“Copilot音频表达”的工具,能把你的文字变成充满感情的语音。不管是温柔的睡前故事,还是激昂的演讲稿,它都能给你念出来。这个嘛,听起来挺适合我这种懒得自己录音的播客主……是不是可以考虑一下?
说到让AI干活,那阿里的Qwen团队可是放了个大招。他们发布了两个GUI自动化神器,一个叫GUI-Owl,一个叫Mobile-Agent-v3。说白了,就是教AI怎么像人一样,看懂手机和电脑上的各种APP界面,然后自己动手去操作。你想想,以后让AI帮你点外卖、订票、处理工作流程……嗯,听起来是挺方便的,就是不知道它会不会偷偷用我的账号刷短视频。
接着聊点研究。未来的AI医生会是什么样?一份新研究让GPT-5去考了个放射肿瘤学的专业资格试,你猜怎么着?准确率高达92.8%!堪称学霸级的“实习医生”。不过,研究也特别强调了,虽然它很厉害,也很少瞎说,但在处理复杂的临床病例时,还是会犯错。所以啊,AI是个好帮手,但想完全替代人类专家的监督,路还长着呢。
还有个好玩的研究,科学家们去分析了一个超强的象棋AI,叫Leela Chess Zero,想看看它下棋的时候脑子里在想啥。结果发现,它根本不是一路顺风地找到最佳答案,而是充满了“纠结”和“反复”。有时候明明找到了正确答案,诶,它又给扔了,换个思路,直到最后一刻才想明白,“啊,原来还是第一个好”。看来,顶级的AI,也有严重的选择困难症啊!
行业方面呢,也有些新动向。根据Fastly的一项调查,AI写代码这事儿,在资深程序员里头已经相当普遍了。三分之一的资深大佬表示,他们超过一半的代码都是AI生成的,这个产出量是初级开发者的2.5倍。反倒是初级开发者更依赖传统手打。你看,这算不算是一种编码界的“代沟”正在形成呢?
说到开源,最近真是神仙打架。那个大家印象里送外卖的美团,一出手就搞了个开源大模型,叫Longcat-Flash-Chat,在好几个测试里,性能直追甚至超过了DeepSeek和Claude的一些版本,直接让海外技术圈都刮目相看。谁说送外卖的不能搞硬核科技?美团这次真是结结实实地秀了一把肌肉。
另外,如果你觉得玩AI绘画太复杂,那一定要看看Fooocus这个项目,它把Stable Diffusion的操作简化到了极致,让你只需要关心创意和想法就行,体验跟Midjourney差不多,怪不得在GitHub上那么火。还有像Activepieces,一个开源版的Zapier,帮你连接各种应用,打造自己的自动化工作流,也是相当实用。
最后分享几个社交媒体上的好东西。有人发现了一个让AI精准模仿图片里人物动作的秘笈,叫nano banana,据说成功率90%以上,简直是AI艺术家的福音。还有一位博主,慷慨分享了一个生成“二次元单身狗蛋蛋的忧伤”风格图片的模版,那个画面感……怎么说呢,就是那种你在快餐店孤独地吃着饭,手机里是你心爱的二次元老婆,结果一抬头,发现你老婆的coser正和别人在角落里亲密依偎……这种苦涩又讽刺的赛博忧伤,被一个提示词精准拿捏了。只能说,高手在民间啊。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词: #Anthropic #Claude #微软 #Copilot #阿里巴巴 #GUI自动化 #GPT-5 #AI幻觉 #AI编码 #企业级大模型 #美团 #开源模型 #GUI-Owl #Mobile-Agent-v3 #Leela Chess Zero #Safe-Control #DMP #Fastly #阿里通义 #Longcat-Flash-Chat #Step-Audio 2 mini #Activepieces #Fooocus #上下文工程 #nano banana
Short: Podcast Formatting
AI写代码,是程序员的福音还是“代沟”的开始? AI模型犯错,是该藏着掖着还是大方承认? 当AI学会了“言外之意”,语音助手会变成知心大姐吗?
三问炼心,嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。今天的情报信息量有点大,咱们直接开聊。
先说说大厂动态。Anthropic前两天给自家的Claude模型升级,结果一不小心给整“降智”了。好在官方反应快,立马承认错误、回滚版本,模型智商重回高地。这波坦诚操作,反倒赢得了不少好感,毕竟谁家的AI还没个闹情绪的时候呢?另一边,微软搞了个新玩意儿叫“Copilot实验室”,听着就像AI功能的游乐场。首发项目是“音频表达”,能让你的文字带上感情,不管是温柔的睡前故事还是激昂的演讲,都能给你念出来。
阿里Qwen团队也没闲着,发布了GUI-Owl和Mobile-Agent-v3,说白了就是教AI怎么像人一样看懂手机屏幕、点点点。这套组合拳,目标直指通用GUI自动化,以后让AI帮你点外卖可能真不是梦。说到外卖,美团这次也跨界了,发布了首个开源大模型Longcat-Flash-Chat,性能相当能打,看来送外卖的也能搞硬核科技。
再看看前沿研究。未来的GPT-5在放射肿瘤学考试里拿了92.8%的高分,堪称学霸级“实习医生”,但处理复杂病例还是会犯错,所以离了人类专家还差得远。还有个有趣的研究发现,AI下棋也跟人一样,会“选择困难症”发作,找到正确答案了还可能先扔掉,最后关头才捡回来。为了让AI更靠谱,研究员们也是拼了,搞出个叫“解码记忆管道”的方法,能把AI幻觉检测的效率提速三倍,让AI的“自我反省”更快更高效。
行业方面,开发者圈子正悄悄发生变化。调查显示,资深程序员有三分之一的人,一半以上的代码都是AI写的,反倒是新手更爱自己敲。这算不算一种编码界的“代沟”?对了,受不了谷歌AI搜索摘要的朋友们有福了,有网友发现,在搜索词后面加个 -fuck,世界瞬间清净。而在国内,企业用大模型跟不要钱似的,上半年Token消耗量暴增363%,阿里通义占了头筹。
最后,开源社区依然是宝藏频出。除了前面说的美团模型,还有能听懂“言外之意”的阶跃星辰Step-Audio 2模型;被称为开源版Zapier的Activepieces;让AI绘画变简单的Fooocus;以及能把电子书变成有声书的abogen。社交媒体上也是各种骚操作,有人分享用工具组合轻松做商业研究,有人教你怎么用nano banana精准复刻图片人物姿势,还有人把“二次元单身狗蛋蛋的忧伤”这种复杂情绪,总结成了可复用的AI绘画模板。不得不说,高手在民间啊。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词: #Claude #Copilot #GUI自动化 #GPT-5 #AI幻觉 #AI编码 #企业级大模型 #阿里通义 #开源模型 #美团 #Step-Audio #Activepieces #Fooocus #abogen #上下文工程 #nano banana