来生小酒馆 2025/8/3

Full: Podcast Formatting

如果你的汽车能“思考”，你还敢让它开车吗？ GPT-5，还是那个唯一的王吗？ AI开源的黄金时代，要结束了吗？

Three questions to be refined and '嘿，亲爱的V，欢迎收听新一期的来生情报站，我是你们的老朋友，何夕2077'。今天信息量有点大，咱们聊点开车的、剪视频的，再看看AI圈子里又上演了哪些“豪门恩怨”。

好，先说个跟咱们出行息息相关的事儿。理想汽车最近发布了他们全新的VLA辅助驾驶系统，还给它起了个特有意思的名字，叫“司机大模型”。这可不是以前那种只会跟着线、踩踩刹车的系统了。理想说，这回他们的理想i8，搭载的这个新系统，是能“深度思考”的。它能跟你用自然语言聊天，还能在虚拟世界里自己跟自己练车，据说驾驶体验会变得特别丝滑，也更安全。嗯……一个会思考还会跟你聊天的司机，希望它别是个话痨。

说完开车的，再聊聊搞视频的。做视频后期的朋友们，你们的福音来了。那个很火的视频工具Runway，又放了个大招，推出了一个叫Aleph的模型。简单来说，就是以后剪视频，你就动动嘴皮子就行了。跟AI说，“把这个人P掉”、“把灯光调亮点”、“给我换个航拍视角”，它就给你办了。这一下就把后期制作的门槛，咔嚓一下，夷为平地。

诶，话说回来，不管是AI司机还是AI剪辑师，都得先“看懂”这个世界，对吧？那要是遇上大雨大雾这种坏天气怎么办？有份研究就提出了一个方案，叫“AI图像修复店”。它会在图像传给AI大脑之前，先用生成模型，比如CycleGAN和pix2pix这些技术，把图像给修复好。这就好比给AI司机配上了一副全天候的魔法太阳镜，挺酷的。

当然，除了让AI看得清，咱们还希望它“懂我”。Anthropic公司就在搞一个叫“Personal Vector”的技术，能让你像捏泥人一样，去塑造AI模型的“人格”。也就是说，未来的Claude，可能就是完全为你量身定制的私人助理，完美契合你的说话风格和喜好。这个可以期待一下。

好了，聊完这些酷炫的技术，咱们来吃点圈内的大瓜。

首先是关于GPT-5的。最近关于它的传闻满天飞，有外媒爆料说，大家别指望GPT-5能再来一次“量子飞跃”了，它可能更侧重于把编程、数学这些实用技能打磨得更厉害。与此同时呢，OpenAI内部也是不太平。高管在公司内部公开抱怨，人才被Meta疯狂挖角，连之前被寄予厚望的Orion模型都因为效果不佳被降级了。不过有意思的是，即便如此，人家新一轮融资的估值，据说高达3000亿美元……嗯，只能说资本的世界，咱是越来越看不懂了。

竞争这不就来了嘛。OpenAI的老对手Anthropic，前两天直接上演了一出“分手大戏”。他们宣布，掐断了OpenAI访问自家Claude API的权限，理由是对方违反了服务条款。这事儿在科技圈可是炸开了锅，明摆着就是顶级玩家之间，竞争已经到了白热化的地步，不光是技术路线的碰撞，更是商业利益的正面交锋。

那为啥现在的AI圈会变成这样呢？沃顿商学院的一位教授Ethan Mollick，发了条推文，一针见血地指出，Llama 4的“相对失败”，是个关键的转折点。他认为，这事儿带来了三个连锁反应：一是开源模型研发的重心，开始向咱们中国转移；二是很多公司一看开源好像不太行，就纷纷转向了封闭模型；三是，这直接加剧了美国本土的AI人才争夺战。你看，这就是典型的“蝴蝶效应”啊。

当然，除了这些大厂的恩怨情仇，咱们开源社区和民间高手的创造力依然旺盛。比如说，有帮你简化开发流程的Dyad和Motia，有让你自己扮演黑客测试系统安全性的OpenBAS，还有像武功秘籍一样的JS算法库和命令行指南。社交媒体上也有各种神仙操作，有人把AI工具串起来，搞出了一套效率提升10倍的开发流程；还有人靠着几个AI工具，硬是把谷歌地球的低清截图，变成了电影级的航拍大片。

最有意思的是一个关于“上下文工程”的讨论，核心思想就一句话：给AI提供更少但更精确的上下文。说白了，就是跟AI沟通，要讲重点，别用废话把它给喂撑了。这倒是挺有启发的，对吧？

今天的情报就到这里，注意隐蔽，赶紧撤离。

本期关键词: #理想汽车 #VLA #司机大模型 #Runway #Aleph #GPT-5 #OpenAI #Anthropic #Claude #Llama4 #开源 #上下文工程 #RAG #PersonalVector #CycleGAN

Short: Podcast Formatting

你的车比你更懂你，是福是祸？AI巨头公开分手，是创新加速还是技术壁垒？GPT-5的牙膏，还能挤出多少惊喜？

三问待解，嘿，亲爱的V，欢迎收听新一期的来生情报站，我是你们的老朋友，何夕2077。咱们废话不多说，直接来看今天有哪些新动向。

首先，理想汽车给新款i8装上了一个新大脑，叫VLA辅助驾驶系统，正式宣告“司机大模型”时代来了。这可不是只会踩油门刹车的学人精，它能通过语言跟你深度交流，还能在虚拟世界里自己练车、自我迭代，目标是成为一个比你还懂你的私人司机，让驾驶体验更丝滑、更安全。

那边厢，视频剪辑师的朋友们也迎来了新工具。Runway推出了一个叫Aleph的新模型，以后剪片子，就跟发微信一样，打几个字，比如“把这个人 P 掉”，“光线调亮一点”，视频就乖乖改好了。可以说，复杂后期制作的门槛，算是被一脚踹到了地平线。

再来看看行业八卦。关于GPT-5的传闻满天飞，但据爆料，这次可能不是“量子飞跃”，更像是实用技能升级班，专攻编程和数学。与此同时，OpenAI内部也不太平，高管在Slack上公开抱怨，人才还被Meta大举挖角。但这并不妨碍资本市场看好它，估值冲到了3000亿美元。

说到不太平，Anthropic直接跟OpenAI“分手”了，以违反服务条款为由，停掉了对方的Claude API访问权限。这可比朋友圈拉黑严重多了，顶级玩家的牌桌，说掀就掀。有教授分析，这背后可能跟Meta的Llama 4表现没那么亮眼有关，这个转折点不仅让开源研发的重心有所转移，还加剧了美国本土的AI人才内卷。真是一出精彩的蝴蝶效应。

未来的技术也很有趣。有研究在搞“AI图像修复店”，用生成模型给自动驾驶的摄像头装上全天候太阳镜，刮风下雨也能看得清清楚楚。Anthropic也没闲着，在研究“Personal Vector”技术，想让AI聊天机器人能定制“人格”。以后你的Claude，可能比你对象还懂你的梗。

最后，给开发者朋友们速递几个开源好物：想摆脱供应商绑定的，可以试试AI应用构建器Dyad；想简化后端开发的，有Motia这个全能框架；想测试系统安全性的，可以用OpenBAS自己当回“攻击者”。当然，还有JS算法宝库和命令行魔法书这种传奇项目，助你内功大增。

今天的情报就到这里，注意隐蔽，赶紧撤离。

本期关键词: #理想汽车 #VLA #司机大模型 #Runway #Aleph #生成模型 #Personal Vector #GPT-5 #OpenAI #Meta #Anthropic #Llama 4

7.5 KiB Raw Blame History Unescape Escape

来生小酒馆 2025/8/3

Full: Podcast Formatting

Short: Podcast Formatting

7.5 KiB

Raw Blame History