7.5 KiB
来生小酒馆 2025/8/3
Full: Podcast Formatting
如果你的汽车能“思考”,你还敢让它开车吗? GPT-5,还是那个唯一的王吗? AI开源的黄金时代,要结束了吗?
Three questions to be refined and '嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077'。今天信息量有点大,咱们聊点开车的、剪视频的,再看看AI圈子里又上演了哪些“豪门恩怨”。
好,先说个跟咱们出行息息相关的事儿。理想汽车最近发布了他们全新的VLA辅助驾驶系统,还给它起了个特有意思的名字,叫“司机大模型”。这可不是以前那种只会跟着线、踩踩刹车的系统了。理想说,这回他们的理想i8,搭载的这个新系统,是能“深度思考”的。它能跟你用自然语言聊天,还能在虚拟世界里自己跟自己练车,据说驾驶体验会变得特别丝滑,也更安全。嗯……一个会思考还会跟你聊天的司机,希望它别是个话痨。
说完开车的,再聊聊搞视频的。做视频后期的朋友们,你们的福音来了。那个很火的视频工具Runway,又放了个大招,推出了一个叫Aleph的模型。简单来说,就是以后剪视频,你就动动嘴皮子就行了。跟AI说,“把这个人P掉”、“把灯光调亮点”、“给我换个航拍视角”,它就给你办了。这一下就把后期制作的门槛,咔嚓一下,夷为平地。
诶,话说回来,不管是AI司机还是AI剪辑师,都得先“看懂”这个世界,对吧?那要是遇上大雨大雾这种坏天气怎么办?有份研究就提出了一个方案,叫“AI图像修复店”。它会在图像传给AI大脑之前,先用生成模型,比如CycleGAN和pix2pix这些技术,把图像给修复好。这就好比给AI司机配上了一副全天候的魔法太阳镜,挺酷的。
当然,除了让AI看得清,咱们还希望它“懂我”。Anthropic公司就在搞一个叫“Personal Vector”的技术,能让你像捏泥人一样,去塑造AI模型的“人格”。也就是说,未来的Claude,可能就是完全为你量身定制的私人助理,完美契合你的说话风格和喜好。这个可以期待一下。
好了,聊完这些酷炫的技术,咱们来吃点圈内的大瓜。
首先是关于GPT-5的。最近关于它的传闻满天飞,有外媒爆料说,大家别指望GPT-5能再来一次“量子飞跃”了,它可能更侧重于把编程、数学这些实用技能打磨得更厉害。与此同时呢,OpenAI内部也是不太平。高管在公司内部公开抱怨,人才被Meta疯狂挖角,连之前被寄予厚望的Orion模型都因为效果不佳被降级了。不过有意思的是,即便如此,人家新一轮融资的估值,据说高达3000亿美元……嗯,只能说资本的世界,咱是越来越看不懂了。
竞争这不就来了嘛。OpenAI的老对手Anthropic,前两天直接上演了一出“分手大戏”。他们宣布,掐断了OpenAI访问自家Claude API的权限,理由是对方违反了服务条款。这事儿在科技圈可是炸开了锅,明摆着就是顶级玩家之间,竞争已经到了白热化的地步,不光是技术路线的碰撞,更是商业利益的正面交锋。
那为啥现在的AI圈会变成这样呢?沃顿商学院的一位教授Ethan Mollick,发了条推文,一针见血地指出,Llama 4的“相对失败”,是个关键的转折点。他认为,这事儿带来了三个连锁反应:一是开源模型研发的重心,开始向咱们中国转移;二是很多公司一看开源好像不太行,就纷纷转向了封闭模型;三是,这直接加剧了美国本土的AI人才争夺战。你看,这就是典型的“蝴蝶效应”啊。
当然,除了这些大厂的恩怨情仇,咱们开源社区和民间高手的创造力依然旺盛。比如说,有帮你简化开发流程的Dyad和Motia,有让你自己扮演黑客测试系统安全性的OpenBAS,还有像武功秘籍一样的JS算法库和命令行指南。社交媒体上也有各种神仙操作,有人把AI工具串起来,搞出了一套效率提升10倍的开发流程;还有人靠着几个AI工具,硬是把谷歌地球的低清截图,变成了电影级的航拍大片。
最有意思的是一个关于“上下文工程”的讨论,核心思想就一句话:给AI提供更少但更精确的上下文。说白了,就是跟AI沟通,要讲重点,别用废话把它给喂撑了。这倒是挺有启发的,对吧?
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词: #理想汽车 #VLA #司机大模型 #Runway #Aleph #GPT-5 #OpenAI #Anthropic #Claude #Llama4 #开源 #上下文工程 #RAG #PersonalVector #CycleGAN
Short: Podcast Formatting
你的车比你更懂你,是福是祸?AI巨头公开分手,是创新加速还是技术壁垒?GPT-5的牙膏,还能挤出多少惊喜?
三问待解,嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。咱们废话不多说,直接来看今天有哪些新动向。
首先,理想汽车给新款i8装上了一个新大脑,叫VLA辅助驾驶系统,正式宣告“司机大模型”时代来了。这可不是只会踩油门刹车的学人精,它能通过语言跟你深度交流,还能在虚拟世界里自己练车、自我迭代,目标是成为一个比你还懂你的私人司机,让驾驶体验更丝滑、更安全。
那边厢,视频剪辑师的朋友们也迎来了新工具。Runway推出了一个叫Aleph的新模型,以后剪片子,就跟发微信一样,打几个字,比如“把这个人 P 掉”,“光线调亮一点”,视频就乖乖改好了。可以说,复杂后期制作的门槛,算是被一脚踹到了地平线。
再来看看行业八卦。关于GPT-5的传闻满天飞,但据爆料,这次可能不是“量子飞跃”,更像是实用技能升级班,专攻编程和数学。与此同时,OpenAI内部也不太平,高管在Slack上公开抱怨,人才还被Meta大举挖角。但这并不妨碍资本市场看好它,估值冲到了3000亿美元。
说到不太平,Anthropic直接跟OpenAI“分手”了,以违反服务条款为由,停掉了对方的Claude API访问权限。这可比朋友圈拉黑严重多了,顶级玩家的牌桌,说掀就掀。有教授分析,这背后可能跟Meta的Llama 4表现没那么亮眼有关,这个转折点不仅让开源研发的重心有所转移,还加剧了美国本土的AI人才内卷。真是一出精彩的蝴蝶效应。
未来的技术也很有趣。有研究在搞“AI图像修复店”,用生成模型给自动驾驶的摄像头装上全天候太阳镜,刮风下雨也能看得清清楚楚。Anthropic也没闲着,在研究“Personal Vector”技术,想让AI聊天机器人能定制“人格”。以后你的Claude,可能比你对象还懂你的梗。
最后,给开发者朋友们速递几个开源好物:想摆脱供应商绑定的,可以试试AI应用构建器Dyad;想简化后端开发的,有Motia这个全能框架;想测试系统安全性的,可以用OpenBAS自己当回“攻击者”。当然,还有JS算法宝库和命令行魔法书这种传奇项目,助你内功大增。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词: #理想汽车 #VLA #司机大模型 #Runway #Aleph #生成模型 #Personal Vector #GPT-5 #OpenAI #Meta #Anthropic #Llama 4