diff --git a/podcast/2025-07-22.md b/podcast/2025-07-22.md new file mode 100644 index 0000000..06c307e --- /dev/null +++ b/podcast/2025-07-22.md @@ -0,0 +1,120 @@ +# 来生小酒馆 2025/7/22 + +## Full: Podcast Formatting + +当AI算力飙升到百万级GPU,我们的想象力是不是跟不上了? +如果AI Agent能完全替代你的工作,你打算去干点啥? +互联网会不会被AI“杀死”,还是说它只是换了个样子继续活下去? + +嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。 + +今天啊,咱们先从一个“曲线救国”的好项目说起。你知道,Google Gemini的免费API额度紧张得像挤牙膏,对吧?这不,有开发者就整出了个GeminiCli2API,它能把Gemini CLI的强大功能封装成一个本地API服务,直接绕过额度限制。关键是,它还能无缝兼容OpenAI的接口,LobeChat、NextChat这些工具都能直接用,简直是“免费午餐”里的“自助餐”啊!而且,它内置强大的日志系统,能帮你审计请求、调试,甚至还能自己构建私有数据集,是不是有点意思? + +好啦,说完这个,咱们再来看看最近AI圈的那些大新闻和“神操作”。 + +首先,OpenAI的CEO萨姆·奥尔特曼最近是扔下了一枚“重磅炸弹”:他们计划在2025年底前,把手里的GPU数量扩充到惊人的100万块以上!这个代号“Stargate”的宏伟计划,据说未来四年要豪掷5000亿美元,在美国得州打造全球最大的AI训练集群。微软、英伟达这些巨头都参与其中,这哪里是盖农场啊,简直是盖“算力帝国”啊!看来,通用人工智能离我们是越来越近了,而GPU这玩意儿,只会越来越抢手。 + +字节跳动那边也没闲着,他们在数字人赛道上悄悄亮出了“王牌”——“奇美拉”数字人平台。这个听起来充满神话色彩的平台,深度依托火山引擎自家的AI大模型,能提供从形象生成、照片换装到跨语种视频翻译的“一条龙”服务。免费封测马上结束,月底公测后就得付费了。看来,数字人这把利剑,正加速刺入金融、直播、营销这些商业腹地呢。 + +说到工作,AI代码审查领域出了个奇葩公司Greptile。他们高调喊出了“007”口号,要求员工“没有工作与生活平衡”。令人咋舌的是,这种极致的“狼性文化”非但没吓跑投资人,反而吸引了顶级风投Benchmark,估值飙升到1.8亿美元。他们的AI机器人号称能像最资深的同事一样审查代码。嗯,这到底是“天道酬勤”还是“自讨苦吃”呢?市场正瞪大眼睛瞧着呢。 + +京东也向开源社区亮出了自己的“王牌”——产品级的端到端通用多智能体系统JoyAgent-JDGenie。这个系统可不是纸上谈兵的玩具,它在被誉为“AI高考”的GAIA基准测试中,以75.15%的准确率力压群雄。报告生成、代码编写、PPT制作,样样精通,简直是“众神归位”啊!京东此举,无疑是给企业级AI应用的快速落地投下了一枚重磅炸弹,多智能体的“江湖”或许将因此迎来统一。 + +当单个AI模型还在单打独斗时,AI Agent已经学会“摇人”了!斯坦福大学开源了一个名为OctoTools的“章鱼哥”AI Agent,它就像个聪明的项目经理,能智能调度超过11种不同的专业工具协同作战。面对数学、科学这些复杂任务,它总能找到最合适的“专家”。这种分工明确、高效协作的团队模式,标志着AI解决复杂问题的能力又上了一个新台阶。 + +在AI前沿研究方面,美团的研究者们提出了一个Metis-RISE框架,巧妙地玩起了“先放养、后圈养”的教育新策略。他们先用强化学习让模型大胆探索,再通过监督微调进行“补课”。这种非传统的训练组合拳效果惊人,他们的72B参数模型在多模态推理排行榜上冲到第四名,甚至超越了部分商业闭源模型,嗯,看来这“混合教育”模式,AI也吃得香啊! + +复旦大学和南洋理工大学联手推出了MGPO框架,给多模态大模型教会了一项绝活:视觉定位。这就像赋予了AI一双“火眼金睛”,能根据问题预测图片中的关键区域,然后像人类一样“放大”查看细节,给出精准答案。最神奇的是,这能力是通过强化学习自我博弈“涌现”出来的,完全无需昂贵的人工标注数据。简直是自带“放大镜”啊! + +东京大学和麦吉尔大学的SUICA模型,则像位技艺高超的“数据炼金术士”,能对低分辨率、噪声大的空间转录组数据进行去噪、增强和超分辨率重建,真正实现“变废为宝”,为AI辅助病理诊断和药物研发提供了更强大的数据基石。 + +放眼行业,2025年的开源大模型领域,混合专家模型(MoE)架构无疑是全场最闪耀的明星。从DeepSeek-V3的极致设计,到Qwen3的创新,再到传闻中Kimi-K2的万亿参数,各大厂商都在MoE这条黄金赛道上疯狂“飙车”。看来,传统的密集型模型正在优雅地退出历史舞台,开发者们正面临“幸福的烦恼”。 + +不过,也不是所有人都春风得意。苹果公司在人工智能领域的“慢半拍”正逐渐让华尔街失去耐心,甚至有人开始公开讨论CEO蒂姆·库克的去留。尽管库克把苹果市值推向了史诗级高峰,但在上个月的WWDC上,AI方面的平淡表现,尤其是Siri重大改革的推迟,加剧了外界的失望。老库克这下压力山大啊! + +再聊聊社交媒体上的有趣发现。 +当AI Agent遇上生产环境的“灵异事件”,比如“在我电脑上明明是好的啊!”这种抓狂时刻,Hud工具正在试图攻克这个难题。它能像侦探一样捕捉代码在生产环境中的真实行为轨迹,并将线索直接“喂”给AI,让AI真正看懂问题所在。这或许是终结“为什么一到生产环境就崩了”这一世纪难题的希望之光! + +构建一个聪明、可靠的AI Agent,过程堪比教育一个孩子。Manus团队在经历四次重大重构后,无私地分享了他们的“育儿经”,比如有效利用Prompt缓存、保持工具列表简洁、以及将文件系统作为Agent的“长期记忆”。这些用无数次失败换来的宝贵经验,听着就感觉值千金! + +Claude Code的启示是,用“人话”驯服所有复杂软件。用户只需大白话说一句“帮我把这个应用部署到服务器上”,剩下的复杂操作都由AI代劳。这革命性的突破揭示了一个价值百亿级的巨大市场机会:未来软件的价值将不再取决于其功能有多复杂,而是其使用有多简单,而精通“提示工程”将成为一种新的超级技能。这不就是传说中的“傻瓜式操作”吗? + +还有观点深刻指出,以为给AI Agent塞一大堆工具,它就能化身“六边形战士”,反而大概率会让它变得更“蠢”。真正的最佳实践是,在任务开始时,就明确地为其提供少量、高度相关的工具集。看来,AI也怕“选择困难症”啊! + +真正的AI革命,不是让你更好地用工具,而是让AI替你用。你只需像老板一样提出目标,它就能自主进行任务规划、选择并操作工具,直到最终交付成果。这才是从“解放双手”到“解放大脑”的终极飞跃,是能够颠覆现有工作流的真正生产力革命。这才是真正的“躺平式”工作啊! + +一本关于机器人设计的新书,揭示了设计的终极目标是创造幸福。工程师们会为重启的机器人Pepper欢呼,法国人会拥抱街头只会“求抱抱”的Pepper,养老院的老人只希望它的手是温暖的。这些故事让作者创造了能带来幸福感的机器人Lovot。嗯,看来AI除了能帮我们赚钱,还能帮我们“暖心”啊! + +谷歌的王牌文生视频模型Veo 3,正持续展现其“魔法时刻”。在一个最新的测试视频中,它展示了将一个静态的品牌Logo,无缝、流畅地转化为动态产品的“魔法”。这种丝般顺滑的衔接和极富创意的视觉表现力,简直是为品牌广告片量身定做,给广告界来了个“降维打击”! + +《经济学人》杂志最近发出警示:AI正在“杀死”互联网。当用户可以直接从AI那里获得整合好的、无需点击的答案时,谁还会访问那些原始链接呢?这场由AI引发的范式变革,正迫使我们重新思考互联网的未来。哎,这互联网,是“回光返照”还是“浴火重生”呢? + +最后,开发者们注意了!AIOps(智能运维)这个日益重要的领域,正迎来大语言模型(LLM)的颠覆性赋能。一篇深度分析的综述文章明确指出,将LLM应用于生产环境的AIOps,能够极大地提升故障排查、性能监控等任务的效率。简直是给运维工程师们打了一针“强心剂”! + +今天的情报就到这里,注意隐蔽,赶紧撤离。 + +本期关键词: +#AI +#GPU +#Stargate +#字节跳动 +#奇美拉 +#数字人 +#京东 +#多智能体系统 +#GAIA +#强化学习 +#多模态推理 +#视觉定位 +#混合专家模型 +#MoE +#苹果 +#蒂姆·库克 +#AI_Agent +#NextChat +#crawl4ai +#dashy +#better-auth +#ConvertX +#Hud +#Prompt缓存 +#Claude_Code +#提示工程 +#Lovot +#Veo_3 +#经济学人 +#AIOps +#大语言模型 +#LLM +#开源 + +## Short: Podcast Formatting + +嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。今天我们得聊聊三个特别有意思的问题:OpenAI砸5000亿美元造AI训练集群,这到底是算力自由的曙光,还是又一场科技巨头间的“军备竞赛”?字节跳动推出“奇美拉”数字人平台,未来我们的屏幕上,真人和虚拟人,还能分得清吗?还有,当AI Agent能像项目经理一样帮你把活全包了,我们是终于能“躺平”,还是会发现自己连“摸鱼”的技能都用不上了? + +好了,不卖关子了,情报这就奉上! + +首先,OpenAI的CEO奥尔特曼又扔了个“王炸”——计划2025年底前,把手里的GPU扩充到一百万块以上!这个代号“Stargate”的项目,四年要豪掷5000亿美元。看来,通用人工智能真要踩油门了,不过GPU这稀罕物,怕是更抢手了。 + +说到新鲜事,字节跳动也悄悄亮出了数字人“王牌”——“奇美拉”平台,能帮你照片一键换装、跨语种视频翻译。现在免费测试,月底就收费。 + +你以为只有人类会“卷”?AI公司Greptile更狠,直接喊出“007,没有工作生活平衡”,还成功拿到了顶级风投3000万美元融资。这年头,AI公司都开始比你拼了。 + +咱们国内的京东也不甘示弱,开源了多智能体系统JoyAgent-JDGenie,在AI高考——GAIA基准测试里,拿了75.15%的高分。AI现在都学会团队协作了,还搞报告、写代码、做PPT。 + +前沿研究方面,AI在多模态推理和视觉定位等能力大增,强化学习正让模型越来越聪明。混合专家模型(MoE)也成了开源大模型的主流赛道。 + +话说AI Agent,这帮“AI打工人”正从辅助工具变成能自主执行任务的“项目经理”。斯坦福的“章鱼哥”OctoTools就是典型。不过,社媒上有高人指出,给Agent的工具不是越多越好,少而精才能让它更聪明。 + +当然,不是所有巨头都顺风顺水。苹果在AI领域被华尔街吐槽“慢半拍”,连库克的去留都成了话题。看来,AI时代,光靠“运营鬼才”可不行。 + +一个更让人深思的观点来自《经济学人》:AI正在“杀死”互联网!以后AI直接给你整合好的答案,谁还会去点网站、看广告呢?这可是动了整个互联网的“奶酪”啊。 + +不过别太焦虑,AI也不全是冷冰冰的技术。比如那款能带来幸福感的机器人Lovot,它提醒我们,技术的终极价值或许不只是效率,也能是温暖人心。 + +哦,对了,如果你想白嫖谷歌Gemini的强大,又被官方额度限制困扰,可以试试那个GeminiCli2API项目。另外,像NextChat、crawl4ai等众多开源项目,也让AI生态越来越繁荣。 + +今天的情报就到这里,注意隐蔽,赶紧撤离。 + +本期关键词: +#AI #OpenAI #GPU #Stargate #字节跳动 #数字人 #奇美拉 #Greptile #京东 #多智能体系统 #GAIA #AIAgent #强化学习 #多模态推理 #混合专家模型 #苹果 #互联网 #Lovot #GeminiCli2API #NextChat #crawl4ai #开源 \ No newline at end of file