Create podcast script file for 2025-07-22

This commit is contained in:
何夕2077
2025-07-22 00:22:38 +08:00
parent f86a39dfe7
commit fa837af570

120
podcast/2025-07-22.md Normal file
View File

@@ -0,0 +1,120 @@
# 来生小酒馆 2025/7/22
## Full: Podcast Formatting
当AI算力飙升到百万级GPU我们的想象力是不是跟不上了
如果AI Agent能完全替代你的工作你打算去干点啥
互联网会不会被AI“杀死”还是说它只是换了个样子继续活下去
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
今天啊咱们先从一个“曲线救国”的好项目说起。你知道Google Gemini的免费API额度紧张得像挤牙膏对吧这不有开发者就整出了个GeminiCli2API它能把Gemini CLI的强大功能封装成一个本地API服务直接绕过额度限制。关键是它还能无缝兼容OpenAI的接口LobeChat、NextChat这些工具都能直接用简直是“免费午餐”里的“自助餐”啊而且它内置强大的日志系统能帮你审计请求、调试甚至还能自己构建私有数据集是不是有点意思
好啦说完这个咱们再来看看最近AI圈的那些大新闻和“神操作”。
首先OpenAI的CEO萨姆·奥尔特曼最近是扔下了一枚“重磅炸弹”他们计划在2025年底前把手里的GPU数量扩充到惊人的100万块以上这个代号“Stargate”的宏伟计划据说未来四年要豪掷5000亿美元在美国得州打造全球最大的AI训练集群。微软、英伟达这些巨头都参与其中这哪里是盖农场啊简直是盖“算力帝国”啊看来通用人工智能离我们是越来越近了而GPU这玩意儿只会越来越抢手。
字节跳动那边也没闲着他们在数字人赛道上悄悄亮出了“王牌”——“奇美拉”数字人平台。这个听起来充满神话色彩的平台深度依托火山引擎自家的AI大模型能提供从形象生成、照片换装到跨语种视频翻译的“一条龙”服务。免费封测马上结束月底公测后就得付费了。看来数字人这把利剑正加速刺入金融、直播、营销这些商业腹地呢。
说到工作AI代码审查领域出了个奇葩公司Greptile。他们高调喊出了“007”口号要求员工“没有工作与生活平衡”。令人咋舌的是这种极致的“狼性文化”非但没吓跑投资人反而吸引了顶级风投Benchmark估值飙升到1.8亿美元。他们的AI机器人号称能像最资深的同事一样审查代码。嗯这到底是“天道酬勤”还是“自讨苦吃”呢市场正瞪大眼睛瞧着呢。
京东也向开源社区亮出了自己的“王牌”——产品级的端到端通用多智能体系统JoyAgent-JDGenie。这个系统可不是纸上谈兵的玩具它在被誉为“AI高考”的GAIA基准测试中以75.15%的准确率力压群雄。报告生成、代码编写、PPT制作样样精通简直是“众神归位”啊京东此举无疑是给企业级AI应用的快速落地投下了一枚重磅炸弹多智能体的“江湖”或许将因此迎来统一。
当单个AI模型还在单打独斗时AI Agent已经学会“摇人”了斯坦福大学开源了一个名为OctoTools的“章鱼哥”AI Agent它就像个聪明的项目经理能智能调度超过11种不同的专业工具协同作战。面对数学、科学这些复杂任务它总能找到最合适的“专家”。这种分工明确、高效协作的团队模式标志着AI解决复杂问题的能力又上了一个新台阶。
在AI前沿研究方面美团的研究者们提出了一个Metis-RISE框架巧妙地玩起了“先放养、后圈养”的教育新策略。他们先用强化学习让模型大胆探索再通过监督微调进行“补课”。这种非传统的训练组合拳效果惊人他们的72B参数模型在多模态推理排行榜上冲到第四名甚至超越了部分商业闭源模型看来这“混合教育”模式AI也吃得香啊
复旦大学和南洋理工大学联手推出了MGPO框架给多模态大模型教会了一项绝活视觉定位。这就像赋予了AI一双“火眼金睛”能根据问题预测图片中的关键区域然后像人类一样“放大”查看细节给出精准答案。最神奇的是这能力是通过强化学习自我博弈“涌现”出来的完全无需昂贵的人工标注数据。简直是自带“放大镜”啊
东京大学和麦吉尔大学的SUICA模型则像位技艺高超的“数据炼金术士”能对低分辨率、噪声大的空间转录组数据进行去噪、增强和超分辨率重建真正实现“变废为宝”为AI辅助病理诊断和药物研发提供了更强大的数据基石。
放眼行业2025年的开源大模型领域混合专家模型MoE架构无疑是全场最闪耀的明星。从DeepSeek-V3的极致设计到Qwen3的创新再到传闻中Kimi-K2的万亿参数各大厂商都在MoE这条黄金赛道上疯狂“飙车”。看来传统的密集型模型正在优雅地退出历史舞台开发者们正面临“幸福的烦恼”。
不过也不是所有人都春风得意。苹果公司在人工智能领域的“慢半拍”正逐渐让华尔街失去耐心甚至有人开始公开讨论CEO蒂姆·库克的去留。尽管库克把苹果市值推向了史诗级高峰但在上个月的WWDC上AI方面的平淡表现尤其是Siri重大改革的推迟加剧了外界的失望。老库克这下压力山大啊
再聊聊社交媒体上的有趣发现。
当AI Agent遇上生产环境的“灵异事件”比如“在我电脑上明明是好的啊”这种抓狂时刻Hud工具正在试图攻克这个难题。它能像侦探一样捕捉代码在生产环境中的真实行为轨迹并将线索直接“喂”给AI让AI真正看懂问题所在。这或许是终结“为什么一到生产环境就崩了”这一世纪难题的希望之光
构建一个聪明、可靠的AI Agent过程堪比教育一个孩子。Manus团队在经历四次重大重构后无私地分享了他们的“育儿经”比如有效利用Prompt缓存、保持工具列表简洁、以及将文件系统作为Agent的“长期记忆”。这些用无数次失败换来的宝贵经验听着就感觉值千金
Claude Code的启示是用“人话”驯服所有复杂软件。用户只需大白话说一句“帮我把这个应用部署到服务器上”剩下的复杂操作都由AI代劳。这革命性的突破揭示了一个价值百亿级的巨大市场机会未来软件的价值将不再取决于其功能有多复杂而是其使用有多简单而精通“提示工程”将成为一种新的超级技能。这不就是传说中的“傻瓜式操作”吗
还有观点深刻指出以为给AI Agent塞一大堆工具它就能化身“六边形战士”反而大概率会让它变得更“蠢”。真正的最佳实践是在任务开始时就明确地为其提供少量、高度相关的工具集。看来AI也怕“选择困难症”啊
真正的AI革命不是让你更好地用工具而是让AI替你用。你只需像老板一样提出目标它就能自主进行任务规划、选择并操作工具直到最终交付成果。这才是从“解放双手”到“解放大脑”的终极飞跃是能够颠覆现有工作流的真正生产力革命。这才是真正的“躺平式”工作啊
一本关于机器人设计的新书揭示了设计的终极目标是创造幸福。工程师们会为重启的机器人Pepper欢呼法国人会拥抱街头只会“求抱抱”的Pepper养老院的老人只希望它的手是温暖的。这些故事让作者创造了能带来幸福感的机器人Lovot。嗯看来AI除了能帮我们赚钱还能帮我们“暖心”啊
谷歌的王牌文生视频模型Veo 3正持续展现其“魔法时刻”。在一个最新的测试视频中它展示了将一个静态的品牌Logo无缝、流畅地转化为动态产品的“魔法”。这种丝般顺滑的衔接和极富创意的视觉表现力简直是为品牌广告片量身定做给广告界来了个“降维打击”
《经济学人》杂志最近发出警示AI正在“杀死”互联网。当用户可以直接从AI那里获得整合好的、无需点击的答案时谁还会访问那些原始链接呢这场由AI引发的范式变革正迫使我们重新思考互联网的未来。哎这互联网是“回光返照”还是“浴火重生”呢
最后开发者们注意了AIOps智能运维这个日益重要的领域正迎来大语言模型LLM的颠覆性赋能。一篇深度分析的综述文章明确指出将LLM应用于生产环境的AIOps能够极大地提升故障排查、性能监控等任务的效率。简直是给运维工程师们打了一针“强心剂”
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#AI
#GPU
#Stargate
#字节跳动
#奇美拉
#数字人
#京东
#多智能体系统
#GAIA
#强化学习
#多模态推理
#视觉定位
#混合专家模型
#MoE
#苹果
#蒂姆·库克
#AI_Agent
#NextChat
#crawl4ai
#dashy
#better-auth
#ConvertX
#Hud
#Prompt缓存
#Claude_Code
#提示工程
#Lovot
#Veo_3
#经济学人
#AIOps
#大语言模型
#LLM
#开源
## Short: Podcast Formatting
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天我们得聊聊三个特别有意思的问题OpenAI砸5000亿美元造AI训练集群这到底是算力自由的曙光还是又一场科技巨头间的“军备竞赛”字节跳动推出“奇美拉”数字人平台未来我们的屏幕上真人和虚拟人还能分得清吗还有当AI Agent能像项目经理一样帮你把活全包了我们是终于能“躺平”还是会发现自己连“摸鱼”的技能都用不上了
好了,不卖关子了,情报这就奉上!
首先OpenAI的CEO奥尔特曼又扔了个“王炸”——计划2025年底前把手里的GPU扩充到一百万块以上这个代号“Stargate”的项目四年要豪掷5000亿美元。看来通用人工智能真要踩油门了不过GPU这稀罕物怕是更抢手了。
说到新鲜事,字节跳动也悄悄亮出了数字人“王牌”——“奇美拉”平台,能帮你照片一键换装、跨语种视频翻译。现在免费测试,月底就收费。
你以为只有人类会“卷”AI公司Greptile更狠直接喊出“007没有工作生活平衡”还成功拿到了顶级风投3000万美元融资。这年头AI公司都开始比你拼了。
咱们国内的京东也不甘示弱开源了多智能体系统JoyAgent-JDGenie在AI高考——GAIA基准测试里拿了75.15%的高分。AI现在都学会团队协作了还搞报告、写代码、做PPT。
前沿研究方面AI在多模态推理和视觉定位等能力大增强化学习正让模型越来越聪明。混合专家模型MoE也成了开源大模型的主流赛道。
话说AI Agent这帮“AI打工人”正从辅助工具变成能自主执行任务的“项目经理”。斯坦福的“章鱼哥”OctoTools就是典型。不过社媒上有高人指出给Agent的工具不是越多越好少而精才能让它更聪明。
当然不是所有巨头都顺风顺水。苹果在AI领域被华尔街吐槽“慢半拍”连库克的去留都成了话题。看来AI时代光靠“运营鬼才”可不行。
一个更让人深思的观点来自《经济学人》AI正在“杀死”互联网以后AI直接给你整合好的答案谁还会去点网站、看广告呢这可是动了整个互联网的“奶酪”啊。
不过别太焦虑AI也不全是冷冰冰的技术。比如那款能带来幸福感的机器人Lovot它提醒我们技术的终极价值或许不只是效率也能是温暖人心。
对了如果你想白嫖谷歌Gemini的强大又被官方额度限制困扰可以试试那个GeminiCli2API项目。另外像NextChat、crawl4ai等众多开源项目也让AI生态越来越繁荣。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#AI #OpenAI #GPU #Stargate #字节跳动 #数字人 #奇美拉 #Greptile #京东 #多智能体系统 #GAIA #AIAgent #强化学习 #多模态推理 #混合专家模型 #苹果 #互联网 #Lovot #GeminiCli2API #NextChat #crawl4ai #开源