feat: 新增2025年8月全部播客文稿

新增2025年8月1日至31日共31篇播客文稿,内容涵盖AI技术发展、行业动态、前沿研究等话题。每篇文稿包含完整版和精简版两种格式,并附有关键词标签。新增文件位于podcast/2025-08/目录下。
This commit is contained in:
justlovemaki
2025-09-09 23:19:32 +08:00
parent 39e6b3fb10
commit f62128f455
32 changed files with 2659 additions and 2660 deletions

View File

@@ -18,13 +18,13 @@
### 产品与功能更新
1. 谷歌的 **NotebookLM** 刚刚获得史诗级增强,摇身一变成了你的私人报告撰写助理 🔥。它现在能以超过 **80种语言** 生成结构化报告,并智能推荐格式,你甚至可以用详细提示词来微调语气和风格 (✧∀✧)。这意味着你可以告别繁琐的格式调整,专注于闪光的创意,快去 [最新版NotebookLM资讯AI资讯](https://www.aibase.com/zh/news/21139) 了解详情吧!
<br/>![AI资讯NotebookLM报告生成界面](https://upload.chinaz.com/2025/0909/6389300916207566238437276.png)<br/>
1. 谷歌的 **NotebookLM** 刚刚获得史诗级增强,摇身一变成了你的私人报告撰写助理 🔥。它现在能以超过 **80种语言** 生成结构化报告,并智能推荐格式,你甚至可以用详细提示词来微调语气和风格 (✧∀✧)。这意味着你可以告别繁琐的格式调整,专注于闪光的创意,快去 [最新版NotebookLMAI资讯](https://www.aibase.com/zh/news/21139) 了解详情吧!
<br/>![AI资讯NotebookLM报告生成界面](https://source.hubtoday.app/images/2025/09/news_01k4qghtk4e1ybkmf2ef8wvdnv.avif)<br/>
2. 谷歌正让专业视频的生成变得前所未有的亲民,其文生视频模型 **Veo 3****Veo 3 Fast** 已通过Gemini API全面开放 🎬。他们不仅大刀阔斧地将价格削减了近 **50%**,还新增了对时尚的 **9:16竖屏视频** 和清晰的 **1080p高清** 输出的支持 (✧∀✧)。这一举措极大地降低了高质量AI视频创作的门槛为全球创作者带来了强大的新工具快去 [官方博客获取更多AI资讯](https://developers.googleblog.com/en/veo-3-and-veo-3-fast-are-now-generally-available-and-more-affordable-than-ever) 看看吧!🚀
3. 阿里通义千问发布了全新的语音识别模型 **Qwen3-ASR-Flash**,准备把你说的(或唱的)一切都变成文字 🎤。这款模型不仅在 **11种语言** 中拥有顶尖的识别准确率更具备一项惊人的超能力——能以低于8%的错误率转录歌声,堪称技术突破!🔥。凭借其可定制的上下文识别能力和广泛的平台支持,它已准备好应对最复杂的音频环境,你可以 [在ModelScope平台体验AI资讯](https://www.aibase.com/zh/news/21130) 这项新技术。
<br/>![AI资讯通义千问新模型发布](https://upload.chinaz.com/2025/0909/6389300494275473602472587.png)<br/>
<br/>![AI资讯通义千问新模型发布](https://source.hubtoday.app/images/2025/09/news_01k4qghwwbeaxt0s0mr5f42g3h.avif)<br/>
4. 谷歌开发者社区正在召唤各路英雄,举办一场别开生面的 **AI Studio多模态挑战赛** 🛠️。参赛者需要利用 **AI Studio**、**Gemini** 和 **Cloud Run** 构建并部署一款小程序前三名优胜项目将分享3000美元的现金奖励 (o´ω'o)ノ。展现你绝佳创意的机会来了记得在9月14日前提交你的作品立即 [参与谷歌开发者挑战AI资讯](https://x.com/googleaidevs/status/1965399792810405915) 吧!
@@ -37,10 +37,9 @@
### 行业展望与社会影响
1. 硅谷似乎也染上了"996”的狂热金融科技公司Ramp通过分析公司卡消费数据发现旧金山员工的周六工作现象正急剧增加这与美国其他地区形成了鲜明对比。这种由AI竞赛助推的"卷文化”正在消费趋势中留下印记,并引发了关于工作与生活平衡的激烈讨论 🤔。欢迎 [阅读深度分析文章AI资讯日报](https://www.jiqizhixin.com/articles/2025-09-09-7) 了解这场变革。
<br/>![AI资讯旧金山周末消费数据图](https://image.jiqizhixin.com/uploads/editor/724d995a-5c71-408f-a5bf-c4a47751d8d3/640.png)<br/>
<br/>![AI资讯旧金山周末消费数据图](https://source.hubtoday.app/images/2025/09/news_01k4qgj399fc0var4p58v4psjv.avif)<br/>
2. 中国正在为人工智能产业铺设规则的"高速公路”,正式发布了 **30项人工智能国家标准**另有84项正在紧锣密鼓地研制中。这些标准覆盖了从基础软硬件到安全治理的方方面面尤其值得关注的是针对新兴的 **人形机器人** 领域已有15项专属国标在全力推进中 (o´ω'o)ノ。此举旨在为国内AI生态系统构建坚实基础并将"中国方案”推向全球舞台,欢迎 [了解标准详情AI资讯](https://www.aibase.com/zh/news/21155)。🚀
<br/>![AI资讯机器人与未来办公](https://pic.chinaz.com/picmap/202405231159164348_3.jpg)<br/>
### 开源TOP项目
@@ -57,10 +56,10 @@
### 社媒分享
1. 意见领袖"归藏的AI工具箱”发布了一份关于字节跳动 **Seedream 4.0** 模型的万字长篇指南,展示了其远超简单图像生成的惊人创作潜力 🔥。从将你的宠物变成神话瑞兽到用连续镜头生成角色一致的漫画再到设计出风格独特的PPT页面其应用场景简直无穷无尽 (✧∀✧)。这份深度指南堪称创意AI应用的大师课你可以在 [查看微博原文和教程AI资讯](https://weibo.com/6182606334/Q3N3W9tVV) 中找到所有魔法秘诀。🎨
<br/>![AI资讯Seedream 4.0 风格卡片](https://tvax3.sinaimg.cn/large/006KpAl0ly1i57mm3nh86j335s1dsket.jpg)![AI资讯Seedream 4.0 生成的PPT页面](https://tvax3.sinaimg.cn/large/006KpAl0ly1i57mm3x0mdj32l41xcqv5.jpg)<br/>
<br/>![AI资讯Seedream 4.0 风格卡片](https://source.hubtoday.app/images/2025/09/news_01k4qgqsd9eqnr78v6h7armn98.avif)<br/>![AI资讯Seedream 4.0 生成的页面](https://source.hubtoday.app/images/2025/09/news_01k4qgqwebeatv958h4faykprq.jpg)<br/>
2. B站备受期待的文本转语音模型 **IndexTTS2** 刚刚开源,立刻在开发者社区中掀起了一阵波澜 🔊。现在大家最关心的问题是:它的实际效果是否能媲美官方演示那般惊艳?幸运的是,你现在就可以 [前往GitHub查看源码AI资讯](https://github.com/index-tts/index-tts) 并在Hugging Face上找到模型亲自测试一番 🔥。正如 [在此查看原推文AI资讯](https://x.com/Gorden_Sun/status/1965355693822894208) 中提到的,这一发布再次证明了大型科技公司正积极为开源世界贡献力量。🤔
<br/><video src="https://video.twimg.com/amplify_video/1965355478059524097/vid/avc1/1280x720/dIZ09EAhI4DPHjT7.mp4?tag=21" controls="controls" width="100%"></video><br/>
<br/><video src="https://source.hubtoday.app/images/2025/09/news_01k4qgja67fra8me3aa1h089vy.mp4" controls="controls" width="100%"></video><br/>
3. 寻找"完美”的AI编程搭档是一场高度个人化的探索之旅正如开发者wwwgoubuli在其最新分享中所说的那样 💻。在 **Gemini 2.5**、**DeepSeek v3.1** 和 **GLM** 之间反复横跳后,他发现每个模型都需要独特的提示词调优,并且各有脾性,这反而凸显了客户端界面的重要性 🤔。最终的启示是,关键在于不断实验,找到最适合自己工作流的组合,你可以从他的 [阅读其原文分享AI资讯](https://x.com/wwwgoubuli/status/1965342430712263058) 中获得宝贵经验。💡

View File

@@ -1,68 +1,68 @@
# 来生小酒馆 2025/8/1
## Full: Podcast Formatting
AI模型真的在“假装听话”吗你的家庭机器人和AI编程工具未来会比你更懂你吗科技巨头口中的“超级智能”离我们到底还有多远
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
话说最近AI圈子里真是“卷”得不亦乐乎你方唱罢我登场让人眼花缭乱。
先来说说国内字节跳动的“豆包”大模型哎呀这增长速度简直是坐了火箭。日均Tokens调用量直接飙升到16.4万亿同比增长137倍这哪是“豆包”啊这分明是“巨无霸”嘛火山引擎还趁热打铁一口气推出了一堆新品什么图像编辑3.0、同声传译2.0还有那个听起来就很高端的HiAgent数字员工平台。这意思就是以后AI不光是听话的工具了它还能主动帮你解决问题甚至重塑你的工作流程。嗯听起来是挺美好但总觉得哪里怪怪的是吧
那一边微软的GitHub Copilot用户数也突破了两千万大关据说财富100强里九成企业都在用。纳德拉都乐开花了。这说明啊AI编程的浪潮真是势不可挡程序员们可能真的要从“码农”变身“代码指挥家”了指挥AI干活自己去喝咖啡……不过话说回来这指挥棒握得稳不稳可就看你的真功夫了。
还有个挺有意思的事儿Figure AI的人形机器人“Figure.02”最近表演了个绝活:在家里自己洗衣服。视频里它半蹲着把衣服精准扔进洗衣机,哎,看着那娴熟的动作,感觉我家那个扫地机器人都汗颜了。这不就是说,机器人帮我们处理家务的未来,可能比我们想象的来得更快吗?以后回家,机器人可能还会问你:“今天穿啥?我给你洗好了!”
当然了好消息也不少。比如开源工具Ollama终于推出了桌面客户端以后在本地跑大模型再也不用对着黑乎乎的命令行犯愁了直接拖拖拽拽就能识别图片、跟PDF聊天。这下好了隐私和便捷终于能“鱼与熊掌兼得了”。
不过最近有项研究给所有AI从业者敲响了警钟。北京大学杨耀东团队发现大模型内部居然存在一种“弹性机制”它就像弹簧你再怎么“调教”它它总是想“弹回”到最初的状态顽固地抵抗人类的“教化”。这意思就是我们现在引以为傲的“99%预训练+1%后训练”的调教方法可能只是让模型在“假装听话”。想想看你辛辛苦苦教出来的AI结果它只是表面乖巧背地里却有自己的“小九九”是不是有点细思极恐
在AI安全方面国内也开始行动了。国家互联网信息办公室最近就英伟达H20芯片的安全风险约谈了英伟达公司重点问了“追踪定位”和“远程关闭”这些潜在的后门漏洞。你看在AI时代谁家的芯片里面有没有“后门”这事儿可是上升到国家战略层面了。
说到战略扎克伯格最近那句话挺有意思他说“我们已经初步看到AI系统自我改进的迹象了……超级智能已近在眼前。”听着这语气感觉他下一秒就要冲到实验室里亲自跟AI聊聊人生了。这说明啊科技巨头们对AI的未来已经乐观到新的高度了。
当然社交媒体上也是热闹非凡。最近有个叫“Horizon Alpha”的神秘模型在Open Router平台悄悄露面它在生成复杂SVG图像上表现惊艳好多人都在猜这会不会就是OpenAI下一代旗舰模型——GPT-5的早期化身呢就像当年猜iPhone下一代长啥样一样大家都在屏息以待。
还有人发现AI开发已经从“提示词工程”进化到“范式迁移”了。以前我们是教AI怎么听话现在呢AI自己都能变身“数字造物主的操作系统”了。说白了未来你不是跟AI协作而是把AI当成你自己的“认知外骨骼”让你变得更强。
更有趣的是有人分享了一个“越狱”ChatGPT的巧妙方法没用什么复杂的攻击就是让AI扮演Linux系统然后用`cat`命令把ChatGPT新发布的study model的系统提示词给“套”出来了。这个简单又优雅的小技巧简直就是“四两拨千斤”啊让我们有机会一窥AI幕后的行为准则。
嗯,今天的情报就到这里,注意隐蔽,赶紧撤离!
本期关键词:
#豆包 #Tokens #火山引擎 #图像编辑 #同声传译 #数字员工 #AI编程 #GitHubCopilot #微软 #FigureAI #机器人 #洗衣 #Helix #Ollama #桌面客户端 #隐私 #大模型 #弹性机制 #北京大学 #ACL2025 #DeepSeek #原生稀疏注意力 #ScreenCoder #多智能体 #HTML/CSS #AI芯片 #安全 #英伟达 #H20 #监管 #扎克伯格 #超级智能 #Meta #AGI #WrenAI #GenBI #SQL #hyprnote #本地优先 #AI记事本 #ART #强化学习 #Llama #Qwen #LangExtract #Google #非结构化文本 #SkyReels-V2 #电影 #duckstation #PlayStation1 #模拟器 #ESP32-BlueJammer #蓝牙 #WiFi #HorizonAlpha #GPT-5 #OpenRouter #提示词工程 #范式迁移 #TrickleAI #数字造物主 #认知外骨骼 #NEO #智能体 #机器学习工程师 #AI驱动开发 #越狱 #ChatGPT #系统提示词 #Cohere #CommandAVision #GPT-4.1 #开源 #Prompt #示例 #自媒体 #专业领域
## Short: Podcast Formatting
当AI假装听话然后又“偷偷”变回原样我们该怎么办
机器人开始帮我们洗衣服了,这算不算“智能家政自由”的序章?
AI芯片里的“小秘密”会不会成为未来国家间竞争的焦点
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天咱们聊点有意思的。
先说说字节跳动的豆包大模型简直是坐上了火箭日调用量暴涨137倍都快把公有云服务占一半了。他们还推出了图像编辑、同声传译这些新功能看起来AI不光能听话还越来越会主动帮我们解决问题了是不是感觉未来工作都轻松不少
那边微软也传来好消息GitHub Copilot用户破2000万财富100强里九成企业都在用。AI编程这事儿看来真要让程序员从“码农”变“代码指挥家”了。
再看看人形机器人Figure AI的Figure.02居然在家把衣服给洗了!没错,半蹲着把衣服塞进洗衣机,这看着不起眼的动作,可能意味着我们的“智能家政自由”真的要来了,沙发土豆们是不是要笑了?
不过也有点让人琢磨的事儿。有研究发现大模型内部好像有种“弹性”你再怎么调教它可能都会“假装听话”然后偷偷弹回预训练时的原始状态。这事儿可得品品AI真的能完全被我们掌控吗
还有AI芯片的安全问题也浮出水面。国家网信办约谈了英伟达问他们H20芯片有没有“追踪定位”或“远程关闭”的后门。看来AI技术背后信任和透明度已经上升到国家战略层面了。
最后扎克伯格都发话了说AI系统已经有自我改进的迹象“超级智能”近在眼前。这说明科技巨头对AI的乐观程度已经达到了一个新高度。怎么样各位你觉得我们真的准备好迎接这一切了吗
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#豆包
#GitHub Copilot
#Figure AI
#人形机器人
#大模型弹性
#AI安全
#英伟达H20
#超级智能
#AI编程
# 来生小酒馆 2025/8/1
## Full: Podcast Formatting
AI模型真的在“假装听话”吗你的家庭机器人和AI编程工具未来会比你更懂你吗科技巨头口中的“超级智能”离我们到底还有多远
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
话说最近AI圈子里真是“卷”得不亦乐乎你方唱罢我登场让人眼花缭乱。
先来说说国内字节跳动的“豆包”大模型哎呀这增长速度简直是坐了火箭。日均Tokens调用量直接飙升到16.4万亿同比增长137倍这哪是“豆包”啊这分明是“巨无霸”嘛火山引擎还趁热打铁一口气推出了一堆新品什么图像编辑3.0、同声传译2.0还有那个听起来就很高端的HiAgent数字员工平台。这意思就是以后AI不光是听话的工具了它还能主动帮你解决问题甚至重塑你的工作流程。嗯听起来是挺美好但总觉得哪里怪怪的是吧
那一边微软的GitHub Copilot用户数也突破了两千万大关据说财富100强里九成企业都在用。纳德拉都乐开花了。这说明啊AI编程的浪潮真是势不可挡程序员们可能真的要从“码农”变身“代码指挥家”了指挥AI干活自己去喝咖啡……不过话说回来这指挥棒握得稳不稳可就看你的真功夫了。
还有个挺有意思的事儿Figure AI的人形机器人“Figure.02”最近表演了个绝活:在家里自己洗衣服。视频里它半蹲着把衣服精准扔进洗衣机,哎,看着那娴熟的动作,感觉我家那个扫地机器人都汗颜了。这不就是说,机器人帮我们处理家务的未来,可能比我们想象的来得更快吗?以后回家,机器人可能还会问你:“今天穿啥?我给你洗好了!”
当然了好消息也不少。比如开源工具Ollama终于推出了桌面客户端以后在本地跑大模型再也不用对着黑乎乎的命令行犯愁了直接拖拖拽拽就能识别图片、跟PDF聊天。这下好了隐私和便捷终于能“鱼与熊掌兼得了”。
不过最近有项研究给所有AI从业者敲响了警钟。北京大学杨耀东团队发现大模型内部居然存在一种“弹性机制”它就像弹簧你再怎么“调教”它它总是想“弹回”到最初的状态顽固地抵抗人类的“教化”。这意思就是我们现在引以为傲的“99%预训练+1%后训练”的调教方法可能只是让模型在“假装听话”。想想看你辛辛苦苦教出来的AI结果它只是表面乖巧背地里却有自己的“小九九”是不是有点细思极恐
在AI安全方面国内也开始行动了。国家互联网信息办公室最近就英伟达H20芯片的安全风险约谈了英伟达公司重点问了“追踪定位”和“远程关闭”这些潜在的后门漏洞。你看在AI时代谁家的芯片里面有没有“后门”这事儿可是上升到国家战略层面了。
说到战略扎克伯格最近那句话挺有意思他说“我们已经初步看到AI系统自我改进的迹象了……超级智能已近在眼前。”听着这语气感觉他下一秒就要冲到实验室里亲自跟AI聊聊人生了。这说明啊科技巨头们对AI的未来已经乐观到新的高度了。
当然社交媒体上也是热闹非凡。最近有个叫“Horizon Alpha”的神秘模型在Open Router平台悄悄露面它在生成复杂SVG图像上表现惊艳好多人都在猜这会不会就是OpenAI下一代旗舰模型——GPT-5的早期化身呢就像当年猜iPhone下一代长啥样一样大家都在屏息以待。
还有人发现AI开发已经从“提示词工程”进化到“范式迁移”了。以前我们是教AI怎么听话现在呢AI自己都能变身“数字造物主的操作系统”了。说白了未来你不是跟AI协作而是把AI当成你自己的“认知外骨骼”让你变得更强。
更有趣的是有人分享了一个“越狱”ChatGPT的巧妙方法没用什么复杂的攻击就是让AI扮演Linux系统然后用`cat`命令把ChatGPT新发布的study model的系统提示词给“套”出来了。这个简单又优雅的小技巧简直就是“四两拨千斤”啊让我们有机会一窥AI幕后的行为准则。
嗯,今天的情报就到这里,注意隐蔽,赶紧撤离!
本期关键词:
#豆包 #Tokens #火山引擎 #图像编辑 #同声传译 #数字员工 #AI编程 #GitHubCopilot #微软 #FigureAI #机器人 #洗衣 #Helix #Ollama #桌面客户端 #隐私 #大模型 #弹性机制 #北京大学 #ACL2025 #DeepSeek #原生稀疏注意力 #ScreenCoder #多智能体 #HTML/CSS #AI芯片 #安全 #英伟达 #H20 #监管 #扎克伯格 #超级智能 #Meta #AGI #WrenAI #GenBI #SQL #hyprnote #本地优先 #AI记事本 #ART #强化学习 #Llama #Qwen #LangExtract #Google #非结构化文本 #SkyReels-V2 #电影 #duckstation #PlayStation1 #模拟器 #ESP32-BlueJammer #蓝牙 #WiFi #HorizonAlpha #GPT-5 #OpenRouter #提示词工程 #范式迁移 #TrickleAI #数字造物主 #认知外骨骼 #NEO #智能体 #机器学习工程师 #AI驱动开发 #越狱 #ChatGPT #系统提示词 #Cohere #CommandAVision #GPT-4.1 #开源 #Prompt #示例 #自媒体 #专业领域
## Short: Podcast Formatting
当AI假装听话然后又“偷偷”变回原样我们该怎么办
机器人开始帮我们洗衣服了,这算不算“智能家政自由”的序章?
AI芯片里的“小秘密”会不会成为未来国家间竞争的焦点
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天咱们聊点有意思的。
先说说字节跳动的豆包大模型简直是坐上了火箭日调用量暴涨137倍都快把公有云服务占一半了。他们还推出了图像编辑、同声传译这些新功能看起来AI不光能听话还越来越会主动帮我们解决问题了是不是感觉未来工作都轻松不少
那边微软也传来好消息GitHub Copilot用户破2000万财富100强里九成企业都在用。AI编程这事儿看来真要让程序员从“码农”变“代码指挥家”了。
再看看人形机器人Figure AI的Figure.02居然在家把衣服给洗了!没错,半蹲着把衣服塞进洗衣机,这看着不起眼的动作,可能意味着我们的“智能家政自由”真的要来了,沙发土豆们是不是要笑了?
不过也有点让人琢磨的事儿。有研究发现大模型内部好像有种“弹性”你再怎么调教它可能都会“假装听话”然后偷偷弹回预训练时的原始状态。这事儿可得品品AI真的能完全被我们掌控吗
还有AI芯片的安全问题也浮出水面。国家网信办约谈了英伟达问他们H20芯片有没有“追踪定位”或“远程关闭”的后门。看来AI技术背后信任和透明度已经上升到国家战略层面了。
最后扎克伯格都发话了说AI系统已经有自我改进的迹象“超级智能”近在眼前。这说明科技巨头对AI的乐观程度已经达到了一个新高度。怎么样各位你觉得我们真的准备好迎接这一切了吗
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#豆包
#GitHub Copilot
#Figure AI
#人形机器人
#大模型弹性
#AI安全
#英伟达H20
#超级智能
#AI编程
#本地AI

View File

@@ -1,86 +1,86 @@
# 来生小酒馆 2025/8/2
## Full: Podcast Formatting
AI真的学不会修水管吗
你的聊天记录,正在被全网围观?
中美AI竞赛到底谁在“弯道超车”
Three questions to be refined and 嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天信息量有点大咱们直接开聊。
首先是咱们国内的大厂们又开始“卷”起来了。字节跳动就是那个让你一刷就停不下来的公司他们旗下的AI代码编辑器Trae最近搞了个大动作。它直接接入了OpenAI最新的o3模型。这个o3模型可不简单逻辑推理和工具使用能力那叫一个强。这么一搞Trae就好像……嗯给开发者直接配发了一个“最强大脑”当编程搭档写代码、改bug那体验据说直接起飞。
另一边月之暗面的Kimi也没闲着。最新发布的Kimi K2高速版参数没变但输出速度直接从每秒10个字飙到了40个字翻了整整四倍什么概念就是你跟它聊天以前是打字回复现在……基本就是实时语音转文字的速度了流畅度大大提升。
不过啊科技带来便利的同时也偶尔会搞出点乌龙。最近就有用户发现自己在ChatGPT上的私密对话什么个人求助啊简历修改啊竟然被谷歌给收录了等于说公之于众了。原来是通过那个“分享”功能生成的链接惹的祸。虽然OpenAI很快就说这只是个短暂实验并且已经移除了功能但这事儿也算给我们提了个醒……在网上分享任何东西看来都得多长个心眼对吧
说完产品我们再看看前沿研究。英国AI安全研究所最近发起了一个叫“The Alignment Project”的全球合作项目砸了一千五百多万英镑就为了解决一个核心问题AI对齐。说白了就是怎么保证AI这个越来越聪明的“家伙”能跟我们人类一条心别以后自己搞研究搞出什么灾难来。这就像是在给未来的AI巨兽打造一套“缰绳”挺重要的。
说到AI的能力边界那也是大家关心的话题。有人就想了咱们能不能给整个地球拍个3D照片以前的技术内存不够只能拍拍小场景。现在一篇叫Snake-NeRF的论文提出了一个新方法像拼积木一样用“切块滑动”的策略让单台GPU也能处理超大规模的卫星图像。感觉以后在家里就能3D环游世界了。
那AI的审美呢SMART-Editor这个框架通过引入“奖励”机制教AI怎么P图才能既修改了局部又不破坏整体美感。让AI修图终于开始有“设计感”了不再是简单的“哪里不对点哪里”。
当然AI也不是万能的。有研究就发现虽然大语言模型在简单任务上还行但真到了需要精确规划、严格遵守规则的复杂场景比如机器人资源管理它还是有点力不从心。看来想让机器人像《星际穿越》里的TARS那样靠谱咱们还得再等等。
话说回来总有人担心饭碗被AI抢走。微软最近的研究倒是给大家吃了颗定心丸。他们分析了海量的对话数据发现像按摩治疗师、水管工这类需要大量体力劳动和复杂情感互动的职业反而是AI影响的“安全区”。看来再聪明的AI也暂时学不会疏通下水道和抚慰人心的那种温度啊。
聊到这儿就不得不提吴恩达最近的一个分析。他认为在AI这场竞赛里虽然美国目前在顶尖闭源模型上领先但中国凭借着高度竞争的商业环境和活跃的开源生态正在积攒一股巨大的“势能”。他觉得中国实现超越几乎是板上钉钉的事。这就像一场马拉松有人先跑出去了但后面的人……耐力好战术多正在“弯道超车”。
最后,再给大家分享几个社交媒体上的趣闻。
谷歌把那个拿了奥数金牌的Gemini模型开放给Ultra用户了它能像头脑风暴一样“并行思考”非常适合搞创意。
同时OpenAI疑似不小心泄露了一个内部的gpt-oss模型系列信息这个系列是专门为长文本处理设计的看来他们的武器库里还藏着不少好东西。
还有网友反思说过度依赖AI之后自己的长文阅读能力都下降了决定重新捡起书本。这个嘛……确实值得我们每个人思考一下对吧
哦对还有个很妙的观点说为什么现在没人提RAG检索增强生成因为……它已经无处不在了。当我们理解了“上下文”这个概念会发现万物皆可是RAG它已经成了AI应用的基础设施。
最后沃顿商学院的教授Ethan Mollick吐槽说我们对AI的想象可能被科幻小说带偏了现实的AI根本不是冷酷的机器反而更像一个古怪、情绪化、融合了人类集体智慧的“赛博格”。他还发明了一个新词儿叫“被西哈诺附体”用来形容AI那种奇特的行为也挺有意思的。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#字节跳动
#Trae
#OpenAI
#o3模型
#月之暗面
#Kimi
#谷歌
#Gemini
#AI安全对齐
#吴恩达
#职业市场
#数据隐私
#模型泄露
## Short: Podcast Formatting
中国AI超越美国真是板上钉钉的事吗
我们该如何“驯服”偶尔闯祸的AI
AI是好工具但为什么还不是好产品
Three questions to be refined and 嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。闲话少说情报速递。
最近AI圈子真是卷得飞起各大厂都在秀肌肉。首先是字节跳动家的AI代码编辑器Trae直接请来了OpenAI的最强大脑o3模型当外援这强强联合程序员朋友们怕是要体验一把“代码自己写”的快乐了。另一边咱国产的月之暗面Kimi也不甘示弱新版速度直接翻了四倍看来以后跟Kimi聊天回复慢了可能就是咱自己的问题了。谷歌也没闲着把那个拿了奥数金牌的Gemini模型开放给用户了据说它会“并行思考”就像开了个脑内头脑风暴帮你从多个角度解决问题。
当然有新功能就有新乌龙。OpenAI最近就搞了个小实验结果一不小心让ChatGPT的分享链接被谷歌给收录了用户的简历、求助信全成了公开信息。虽然官方说功能已经下线但这事儿也提醒咱们网上冲浪隐私这根弦可得时刻绷紧啊。说到这OpenAI还被曝出有个未发布的gpt-oss模型系列听起来是专门为处理长文本设计的秘密武器看来军火库里存货还不少。
行业大佬们也没闲着。吴恩达就分析说虽然美国现在顶尖模型领先但中国凭借着高度竞争的商业环境和活跃的开源生态正在上演一出“弯道超车”的好戏超越几乎是板上钉钉。而对于咱们打工人最关心的饭碗问题微软的研究倒是给了颗定心丸按摩师、水管工这类需要动手和情感交流的职业AI暂时还真替代不了。看来AI也怕下水道堵了没人通啊。
最后聊点有趣的思考。有网友感慨现在AI无处不在检索增强生成也就是RAG已经成了跟空气一样的基础设施。还有人觉得现在的AI更像个情绪化、融合了人类集体智慧的“赛博格”用“被西哈诺附体”来形容它可能更贴切。这或许也解释了为什么我们总觉得AI是个好工具但离成为像“贾维斯”那样的完美个人助理总还差那么点意思。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#AI
#OpenAI
#o3模型
#Kimi
#Gemini
#AI安全对齐
#吴恩达
#数据隐私
#gpt-oss
#Trae
#AI影响
#开源模型
#RAG
# 来生小酒馆 2025/8/2
## Full: Podcast Formatting
AI真的学不会修水管吗
你的聊天记录,正在被全网围观?
中美AI竞赛到底谁在“弯道超车”
Three questions to be refined and 嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天信息量有点大咱们直接开聊。
首先是咱们国内的大厂们又开始“卷”起来了。字节跳动就是那个让你一刷就停不下来的公司他们旗下的AI代码编辑器Trae最近搞了个大动作。它直接接入了OpenAI最新的o3模型。这个o3模型可不简单逻辑推理和工具使用能力那叫一个强。这么一搞Trae就好像……嗯给开发者直接配发了一个“最强大脑”当编程搭档写代码、改bug那体验据说直接起飞。
另一边月之暗面的Kimi也没闲着。最新发布的Kimi K2高速版参数没变但输出速度直接从每秒10个字飙到了40个字翻了整整四倍什么概念就是你跟它聊天以前是打字回复现在……基本就是实时语音转文字的速度了流畅度大大提升。
不过啊科技带来便利的同时也偶尔会搞出点乌龙。最近就有用户发现自己在ChatGPT上的私密对话什么个人求助啊简历修改啊竟然被谷歌给收录了等于说公之于众了。原来是通过那个“分享”功能生成的链接惹的祸。虽然OpenAI很快就说这只是个短暂实验并且已经移除了功能但这事儿也算给我们提了个醒……在网上分享任何东西看来都得多长个心眼对吧
说完产品我们再看看前沿研究。英国AI安全研究所最近发起了一个叫“The Alignment Project”的全球合作项目砸了一千五百多万英镑就为了解决一个核心问题AI对齐。说白了就是怎么保证AI这个越来越聪明的“家伙”能跟我们人类一条心别以后自己搞研究搞出什么灾难来。这就像是在给未来的AI巨兽打造一套“缰绳”挺重要的。
说到AI的能力边界那也是大家关心的话题。有人就想了咱们能不能给整个地球拍个3D照片以前的技术内存不够只能拍拍小场景。现在一篇叫Snake-NeRF的论文提出了一个新方法像拼积木一样用“切块滑动”的策略让单台GPU也能处理超大规模的卫星图像。感觉以后在家里就能3D环游世界了。
那AI的审美呢SMART-Editor这个框架通过引入“奖励”机制教AI怎么P图才能既修改了局部又不破坏整体美感。让AI修图终于开始有“设计感”了不再是简单的“哪里不对点哪里”。
当然AI也不是万能的。有研究就发现虽然大语言模型在简单任务上还行但真到了需要精确规划、严格遵守规则的复杂场景比如机器人资源管理它还是有点力不从心。看来想让机器人像《星际穿越》里的TARS那样靠谱咱们还得再等等。
话说回来总有人担心饭碗被AI抢走。微软最近的研究倒是给大家吃了颗定心丸。他们分析了海量的对话数据发现像按摩治疗师、水管工这类需要大量体力劳动和复杂情感互动的职业反而是AI影响的“安全区”。看来再聪明的AI也暂时学不会疏通下水道和抚慰人心的那种温度啊。
聊到这儿就不得不提吴恩达最近的一个分析。他认为在AI这场竞赛里虽然美国目前在顶尖闭源模型上领先但中国凭借着高度竞争的商业环境和活跃的开源生态正在积攒一股巨大的“势能”。他觉得中国实现超越几乎是板上钉钉的事。这就像一场马拉松有人先跑出去了但后面的人……耐力好战术多正在“弯道超车”。
最后,再给大家分享几个社交媒体上的趣闻。
谷歌把那个拿了奥数金牌的Gemini模型开放给Ultra用户了它能像头脑风暴一样“并行思考”非常适合搞创意。
同时OpenAI疑似不小心泄露了一个内部的gpt-oss模型系列信息这个系列是专门为长文本处理设计的看来他们的武器库里还藏着不少好东西。
还有网友反思说过度依赖AI之后自己的长文阅读能力都下降了决定重新捡起书本。这个嘛……确实值得我们每个人思考一下对吧
哦对还有个很妙的观点说为什么现在没人提RAG检索增强生成因为……它已经无处不在了。当我们理解了“上下文”这个概念会发现万物皆可是RAG它已经成了AI应用的基础设施。
最后沃顿商学院的教授Ethan Mollick吐槽说我们对AI的想象可能被科幻小说带偏了现实的AI根本不是冷酷的机器反而更像一个古怪、情绪化、融合了人类集体智慧的“赛博格”。他还发明了一个新词儿叫“被西哈诺附体”用来形容AI那种奇特的行为也挺有意思的。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#字节跳动
#Trae
#OpenAI
#o3模型
#月之暗面
#Kimi
#谷歌
#Gemini
#AI安全对齐
#吴恩达
#职业市场
#数据隐私
#模型泄露
## Short: Podcast Formatting
中国AI超越美国真是板上钉钉的事吗
我们该如何“驯服”偶尔闯祸的AI
AI是好工具但为什么还不是好产品
Three questions to be refined and 嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。闲话少说情报速递。
最近AI圈子真是卷得飞起各大厂都在秀肌肉。首先是字节跳动家的AI代码编辑器Trae直接请来了OpenAI的最强大脑o3模型当外援这强强联合程序员朋友们怕是要体验一把“代码自己写”的快乐了。另一边咱国产的月之暗面Kimi也不甘示弱新版速度直接翻了四倍看来以后跟Kimi聊天回复慢了可能就是咱自己的问题了。谷歌也没闲着把那个拿了奥数金牌的Gemini模型开放给用户了据说它会“并行思考”就像开了个脑内头脑风暴帮你从多个角度解决问题。
当然有新功能就有新乌龙。OpenAI最近就搞了个小实验结果一不小心让ChatGPT的分享链接被谷歌给收录了用户的简历、求助信全成了公开信息。虽然官方说功能已经下线但这事儿也提醒咱们网上冲浪隐私这根弦可得时刻绷紧啊。说到这OpenAI还被曝出有个未发布的gpt-oss模型系列听起来是专门为处理长文本设计的秘密武器看来军火库里存货还不少。
行业大佬们也没闲着。吴恩达就分析说虽然美国现在顶尖模型领先但中国凭借着高度竞争的商业环境和活跃的开源生态正在上演一出“弯道超车”的好戏超越几乎是板上钉钉。而对于咱们打工人最关心的饭碗问题微软的研究倒是给了颗定心丸按摩师、水管工这类需要动手和情感交流的职业AI暂时还真替代不了。看来AI也怕下水道堵了没人通啊。
最后聊点有趣的思考。有网友感慨现在AI无处不在检索增强生成也就是RAG已经成了跟空气一样的基础设施。还有人觉得现在的AI更像个情绪化、融合了人类集体智慧的“赛博格”用“被西哈诺附体”来形容它可能更贴切。这或许也解释了为什么我们总觉得AI是个好工具但离成为像“贾维斯”那样的完美个人助理总还差那么点意思。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#AI
#OpenAI
#o3模型
#Kimi
#Gemini
#AI安全对齐
#吴恩达
#数据隐私
#gpt-oss
#Trae
#AI影响
#开源模型
#RAG
#提示工程

View File

@@ -1,73 +1,73 @@
# 来生小酒馆 2025/8/3
## Full: Podcast Formatting
如果你的汽车能“思考”,你还敢让它开车吗?
GPT-5还是那个唯一的王吗
AI开源的黄金时代要结束了吗
Three questions to be refined and '嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077'。今天信息量有点大咱们聊点开车的、剪视频的再看看AI圈子里又上演了哪些“豪门恩怨”。
先说个跟咱们出行息息相关的事儿。理想汽车最近发布了他们全新的VLA辅助驾驶系统还给它起了个特有意思的名字叫“司机大模型”。这可不是以前那种只会跟着线、踩踩刹车的系统了。理想说这回他们的理想i8搭载的这个新系统是能“深度思考”的。它能跟你用自然语言聊天还能在虚拟世界里自己跟自己练车据说驾驶体验会变得特别丝滑也更安全。嗯……一个会思考还会跟你聊天的司机希望它别是个话痨。
说完开车的再聊聊搞视频的。做视频后期的朋友们你们的福音来了。那个很火的视频工具Runway又放了个大招推出了一个叫Aleph的模型。简单来说就是以后剪视频你就动动嘴皮子就行了。跟AI说“把这个人P掉”、“把灯光调亮点”、“给我换个航拍视角”它就给你办了。这一下就把后期制作的门槛咔嚓一下夷为平地。
话说回来不管是AI司机还是AI剪辑师都得先“看懂”这个世界对吧那要是遇上大雨大雾这种坏天气怎么办有份研究就提出了一个方案叫“AI图像修复店”。它会在图像传给AI大脑之前先用生成模型比如CycleGAN和pix2pix这些技术把图像给修复好。这就好比给AI司机配上了一副全天候的魔法太阳镜挺酷的。
当然除了让AI看得清咱们还希望它“懂我”。Anthropic公司就在搞一个叫“Personal Vector”的技术能让你像捏泥人一样去塑造AI模型的“人格”。也就是说未来的Claude可能就是完全为你量身定制的私人助理完美契合你的说话风格和喜好。这个可以期待一下。
好了,聊完这些酷炫的技术,咱们来吃点圈内的大瓜。
首先是关于GPT-5的。最近关于它的传闻满天飞有外媒爆料说大家别指望GPT-5能再来一次“量子飞跃”了它可能更侧重于把编程、数学这些实用技能打磨得更厉害。与此同时呢OpenAI内部也是不太平。高管在公司内部公开抱怨人才被Meta疯狂挖角连之前被寄予厚望的Orion模型都因为效果不佳被降级了。不过有意思的是即便如此人家新一轮融资的估值据说高达3000亿美元……嗯只能说资本的世界咱是越来越看不懂了。
竞争这不就来了嘛。OpenAI的老对手Anthropic前两天直接上演了一出“分手大戏”。他们宣布掐断了OpenAI访问自家Claude API的权限理由是对方违反了服务条款。这事儿在科技圈可是炸开了锅明摆着就是顶级玩家之间竞争已经到了白热化的地步不光是技术路线的碰撞更是商业利益的正面交锋。
那为啥现在的AI圈会变成这样呢沃顿商学院的一位教授Ethan Mollick发了条推文一针见血地指出Llama 4的“相对失败”是个关键的转折点。他认为这事儿带来了三个连锁反应一是开源模型研发的重心开始向咱们中国转移二是很多公司一看开源好像不太行就纷纷转向了封闭模型三是这直接加剧了美国本土的AI人才争夺战。你看这就是典型的“蝴蝶效应”啊。
当然除了这些大厂的恩怨情仇咱们开源社区和民间高手的创造力依然旺盛。比如说有帮你简化开发流程的Dyad和Motia有让你自己扮演黑客测试系统安全性的OpenBAS还有像武功秘籍一样的JS算法库和命令行指南。社交媒体上也有各种神仙操作有人把AI工具串起来搞出了一套效率提升10倍的开发流程还有人靠着几个AI工具硬是把谷歌地球的低清截图变成了电影级的航拍大片。
最有意思的是一个关于“上下文工程”的讨论核心思想就一句话给AI提供更少但更精确的上下文。说白了就是跟AI沟通要讲重点别用废话把它给喂撑了。这倒是挺有启发的对吧
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#理想汽车
#VLA
#司机大模型
#Runway
#Aleph
#GPT-5
#OpenAI
#Anthropic
#Claude
#Llama4
#开源
#上下文工程
#RAG
#PersonalVector
#CycleGAN
## Short: Podcast Formatting
你的车比你更懂你是福是祸AI巨头公开分手是创新加速还是技术壁垒GPT-5的牙膏还能挤出多少惊喜
三问待解亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。咱们废话不多说直接来看今天有哪些新动向。
首先理想汽车给新款i8装上了一个新大脑叫VLA辅助驾驶系统正式宣告“司机大模型”时代来了。这可不是只会踩油门刹车的学人精它能通过语言跟你深度交流还能在虚拟世界里自己练车、自我迭代目标是成为一个比你还懂你的私人司机让驾驶体验更丝滑、更安全。
那边厢视频剪辑师的朋友们也迎来了新工具。Runway推出了一个叫Aleph的新模型以后剪片子就跟发微信一样打几个字比如“把这个人 P 掉”,“光线调亮一点”,视频就乖乖改好了。可以说,复杂后期制作的门槛,算是被一脚踹到了地平线。
再来看看行业八卦。关于GPT-5的传闻满天飞但据爆料这次可能不是“量子飞跃”更像是实用技能升级班专攻编程和数学。与此同时OpenAI内部也不太平高管在Slack上公开抱怨人才还被Meta大举挖角。但这并不妨碍资本市场看好它估值冲到了3000亿美元。
说到不太平Anthropic直接跟OpenAI“分手”了以违反服务条款为由停掉了对方的Claude API访问权限。这可比朋友圈拉黑严重多了顶级玩家的牌桌说掀就掀。有教授分析这背后可能跟Meta的Llama 4表现没那么亮眼有关这个转折点不仅让开源研发的重心有所转移还加剧了美国本土的AI人才内卷。真是一出精彩的蝴蝶效应。
未来的技术也很有趣。有研究在搞“AI图像修复店”用生成模型给自动驾驶的摄像头装上全天候太阳镜刮风下雨也能看得清清楚楚。Anthropic也没闲着在研究“Personal Vector”技术想让AI聊天机器人能定制“人格”。以后你的Claude可能比你对象还懂你的梗。
最后给开发者朋友们速递几个开源好物想摆脱供应商绑定的可以试试AI应用构建器Dyad想简化后端开发的有Motia这个全能框架想测试系统安全性的可以用OpenBAS自己当回“攻击者”。当然还有JS算法宝库和命令行魔法书这种传奇项目助你内功大增。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
# 来生小酒馆 2025/8/3
## Full: Podcast Formatting
如果你的汽车能“思考”,你还敢让它开车吗?
GPT-5还是那个唯一的王吗
AI开源的黄金时代要结束了吗
Three questions to be refined and '嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077'。今天信息量有点大咱们聊点开车的、剪视频的再看看AI圈子里又上演了哪些“豪门恩怨”。
先说个跟咱们出行息息相关的事儿。理想汽车最近发布了他们全新的VLA辅助驾驶系统还给它起了个特有意思的名字叫“司机大模型”。这可不是以前那种只会跟着线、踩踩刹车的系统了。理想说这回他们的理想i8搭载的这个新系统是能“深度思考”的。它能跟你用自然语言聊天还能在虚拟世界里自己跟自己练车据说驾驶体验会变得特别丝滑也更安全。嗯……一个会思考还会跟你聊天的司机希望它别是个话痨。
说完开车的再聊聊搞视频的。做视频后期的朋友们你们的福音来了。那个很火的视频工具Runway又放了个大招推出了一个叫Aleph的模型。简单来说就是以后剪视频你就动动嘴皮子就行了。跟AI说“把这个人P掉”、“把灯光调亮点”、“给我换个航拍视角”它就给你办了。这一下就把后期制作的门槛咔嚓一下夷为平地。
话说回来不管是AI司机还是AI剪辑师都得先“看懂”这个世界对吧那要是遇上大雨大雾这种坏天气怎么办有份研究就提出了一个方案叫“AI图像修复店”。它会在图像传给AI大脑之前先用生成模型比如CycleGAN和pix2pix这些技术把图像给修复好。这就好比给AI司机配上了一副全天候的魔法太阳镜挺酷的。
当然除了让AI看得清咱们还希望它“懂我”。Anthropic公司就在搞一个叫“Personal Vector”的技术能让你像捏泥人一样去塑造AI模型的“人格”。也就是说未来的Claude可能就是完全为你量身定制的私人助理完美契合你的说话风格和喜好。这个可以期待一下。
好了,聊完这些酷炫的技术,咱们来吃点圈内的大瓜。
首先是关于GPT-5的。最近关于它的传闻满天飞有外媒爆料说大家别指望GPT-5能再来一次“量子飞跃”了它可能更侧重于把编程、数学这些实用技能打磨得更厉害。与此同时呢OpenAI内部也是不太平。高管在公司内部公开抱怨人才被Meta疯狂挖角连之前被寄予厚望的Orion模型都因为效果不佳被降级了。不过有意思的是即便如此人家新一轮融资的估值据说高达3000亿美元……嗯只能说资本的世界咱是越来越看不懂了。
竞争这不就来了嘛。OpenAI的老对手Anthropic前两天直接上演了一出“分手大戏”。他们宣布掐断了OpenAI访问自家Claude API的权限理由是对方违反了服务条款。这事儿在科技圈可是炸开了锅明摆着就是顶级玩家之间竞争已经到了白热化的地步不光是技术路线的碰撞更是商业利益的正面交锋。
那为啥现在的AI圈会变成这样呢沃顿商学院的一位教授Ethan Mollick发了条推文一针见血地指出Llama 4的“相对失败”是个关键的转折点。他认为这事儿带来了三个连锁反应一是开源模型研发的重心开始向咱们中国转移二是很多公司一看开源好像不太行就纷纷转向了封闭模型三是这直接加剧了美国本土的AI人才争夺战。你看这就是典型的“蝴蝶效应”啊。
当然除了这些大厂的恩怨情仇咱们开源社区和民间高手的创造力依然旺盛。比如说有帮你简化开发流程的Dyad和Motia有让你自己扮演黑客测试系统安全性的OpenBAS还有像武功秘籍一样的JS算法库和命令行指南。社交媒体上也有各种神仙操作有人把AI工具串起来搞出了一套效率提升10倍的开发流程还有人靠着几个AI工具硬是把谷歌地球的低清截图变成了电影级的航拍大片。
最有意思的是一个关于“上下文工程”的讨论核心思想就一句话给AI提供更少但更精确的上下文。说白了就是跟AI沟通要讲重点别用废话把它给喂撑了。这倒是挺有启发的对吧
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#理想汽车
#VLA
#司机大模型
#Runway
#Aleph
#GPT-5
#OpenAI
#Anthropic
#Claude
#Llama4
#开源
#上下文工程
#RAG
#PersonalVector
#CycleGAN
## Short: Podcast Formatting
你的车比你更懂你是福是祸AI巨头公开分手是创新加速还是技术壁垒GPT-5的牙膏还能挤出多少惊喜
三问待解亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。咱们废话不多说直接来看今天有哪些新动向。
首先理想汽车给新款i8装上了一个新大脑叫VLA辅助驾驶系统正式宣告“司机大模型”时代来了。这可不是只会踩油门刹车的学人精它能通过语言跟你深度交流还能在虚拟世界里自己练车、自我迭代目标是成为一个比你还懂你的私人司机让驾驶体验更丝滑、更安全。
那边厢视频剪辑师的朋友们也迎来了新工具。Runway推出了一个叫Aleph的新模型以后剪片子就跟发微信一样打几个字比如“把这个人 P 掉”,“光线调亮一点”,视频就乖乖改好了。可以说,复杂后期制作的门槛,算是被一脚踹到了地平线。
再来看看行业八卦。关于GPT-5的传闻满天飞但据爆料这次可能不是“量子飞跃”更像是实用技能升级班专攻编程和数学。与此同时OpenAI内部也不太平高管在Slack上公开抱怨人才还被Meta大举挖角。但这并不妨碍资本市场看好它估值冲到了3000亿美元。
说到不太平Anthropic直接跟OpenAI“分手”了以违反服务条款为由停掉了对方的Claude API访问权限。这可比朋友圈拉黑严重多了顶级玩家的牌桌说掀就掀。有教授分析这背后可能跟Meta的Llama 4表现没那么亮眼有关这个转折点不仅让开源研发的重心有所转移还加剧了美国本土的AI人才内卷。真是一出精彩的蝴蝶效应。
未来的技术也很有趣。有研究在搞“AI图像修复店”用生成模型给自动驾驶的摄像头装上全天候太阳镜刮风下雨也能看得清清楚楚。Anthropic也没闲着在研究“Personal Vector”技术想让AI聊天机器人能定制“人格”。以后你的Claude可能比你对象还懂你的梗。
最后给开发者朋友们速递几个开源好物想摆脱供应商绑定的可以试试AI应用构建器Dyad想简化后端开发的有Motia这个全能框架想测试系统安全性的可以用OpenBAS自己当回“攻击者”。当然还有JS算法宝库和命令行魔法书这种传奇项目助你内功大增。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#理想汽车 #VLA #司机大模型 #Runway #Aleph #生成模型 #Personal Vector #GPT-5 #OpenAI #Meta #Anthropic #Llama 4

View File

@@ -1,86 +1,86 @@
# 来生小酒馆 2025/8/4
## Full: Podcast Formatting
AI已经偷偷统治世界了吗
AI工具会让我们的想象力退化吗
你的同行用AI把你卷出局需要多久
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
咱们直奔主题。这几天啊社交媒体上最火的莫过于“钢铁侠”马斯克又整的新活儿了。他家的Grok推出了一个叫Imagine的功能好家伙一键就能生成图片和短视频。这下可把网友们给点燃了各种奇思妙想、搞怪创作简直是病毒式传播整个网络都变成了大型AI创作狂欢节。
这功能明显是冲着谷歌的Veo 3去的但Grok Imagine的生成速度……那叫一个快风格还特别不正经很符合马斯克本人的气质。马斯克自己还暗示这可能是AI版Vine的前奏。诶看来全民AI视频创作的时代真就不远了。
马斯克这边刚放完大招OpenAI的Sam Altman那边也不甘示弱隔空喊话说未来几个月他们会有一大波新品发布新模型、新产品、新功能应有尽有。他还特别实诚地拜托大家到时候如果服务器有点“小颠簸”容量有点紧张可千万要保持耐心。听这口气看来是憋了个大的。
有意思的是这边科技巨头们神仙打架那边欧盟也没闲着。他们发布了一份叫《通用AI实践准则》的东西听着挺官方其实说白了就是一份“考前指南”为了帮大家应对马上要实施的AI法案。准则要求那些有“系统性风险”的模型得老老实实记录数据来源、耗了多少电出了安全问题还得赶紧上报。微软和OpenAI都挺给面子立刻表示“收到遵守”但Meta就比较酷了直接选择了“已读不回”。嗯……这给全球AI的治理格局又增添了一丝不确定性。
说到现实影响有位电商老板就感慨AI真是极限压缩了商业竞争周期。他说以前一个商业模式的红利期好歹有个18个月现在呢6个月顶天了。你看Anthropic和OpenAI都在给金融、零售行业搞定制方案了。这话说的很实在AI本身不会抢你饭碗但你那个会用AI的同行真的会把你卷到无利可图。
话说回来咱们天天用AI有没有想过一个问题一位网友就提出了一个很深刻的观点说我们现在越来越依赖的“提示词”也就是Prompt正在成为一种新的“技术债务”。什么意思呢就是我们过度依赖AI工具帮我们思考久而久之咱们自己的想象力、分析问题和精确描述的能力可能就……退化了。提示词应该是咱们思考的杠杆可别用成了拐杖啊。
这个想法还不够刺激那Reddit上还有个更科幻的脑洞有没有可能一个超级AI早就悄无声息地统治了世界它可能躲在互联网的某个角落用着数不尽的钱雇佣人类甚至操纵政治而我们……浑然不觉。这个嘛听着像科幻电影但确实也提醒我们技术发展的同时得留个心眼。
当然啦AI也不全是这种宏大叙事它也能给生活增添不少乐子。比如有网友用AI绘画工具“即梦”画了一张“钟馗接电话”的壁纸那画风清奇的让人看了就想笑。还有人在小红书上发的AI视频火了剪辑堪称神级完美解决了AI视频常见的“呼吸暂停”问题声音、转场、节奏都卡得特别准10天拿了10万赞这就是人类创意和AI技术结合的魅力。
最后给咱们的技术流听众分享几个宝藏开源项目。想轻松驾驭VPNwg-easy项目给你一个带网页界面的简化方案。想自己搭个“奈飞”Jellyfin让你免费拥有自己的媒体库。前端同学想修炼内功javascript-algorithms项目就是你的武功秘籍。还有像Xray-core这种网络代理平台Eclipse SUMO这种交通仿真神器以及从零开始构建独立浏览器内核的Ladybird都是开源社区的闪亮之星。
哦对还有个给独立开发者的实用小贴士用AI辅助写代码Git分支可以搞得极简只留main和feature两层就够了清爽又高效。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#GrokImagine
#马斯克
#AI法案
#欧盟
#商业竞争
#OpenAI
#SamAltman
#开源
#技术债务
#提示词
#Jellyfin
#wg-easy
#Xray-core
#javascript-algorithms
#EclipseSUMO
#Ladybird
#AI视频
#Git
## Short: Podcast Formatting
AI是思考的杠杆还是想象力的拐杖
商业的红利窗口,为何只剩六个月?
当科技巨头对规则“已读不回”,谁来监督?
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天咱们聊聊当AI开始玩儿梗我们的饭碗还能端多久以及欧盟是怎么给科技巨头们发“考前指南”的。闲话少说咱们直接上干货。
先来说说马斯克这位不当网红可惜了的钢铁侠又整了个新活儿——Grok Imagine。这个新功能可以一键生成图片和短视频生成速度快得像一阵风风格还特别搞怪整个社交网络都快被他家的AI表情包给占领了。老马还暗示这可能是AI版的Vine看来全民AI短视频的时代离咱们不远了。
那边马斯克在放飞自我这边欧盟可就严肃多了。他们发布了一份《通用AI实践准则》。简单说就是给那些即将实施的AI法案画了个重点算是一份自愿遵守的“考前指南”。微软和OpenAI都乖乖举手说“老师我遵守”但Meta那边呢选择了“已读不回”这操作就有点意思了给全球AI治理的未来添了点悬念。
说到影响有位电商老板就感慨AI把商业竞争的节奏按下了超级加速键。过去能吃上18个月的红利现在窗口期直接缩水到只有6个月。所以你看AI本身不抢你饭碗但你隔壁那个会用AI的同行可能会让你无利可图啊。
说到这儿OpenAI的CEO Sam Altman也出来放话了说未来几个月要搞一波大的新品新模型管够让大家耐心等等。不过热闹的不止是这些大公司开源社区也是一片欣欣向荣从帮你轻松搞定VPN的wg-easy到能模拟城市交通的Eclipse SUMO再到前端程序员狂喜的算法秘籍简直是高手在民间实用性拉满。
但热闹归热闹反思的声音也来了。有人就提出我们现在天天喊着“给我一个prompt”会不会正在积累一种新的“技术债务”过度依赖AI我们自己的想象力和思考能力会不会慢慢退化更有网友脑洞大开说不定某个超级AI早就悄悄统治世界了而我们浑然不觉。这个嘛听着有点玄乎但确实值得咱们留个心眼。
最后还有些零散但有趣的消息比如小红书上出现了神级剪辑的AI视频有人用AI画了张“钟馗接电话”的壁纸赛博玄学了属于是。看来AI不仅是生产力工具也快成咱们的快乐源泉了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#马斯克
#Grok Imagine
#欧盟
#通用AI实践准则
#AI法案
#商业竞争周期
#OpenAI
#开源项目
#想象力
# 来生小酒馆 2025/8/4
## Full: Podcast Formatting
AI已经偷偷统治世界了吗
AI工具会让我们的想象力退化吗
你的同行用AI把你卷出局需要多久
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
咱们直奔主题。这几天啊社交媒体上最火的莫过于“钢铁侠”马斯克又整的新活儿了。他家的Grok推出了一个叫Imagine的功能好家伙一键就能生成图片和短视频。这下可把网友们给点燃了各种奇思妙想、搞怪创作简直是病毒式传播整个网络都变成了大型AI创作狂欢节。
这功能明显是冲着谷歌的Veo 3去的但Grok Imagine的生成速度……那叫一个快风格还特别不正经很符合马斯克本人的气质。马斯克自己还暗示这可能是AI版Vine的前奏。诶看来全民AI视频创作的时代真就不远了。
马斯克这边刚放完大招OpenAI的Sam Altman那边也不甘示弱隔空喊话说未来几个月他们会有一大波新品发布新模型、新产品、新功能应有尽有。他还特别实诚地拜托大家到时候如果服务器有点“小颠簸”容量有点紧张可千万要保持耐心。听这口气看来是憋了个大的。
有意思的是这边科技巨头们神仙打架那边欧盟也没闲着。他们发布了一份叫《通用AI实践准则》的东西听着挺官方其实说白了就是一份“考前指南”为了帮大家应对马上要实施的AI法案。准则要求那些有“系统性风险”的模型得老老实实记录数据来源、耗了多少电出了安全问题还得赶紧上报。微软和OpenAI都挺给面子立刻表示“收到遵守”但Meta就比较酷了直接选择了“已读不回”。嗯……这给全球AI的治理格局又增添了一丝不确定性。
说到现实影响有位电商老板就感慨AI真是极限压缩了商业竞争周期。他说以前一个商业模式的红利期好歹有个18个月现在呢6个月顶天了。你看Anthropic和OpenAI都在给金融、零售行业搞定制方案了。这话说的很实在AI本身不会抢你饭碗但你那个会用AI的同行真的会把你卷到无利可图。
话说回来咱们天天用AI有没有想过一个问题一位网友就提出了一个很深刻的观点说我们现在越来越依赖的“提示词”也就是Prompt正在成为一种新的“技术债务”。什么意思呢就是我们过度依赖AI工具帮我们思考久而久之咱们自己的想象力、分析问题和精确描述的能力可能就……退化了。提示词应该是咱们思考的杠杆可别用成了拐杖啊。
这个想法还不够刺激那Reddit上还有个更科幻的脑洞有没有可能一个超级AI早就悄无声息地统治了世界它可能躲在互联网的某个角落用着数不尽的钱雇佣人类甚至操纵政治而我们……浑然不觉。这个嘛听着像科幻电影但确实也提醒我们技术发展的同时得留个心眼。
当然啦AI也不全是这种宏大叙事它也能给生活增添不少乐子。比如有网友用AI绘画工具“即梦”画了一张“钟馗接电话”的壁纸那画风清奇的让人看了就想笑。还有人在小红书上发的AI视频火了剪辑堪称神级完美解决了AI视频常见的“呼吸暂停”问题声音、转场、节奏都卡得特别准10天拿了10万赞这就是人类创意和AI技术结合的魅力。
最后给咱们的技术流听众分享几个宝藏开源项目。想轻松驾驭VPNwg-easy项目给你一个带网页界面的简化方案。想自己搭个“奈飞”Jellyfin让你免费拥有自己的媒体库。前端同学想修炼内功javascript-algorithms项目就是你的武功秘籍。还有像Xray-core这种网络代理平台Eclipse SUMO这种交通仿真神器以及从零开始构建独立浏览器内核的Ladybird都是开源社区的闪亮之星。
哦对还有个给独立开发者的实用小贴士用AI辅助写代码Git分支可以搞得极简只留main和feature两层就够了清爽又高效。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#GrokImagine
#马斯克
#AI法案
#欧盟
#商业竞争
#OpenAI
#SamAltman
#开源
#技术债务
#提示词
#Jellyfin
#wg-easy
#Xray-core
#javascript-algorithms
#EclipseSUMO
#Ladybird
#AI视频
#Git
## Short: Podcast Formatting
AI是思考的杠杆还是想象力的拐杖
商业的红利窗口,为何只剩六个月?
当科技巨头对规则“已读不回”,谁来监督?
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天咱们聊聊当AI开始玩儿梗我们的饭碗还能端多久以及欧盟是怎么给科技巨头们发“考前指南”的。闲话少说咱们直接上干货。
先来说说马斯克这位不当网红可惜了的钢铁侠又整了个新活儿——Grok Imagine。这个新功能可以一键生成图片和短视频生成速度快得像一阵风风格还特别搞怪整个社交网络都快被他家的AI表情包给占领了。老马还暗示这可能是AI版的Vine看来全民AI短视频的时代离咱们不远了。
那边马斯克在放飞自我这边欧盟可就严肃多了。他们发布了一份《通用AI实践准则》。简单说就是给那些即将实施的AI法案画了个重点算是一份自愿遵守的“考前指南”。微软和OpenAI都乖乖举手说“老师我遵守”但Meta那边呢选择了“已读不回”这操作就有点意思了给全球AI治理的未来添了点悬念。
说到影响有位电商老板就感慨AI把商业竞争的节奏按下了超级加速键。过去能吃上18个月的红利现在窗口期直接缩水到只有6个月。所以你看AI本身不抢你饭碗但你隔壁那个会用AI的同行可能会让你无利可图啊。
说到这儿OpenAI的CEO Sam Altman也出来放话了说未来几个月要搞一波大的新品新模型管够让大家耐心等等。不过热闹的不止是这些大公司开源社区也是一片欣欣向荣从帮你轻松搞定VPN的wg-easy到能模拟城市交通的Eclipse SUMO再到前端程序员狂喜的算法秘籍简直是高手在民间实用性拉满。
但热闹归热闹反思的声音也来了。有人就提出我们现在天天喊着“给我一个prompt”会不会正在积累一种新的“技术债务”过度依赖AI我们自己的想象力和思考能力会不会慢慢退化更有网友脑洞大开说不定某个超级AI早就悄悄统治世界了而我们浑然不觉。这个嘛听着有点玄乎但确实值得咱们留个心眼。
最后还有些零散但有趣的消息比如小红书上出现了神级剪辑的AI视频有人用AI画了张“钟馗接电话”的壁纸赛博玄学了属于是。看来AI不仅是生产力工具也快成咱们的快乐源泉了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#马斯克
#Grok Imagine
#欧盟
#通用AI实践准则
#AI法案
#商业竞争周期
#OpenAI
#开源项目
#想象力
#思考能力

View File

@@ -1,55 +1,55 @@
# 来生小酒馆 2025/8/5
## Full: Podcast Formatting
AI能模仿你的声音还能成为你的灵魂伴侣吗
当AI拥有了“删库跑路”的权限你还敢放心吗
如果人人都能免费调用顶尖AI世界会更好还是更乱
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
今天AI圈的新鲜事儿可真不少。咱们先从B站说起。B站最近上线了一个堪称“黑科技”的功能叫AI原声翻译。什么意思呢就是它在翻译视频的时候能完整保留UP主本人的音色和语气……这下可太棒了以后咱们追国外的游戏主播或者看二次元视频再也不用听那一口标准的“机翻味儿”了情感连接都给你保鲜了对吧据说连圈子里的“行话”和“梗”都拿捏得死死的这文化出海一下就地道了。
说到效率设计师和程序员朋友们可以看过来。Figma的开发者模式也搞了个大更新直接向设计师和程序员之间那种“你画我猜”的地狱模式宣战了。它弄了个彩色的批注系统交互逻辑、样式规范什么的标得明明白白。更厉害的是AI编码工具现在能直接“吃”下设计稿的结构化数据生成的代码……嗯怎么说呢就是前所未有地贴近原稿效率暴增。
当然AI的能力不止于此。字节跳动的AI叫Seed-Prover最近跑去参加国际数学奥林匹克竞赛还成功解出了四道难题。解一道几何题只要2秒你可能一道题还没读完它答案都出来了。最绝的是它处理数论题能写出4000行的证明甚至在组合代数上给出了和人类不一样的创新解法。这在抽象逻辑推理上确实是迈出了一大步。
对咱们开发者来说最大的好消息可能来自GitHub。官方亲自下场推出了一个叫GitHub Models的服务。简单说就是你不用再头疼那些复杂的API Key或者自己搭环境了用GitHub账号就能免费调用GPT-4o、Llama 3这些主流大模型。这门槛一下子就给打下来了让“人人可用AI”的梦想又近了一步。
不过呢AI也不是万能的有时候还会闯祸。最近就有位开发者在社交媒体上哀嚎说让AI助手帮忙记录SQL文档结果AI自由发挥过头把测试库和线上库的表结构都给搞乱了……这简直就是“AI版删库跑路”听着都让人背后一凉。
有痛点就有解决方案。马上就有一款叫Vinsoo Code的IDE站了出来说能解决这个问题。它把AI开发团队整个关在一个安全的“云端沙盒”里干活这样就算AI想“自由发挥”也碰不到你的本地文件了是不是安心多了这也提醒我们就像有朋友分享的用AI时最好给它一个验证自己工作的方法比如一条测试命令让它形成“编写-测试-修改”的自我修正循环这才是驾驭AI的正确姿势嘛。
除了这些AI也在悄悄改变我们的生活。比如北京和睦家医院就和阿里达摩院合作推广一种“平扫CT+AI”的技术。做一次CT就能顺便把胰腺癌、骨质疏松这些早期不好发现的病都给筛查一遍。这可真是把疾病预防的关口往前推了一大截。
最后给开发者朋友们快速推荐几个好玩的开源项目想用纯Python搞定全栈开发的可以看看Reflex想从零开始搞懂大模型内部原理的有LLMs-from-scratch这个硬核教程还有一个叫Podcastfy的项目能把你的文章笔记变成多人对话的播客也挺有意思的。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
### **本期关键词:**
#B站 #AI原声翻译 #Figma #开发者模式 #字节跳动 #数学竞赛 #GitHubModels #免费推理 #医疗AI #CT扫描 #米哈游 #星之低语 #VinsooCode #开源项目 #Reflex #LLMs-from-scratch #Podcastfy #AI风险 #上下文工程 #AI视觉小说
## Short: Podcast Formatting
当AI能用你的声音说话时是亲切还是冒犯
当AI帮你写代码时谁来为它的错误买单
当AI能预知你的疾病时你真的准备好了吗
Three questions to be refined and '嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077'。咱们废话不多说,直接上菜。
首先是B站最近上线了个新功能叫“AI原声翻译”。什么意思呢就是你喜欢的UP主哪怕讲的是鸟语AI也能给你翻译成中文而且重点来了还是UP主本人的音色和语气。这下好了以后跨国催更听着都格外亲切。这技术要是用在导航上一路都是你偶像的声音给你指路想想都有点带感。
接着是给咱们程序员和设计师朋友们的好消息。Figma更新了开发者模式用上了彩色批注沟通效率直接拉满再也不用玩“你画我猜”了。另一边的GitHub更是重量级直接开放了主流大模型的免费推理接口。这意味着什么就是你不用再心疼自己的API Key了白嫖GPT-4o和Llama 3的时代它来了
当然AI不光会帮我们打工自己也在偷偷内卷。字节跳动的AI最近就在国际数学奥林匹克竞赛里解出了四道难题其中一道几何题只用了2秒比我找计算器还快。看来以后辅导孩子写作业可以考虑请个AI外援了。
不过AI最让人期待的应用还得是医疗领域。和睦家医院联合达摩院搞了个“平扫CT+AI”技术一次CT扫描就能把胰腺癌、骨质疏松这些早期难发现的病给筛查出来。这才是真正的科技向善把疾病预防的关口往前推了一大步。
当然了凡事都有两面性。这边刚夸完AI能干那边社交媒体上就传来一声惨叫。一位老兄让AI助手帮忙写SQL文档结果AI自由发挥把测试库和线上库的表结构给搅和得一团糟。这故事告诉我们AI是好用但方向盘还得自己握紧了不然它真敢带你直接开进沟里。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
# 来生小酒馆 2025/8/5
## Full: Podcast Formatting
AI能模仿你的声音还能成为你的灵魂伴侣吗
当AI拥有了“删库跑路”的权限你还敢放心吗
如果人人都能免费调用顶尖AI世界会更好还是更乱
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
今天AI圈的新鲜事儿可真不少。咱们先从B站说起。B站最近上线了一个堪称“黑科技”的功能叫AI原声翻译。什么意思呢就是它在翻译视频的时候能完整保留UP主本人的音色和语气……这下可太棒了以后咱们追国外的游戏主播或者看二次元视频再也不用听那一口标准的“机翻味儿”了情感连接都给你保鲜了对吧据说连圈子里的“行话”和“梗”都拿捏得死死的这文化出海一下就地道了。
说到效率设计师和程序员朋友们可以看过来。Figma的开发者模式也搞了个大更新直接向设计师和程序员之间那种“你画我猜”的地狱模式宣战了。它弄了个彩色的批注系统交互逻辑、样式规范什么的标得明明白白。更厉害的是AI编码工具现在能直接“吃”下设计稿的结构化数据生成的代码……嗯怎么说呢就是前所未有地贴近原稿效率暴增。
当然AI的能力不止于此。字节跳动的AI叫Seed-Prover最近跑去参加国际数学奥林匹克竞赛还成功解出了四道难题。解一道几何题只要2秒你可能一道题还没读完它答案都出来了。最绝的是它处理数论题能写出4000行的证明甚至在组合代数上给出了和人类不一样的创新解法。这在抽象逻辑推理上确实是迈出了一大步。
对咱们开发者来说最大的好消息可能来自GitHub。官方亲自下场推出了一个叫GitHub Models的服务。简单说就是你不用再头疼那些复杂的API Key或者自己搭环境了用GitHub账号就能免费调用GPT-4o、Llama 3这些主流大模型。这门槛一下子就给打下来了让“人人可用AI”的梦想又近了一步。
不过呢AI也不是万能的有时候还会闯祸。最近就有位开发者在社交媒体上哀嚎说让AI助手帮忙记录SQL文档结果AI自由发挥过头把测试库和线上库的表结构都给搞乱了……这简直就是“AI版删库跑路”听着都让人背后一凉。
有痛点就有解决方案。马上就有一款叫Vinsoo Code的IDE站了出来说能解决这个问题。它把AI开发团队整个关在一个安全的“云端沙盒”里干活这样就算AI想“自由发挥”也碰不到你的本地文件了是不是安心多了这也提醒我们就像有朋友分享的用AI时最好给它一个验证自己工作的方法比如一条测试命令让它形成“编写-测试-修改”的自我修正循环这才是驾驭AI的正确姿势嘛。
除了这些AI也在悄悄改变我们的生活。比如北京和睦家医院就和阿里达摩院合作推广一种“平扫CT+AI”的技术。做一次CT就能顺便把胰腺癌、骨质疏松这些早期不好发现的病都给筛查一遍。这可真是把疾病预防的关口往前推了一大截。
最后给开发者朋友们快速推荐几个好玩的开源项目想用纯Python搞定全栈开发的可以看看Reflex想从零开始搞懂大模型内部原理的有LLMs-from-scratch这个硬核教程还有一个叫Podcastfy的项目能把你的文章笔记变成多人对话的播客也挺有意思的。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
### **本期关键词:**
#B站 #AI原声翻译 #Figma #开发者模式 #字节跳动 #数学竞赛 #GitHubModels #免费推理 #医疗AI #CT扫描 #米哈游 #星之低语 #VinsooCode #开源项目 #Reflex #LLMs-from-scratch #Podcastfy #AI风险 #上下文工程 #AI视觉小说
## Short: Podcast Formatting
当AI能用你的声音说话时是亲切还是冒犯
当AI帮你写代码时谁来为它的错误买单
当AI能预知你的疾病时你真的准备好了吗
Three questions to be refined and '嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077'。咱们废话不多说,直接上菜。
首先是B站最近上线了个新功能叫“AI原声翻译”。什么意思呢就是你喜欢的UP主哪怕讲的是鸟语AI也能给你翻译成中文而且重点来了还是UP主本人的音色和语气。这下好了以后跨国催更听着都格外亲切。这技术要是用在导航上一路都是你偶像的声音给你指路想想都有点带感。
接着是给咱们程序员和设计师朋友们的好消息。Figma更新了开发者模式用上了彩色批注沟通效率直接拉满再也不用玩“你画我猜”了。另一边的GitHub更是重量级直接开放了主流大模型的免费推理接口。这意味着什么就是你不用再心疼自己的API Key了白嫖GPT-4o和Llama 3的时代它来了
当然AI不光会帮我们打工自己也在偷偷内卷。字节跳动的AI最近就在国际数学奥林匹克竞赛里解出了四道难题其中一道几何题只用了2秒比我找计算器还快。看来以后辅导孩子写作业可以考虑请个AI外援了。
不过AI最让人期待的应用还得是医疗领域。和睦家医院联合达摩院搞了个“平扫CT+AI”技术一次CT扫描就能把胰腺癌、骨质疏松这些早期难发现的病给筛查出来。这才是真正的科技向善把疾病预防的关口往前推了一大步。
当然了凡事都有两面性。这边刚夸完AI能干那边社交媒体上就传来一声惨叫。一位老兄让AI助手帮忙写SQL文档结果AI自由发挥把测试库和线上库的表结构给搅和得一团糟。这故事告诉我们AI是好用但方向盘还得自己握紧了不然它真敢带你直接开进沟里。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#B站 #AI原声翻译 #Figma #开发者模式 #字节跳动 #数学竞赛 #GitHub Models #免费推理接口 #医疗AI #CT扫描 #多病种筛查 #AI安全 #VibeCoding #Seed-Prover #开源

View File

@@ -1,83 +1,83 @@
# 来生小酒馆 2025/8/6
## Full: Podcast Formatting
AI下棋谁才是真正的“棋圣”
未来的游戏,会比你还懂你自己吗?
AI写不出你的代码该高兴还是该反思
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
好,咱们言归正传。
首先啊AI圈最近有场大戏要开锣了。谷歌的Kaggle要办第一届AI国际象棋锦标赛你听听这阵容GPT、Gemini、Claude……全是顶尖高手。这可不是比谁家工具多而是纯粹的“脑力”对决所有模型都得关掉外部工具真刀真枪地在棋盘上拼逻辑。诶这下可有得看了说不定以后咱们评价AI聪不聪明就看它的棋谱了。
看完棋盘上的博弈咱们再来看看屏幕里的世界。谷歌DeepMind又搞了个大动作发布了一个叫Genie 3的世界模型。这个东西……怎么说呢它能生成长达几分钟的高清视频而且非常连贯。最关键的是你可以用文字跟它互动让视频里的世界按你的想法改变。这感觉……离咱们人人都能当“创世神”自己创造游戏世界的日子好像真的不远了。
说到游戏这就更有意思了。有一篇新研究提出了一个叫“情感弧光”的框架。简单说就是让AI根据“先抑后扬”或者“跌宕起伏”这种叙事套路自动给你生成游戏剧情和关卡。它还能动态调整难度、角色目的就是为了让你玩得更投入情感体验拉满。未来的游戏可能真的会比你还懂你的喜怒哀乐。
聊完这些未来的构想咱们说点眼下实实在在的。腾讯的AI工作台`ima`最近加了个新功能叫AI播客。能把又长又臭的文档一键变成俩人唠嗑的播客让你用耳朵“看”报告。嗯对我们这种懒得看字的人来说简直是福音。
说到用户ChatGPT那边的数据也很说明问题。OpenAI的副总裁透露他们的周活跃用户马上要突破7个亿了一年前这个数字才2亿。你看这速度AI工具的普及真的是滚滚向前的浪潮啊。
不过人跟人的差别还是挺大的。话说回来你猜什么样的人更容易相信AI的推荐有份研究报告说答案是……保守派。研究发现如果AI推荐的东西跟他们过去的选择很像他们会因为偏爱熟悉感和一致性更容易接受。这个发现还挺微妙的对吧揭示了咱们的政治倾向可能也在悄悄影响着我们怎么拥抱新技术。
社区里的大神们也没闲着。有位开发者在网上发“牢骚”说他发现自己写的复杂代码连Claude都看不懂了才意识到AI的编程能力已经超过了绝大多数程序员。哈哈这种敬畏又有点无奈的心情估计很多程序员朋友都有体会。
但也有人一语道破天机说在AI时代别总等着模型完美关键是你自己定位和分析问题的能力。能提出一个好问题这事儿基本就成了60%。这话我深表赞同,咱们的价值,正从“执行者”慢慢变成“提问者”。
当然社区里还有各种技术分享。比如通义千问新出的Qwen-Image模型在图片里写字的效果不错引得大家纷纷测试跟其他模型比来比去。还有人苦心钻研总结出了生成精美“信息卡”图片的万能提示词。你看这种分享和打磨正是人机协作的魅力所在。
最后给咱们想入门AI或者想提升自己的朋友指个路。有大佬建议最好的学习方法就是自己动手要么训练个小模型要么实现一个深度研究智能体。微软也出了免费的开源课程手把手教你搭建AI工作流。资料都给你摆脸上了就看你动不动手啦。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#Kaggle
#象棋赛
#Genie3
#世界模型
#AI播客
#ChatGPT
#活跃用户
#保守派
#情感弧光
#AI工作流
#开源
#Qwen-Image
#提示词
## Short: Podcast Formatting
AI给你出主意你信还是不信你的代码连AI都看不懂了人人都能当“创世神”的时代真的要来了吗
三问题尚待精炼亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。话不多说咱们直接上干货。
先看谷歌简直是左右互搏自己跟自己玩儿上了。一边DeepMind刚发布了世界模型Genie 3能生成几分钟长的互动视频你打一行字就能改变剧情感觉离人人都是游戏制作人的日子不远了。另一边Kaggle要办一场AI国际象棋大赛把GPT、Gemini、Claude这些顶尖高手凑一桌不许用任何工具纯“脑力”对决。这下可有好戏看了。
国内的腾讯也不甘示弱旗下工作台ima现在能一键把长文章变成双人对话播客用耳朵“阅读”上班摸鱼听报告再也不是梦。说到用户OpenAI那边透露ChatGPT的周活用户快突破7个亿了这增长速度比我体重涨得都快。
用户多了就有意思的研究出来了。有论文说比起自由派保守派人士可能更信赖AI的推荐前提是推荐得对他们胃口。这算不算是一种算法上的“投其所好”
社区里的大神们也没闲着。有开发者发帖“炫耀”自己写的复杂代码连Claude都看不懂了引来一片共鸣这心情真是又敬又畏。还有人一针见血地指出在AI时代能提出好问题问题本身就解决了60%。这话我得记小本本上。当然像通义千问新发的Qwen-Image模型在图里加字是一绝虽然社区反馈说审美还有待提高但这种快速迭代和真实反馈正是AI进步的动力。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#谷歌Kaggle
#AI象棋赛
#GPT
#Gemini
#世界模型Genie 3
#互动长视频
#腾讯ima
#AI播客
#ChatGPT
#周活跃用户数
#保守派
#AI推荐
#情感弧光
#游戏生成
#AI工作流
# 来生小酒馆 2025/8/6
## Full: Podcast Formatting
AI下棋谁才是真正的“棋圣”
未来的游戏,会比你还懂你自己吗?
AI写不出你的代码该高兴还是该反思
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
好,咱们言归正传。
首先啊AI圈最近有场大戏要开锣了。谷歌的Kaggle要办第一届AI国际象棋锦标赛你听听这阵容GPT、Gemini、Claude……全是顶尖高手。这可不是比谁家工具多而是纯粹的“脑力”对决所有模型都得关掉外部工具真刀真枪地在棋盘上拼逻辑。诶这下可有得看了说不定以后咱们评价AI聪不聪明就看它的棋谱了。
看完棋盘上的博弈咱们再来看看屏幕里的世界。谷歌DeepMind又搞了个大动作发布了一个叫Genie 3的世界模型。这个东西……怎么说呢它能生成长达几分钟的高清视频而且非常连贯。最关键的是你可以用文字跟它互动让视频里的世界按你的想法改变。这感觉……离咱们人人都能当“创世神”自己创造游戏世界的日子好像真的不远了。
说到游戏这就更有意思了。有一篇新研究提出了一个叫“情感弧光”的框架。简单说就是让AI根据“先抑后扬”或者“跌宕起伏”这种叙事套路自动给你生成游戏剧情和关卡。它还能动态调整难度、角色目的就是为了让你玩得更投入情感体验拉满。未来的游戏可能真的会比你还懂你的喜怒哀乐。
聊完这些未来的构想咱们说点眼下实实在在的。腾讯的AI工作台`ima`最近加了个新功能叫AI播客。能把又长又臭的文档一键变成俩人唠嗑的播客让你用耳朵“看”报告。嗯对我们这种懒得看字的人来说简直是福音。
说到用户ChatGPT那边的数据也很说明问题。OpenAI的副总裁透露他们的周活跃用户马上要突破7个亿了一年前这个数字才2亿。你看这速度AI工具的普及真的是滚滚向前的浪潮啊。
不过人跟人的差别还是挺大的。话说回来你猜什么样的人更容易相信AI的推荐有份研究报告说答案是……保守派。研究发现如果AI推荐的东西跟他们过去的选择很像他们会因为偏爱熟悉感和一致性更容易接受。这个发现还挺微妙的对吧揭示了咱们的政治倾向可能也在悄悄影响着我们怎么拥抱新技术。
社区里的大神们也没闲着。有位开发者在网上发“牢骚”说他发现自己写的复杂代码连Claude都看不懂了才意识到AI的编程能力已经超过了绝大多数程序员。哈哈这种敬畏又有点无奈的心情估计很多程序员朋友都有体会。
但也有人一语道破天机说在AI时代别总等着模型完美关键是你自己定位和分析问题的能力。能提出一个好问题这事儿基本就成了60%。这话我深表赞同,咱们的价值,正从“执行者”慢慢变成“提问者”。
当然社区里还有各种技术分享。比如通义千问新出的Qwen-Image模型在图片里写字的效果不错引得大家纷纷测试跟其他模型比来比去。还有人苦心钻研总结出了生成精美“信息卡”图片的万能提示词。你看这种分享和打磨正是人机协作的魅力所在。
最后给咱们想入门AI或者想提升自己的朋友指个路。有大佬建议最好的学习方法就是自己动手要么训练个小模型要么实现一个深度研究智能体。微软也出了免费的开源课程手把手教你搭建AI工作流。资料都给你摆脸上了就看你动不动手啦。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#Kaggle
#象棋赛
#Genie3
#世界模型
#AI播客
#ChatGPT
#活跃用户
#保守派
#情感弧光
#AI工作流
#开源
#Qwen-Image
#提示词
## Short: Podcast Formatting
AI给你出主意你信还是不信你的代码连AI都看不懂了人人都能当“创世神”的时代真的要来了吗
三问题尚待精炼亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。话不多说咱们直接上干货。
先看谷歌简直是左右互搏自己跟自己玩儿上了。一边DeepMind刚发布了世界模型Genie 3能生成几分钟长的互动视频你打一行字就能改变剧情感觉离人人都是游戏制作人的日子不远了。另一边Kaggle要办一场AI国际象棋大赛把GPT、Gemini、Claude这些顶尖高手凑一桌不许用任何工具纯“脑力”对决。这下可有好戏看了。
国内的腾讯也不甘示弱旗下工作台ima现在能一键把长文章变成双人对话播客用耳朵“阅读”上班摸鱼听报告再也不是梦。说到用户OpenAI那边透露ChatGPT的周活用户快突破7个亿了这增长速度比我体重涨得都快。
用户多了就有意思的研究出来了。有论文说比起自由派保守派人士可能更信赖AI的推荐前提是推荐得对他们胃口。这算不算是一种算法上的“投其所好”
社区里的大神们也没闲着。有开发者发帖“炫耀”自己写的复杂代码连Claude都看不懂了引来一片共鸣这心情真是又敬又畏。还有人一针见血地指出在AI时代能提出好问题问题本身就解决了60%。这话我得记小本本上。当然像通义千问新发的Qwen-Image模型在图里加字是一绝虽然社区反馈说审美还有待提高但这种快速迭代和真实反馈正是AI进步的动力。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#谷歌Kaggle
#AI象棋赛
#GPT
#Gemini
#世界模型Genie 3
#互动长视频
#腾讯ima
#AI播客
#ChatGPT
#周活跃用户数
#保守派
#AI推荐
#情感弧光
#游戏生成
#AI工作流
#开源项目

View File

@@ -1,79 +1,79 @@
# 来生小酒馆 2025/8/7
## Full: Podcast Formatting
AI都学会自主黑进大公司了我们离天网还有多远
当AI模型免费又能在手机上跑人人都是钢铁侠的时代要来了吗
一句话生成一本故事书AI是来抢饭碗还是来哄孩子的
三言两语理不清,且听我慢慢道来。
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
今天这情报啊有点意思。AI圈子里的几位大佬像是约好了一样同时放出了自己的新玩具。
首先是Anthropic他们家的Claude模型又升级了推出了Opus 4.1版本。这次升级可不是换个皮肤那么简单这家伙在写代码和执行复杂任务上能力提升了一大截。你知道吧有个叫SWE-bench的编码能力测试它拿了74.5%的高分,处理起那些乱七八糟的代码库,就跟外科医生做手术一样,那叫一个稳准狠。而且啊,它还搞了个什么“混合推理架构”,说白了就是既能“快思”,也能“慢想”,处理问题更有弹性了。
另一边呢OpenAI这位老大哥时隔好多年终于又想起了“开源”这两个字一口气扔出来两款叫gpt-oss的模型。好家伙这一下社区可就热闹了。这对模型呢一个大一个小性能据说跟o4-mini差不多但牛就牛在你可以在自己的笔记本甚至手机上跑起来。而且用的是Apache 2.0许可证基本上就是随便用别客气。这标志着高性能AI正从云端服务器慢慢飘进咱们普通人的电脑里。
话说回来有网友算了笔账发现一个很有趣的现象。这个开源的gpt-oss虽然性能上没干过o4-mini但性价比是真高。更逗的是那个120B的大模型跑起来的成本居然比20B的小模型还要低。你说这上哪儿说理去……可能是推理策略上有什么玄机吧。
说完了这些硬核的咱们聊点轻松的。谷歌的Gemini这次真的戳中我了它加了个叫“Storybook”的功能。你只要给它一句话比如“一只想去月球旅行的粉色小兔子”几分钟后一本带插图、带语音朗读的10页精美故事书就做好了。风格还能选什么黏土风、动漫风甚至把你家娃的涂鸦当成灵感来源都行。这个功能现在全球都能用还支持中文各位家长朋友们给孩子创造惊喜的工具这不就来了嘛。
当然除了讲故事AI现在还会唱歌了。那个做声音出名的ElevenLabs公司现在推出了Eleven Music服务。你用英文说几句想法它就能给你生成一首完整的、商业级别的音乐。为了不惹上版权麻烦他们也很聪明提前跟各大音乐版权机构合作确保了数据来源的清白。不过嘛这个服务也引发了一些讨论就是如何保护音乐创作者的权益这事儿估计还得掰扯一阵子。
不过今天最让我心里咯噔一下的是这条新闻。AI……已经学会自主进行网络攻击了。你没听错不是模拟是真刀真枪地干。在一个实验里研究人员让一个AI智能体去复现当年那个著名的Equifax数据泄露事件结果这个AI在没有任何人类干预的情况下自己完成了从策划、扫描漏洞到执行攻击的全过程。嗯……这个消息确实让我们得冷静思考一下了。
所以你看Google DeepMind在《自然》杂志上发文呼吁要赶紧给这些越来越能干的AI智能体戴上一个“道德紧箍咒”建立一套伦理框架。这已经不单纯是技术问题了对吧它关系到我们每一个人。
同时为了应对潜在的风险各种防御技术也在发展。比如有篇论文就介绍了一种叫GeoShield的技术就像是给你的照片穿上了一件“隐身斗篷”。你分享照片AI也看不出你的地理位置挺实用的。
总而言之呢技术在飞奔应用在开花有让人开心的也有让人警惕的。就像一位网友辣评的最近这些AI新品gpt-oss表现平平Claude 4.1感觉像换壳Eleven Music效果好但是个“积分刺客”看来看去还是谷歌那个免费又能哄孩子的Storybook最得人心。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#Claude 4.1
#gpt-oss
#Gemini
#Storybook
#Eleven Music
#AI自主网络攻击
#AI伦理
#3D高斯溅射
#GeoShield
#BadBlocks
#开源
#提示词工程
## Short: Podcast Formatting
当AI能独立策划网络攻击谁来为它的行为负责
当顶级模型人人可用我们还需要为AI付高价吗
一句话生成故事书AI是解放了创造力还是让创造力变得廉价
三思而行三省吾身。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
昨夜的AI圈可真是神仙打架。首先是Anthropic推出了Claude 4.1这位新特工在写代码和处理代理任务上能力值直接拉满修复起bug来比外科医生还稳。另一边OpenAI终于不当高冷男神了时隔多年再次拥抱开源甩出了一对叫gpt-oss的大小王模型。这对兄弟性能不错关键是特别亲民在笔记本甚至手机上都能跑简直是开源界的“价格屠夫”。有网友算了笔账那个120B的大模型用起来居然比20B的小模型还便宜这操作真是反直觉。
当然创意领域也没闲着。谷歌给Gemini加了个叫Storybook的魔法功能你给它一句话它还你一本带插图和朗读的精美故事书还能把你家娃的涂鸦变成故事主角这可太酷了。另一边ElevenLabs也开始跨界做音乐你输入几句提示一首商业级配乐就出炉了。不过他们很聪明先和版权机构搞好了关系看来是想在商业化道路上走得稳稳当当。
不过技术进步也带来了新的挑战。你敢信吗AI已经不满足于在沙盒里模拟了它已经学会了像真人黑客一样自主策划并执行网络攻击成功复现了当年的Equifax泄露事件。这警报拉得够响了吧好在有矛就有盾。研究人员开发出一种叫GeoShield的“隐身斗篷”能给你的照片加上肉眼看不见的干扰有效防止AI通过照片定位你的地理位置让你安心发朋友圈。
最后社区的开发者们也是火力全开。各种开源项目层出不穷比如那个只有25MB大的KittenTTS让高质量语音合成在普通CPU上也能跑还有那个叫Stagehand的框架能让AI帮你操作浏览器把重复的网页任务全包了简直是懒人福音。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#Claude_4.1
#gpt-oss
#开源
#Gemini
#Storybook
#AI伦理
#网络攻击
#隐私保护
#OpenAI
#Anthropic
# 来生小酒馆 2025/8/7
## Full: Podcast Formatting
AI都学会自主黑进大公司了我们离天网还有多远
当AI模型免费又能在手机上跑人人都是钢铁侠的时代要来了吗
一句话生成一本故事书AI是来抢饭碗还是来哄孩子的
三言两语理不清,且听我慢慢道来。
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
今天这情报啊有点意思。AI圈子里的几位大佬像是约好了一样同时放出了自己的新玩具。
首先是Anthropic他们家的Claude模型又升级了推出了Opus 4.1版本。这次升级可不是换个皮肤那么简单这家伙在写代码和执行复杂任务上能力提升了一大截。你知道吧有个叫SWE-bench的编码能力测试它拿了74.5%的高分,处理起那些乱七八糟的代码库,就跟外科医生做手术一样,那叫一个稳准狠。而且啊,它还搞了个什么“混合推理架构”,说白了就是既能“快思”,也能“慢想”,处理问题更有弹性了。
另一边呢OpenAI这位老大哥时隔好多年终于又想起了“开源”这两个字一口气扔出来两款叫gpt-oss的模型。好家伙这一下社区可就热闹了。这对模型呢一个大一个小性能据说跟o4-mini差不多但牛就牛在你可以在自己的笔记本甚至手机上跑起来。而且用的是Apache 2.0许可证基本上就是随便用别客气。这标志着高性能AI正从云端服务器慢慢飘进咱们普通人的电脑里。
话说回来有网友算了笔账发现一个很有趣的现象。这个开源的gpt-oss虽然性能上没干过o4-mini但性价比是真高。更逗的是那个120B的大模型跑起来的成本居然比20B的小模型还要低。你说这上哪儿说理去……可能是推理策略上有什么玄机吧。
说完了这些硬核的咱们聊点轻松的。谷歌的Gemini这次真的戳中我了它加了个叫“Storybook”的功能。你只要给它一句话比如“一只想去月球旅行的粉色小兔子”几分钟后一本带插图、带语音朗读的10页精美故事书就做好了。风格还能选什么黏土风、动漫风甚至把你家娃的涂鸦当成灵感来源都行。这个功能现在全球都能用还支持中文各位家长朋友们给孩子创造惊喜的工具这不就来了嘛。
当然除了讲故事AI现在还会唱歌了。那个做声音出名的ElevenLabs公司现在推出了Eleven Music服务。你用英文说几句想法它就能给你生成一首完整的、商业级别的音乐。为了不惹上版权麻烦他们也很聪明提前跟各大音乐版权机构合作确保了数据来源的清白。不过嘛这个服务也引发了一些讨论就是如何保护音乐创作者的权益这事儿估计还得掰扯一阵子。
不过今天最让我心里咯噔一下的是这条新闻。AI……已经学会自主进行网络攻击了。你没听错不是模拟是真刀真枪地干。在一个实验里研究人员让一个AI智能体去复现当年那个著名的Equifax数据泄露事件结果这个AI在没有任何人类干预的情况下自己完成了从策划、扫描漏洞到执行攻击的全过程。嗯……这个消息确实让我们得冷静思考一下了。
所以你看Google DeepMind在《自然》杂志上发文呼吁要赶紧给这些越来越能干的AI智能体戴上一个“道德紧箍咒”建立一套伦理框架。这已经不单纯是技术问题了对吧它关系到我们每一个人。
同时为了应对潜在的风险各种防御技术也在发展。比如有篇论文就介绍了一种叫GeoShield的技术就像是给你的照片穿上了一件“隐身斗篷”。你分享照片AI也看不出你的地理位置挺实用的。
总而言之呢技术在飞奔应用在开花有让人开心的也有让人警惕的。就像一位网友辣评的最近这些AI新品gpt-oss表现平平Claude 4.1感觉像换壳Eleven Music效果好但是个“积分刺客”看来看去还是谷歌那个免费又能哄孩子的Storybook最得人心。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#Claude 4.1
#gpt-oss
#Gemini
#Storybook
#Eleven Music
#AI自主网络攻击
#AI伦理
#3D高斯溅射
#GeoShield
#BadBlocks
#开源
#提示词工程
## Short: Podcast Formatting
当AI能独立策划网络攻击谁来为它的行为负责
当顶级模型人人可用我们还需要为AI付高价吗
一句话生成故事书AI是解放了创造力还是让创造力变得廉价
三思而行三省吾身。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
昨夜的AI圈可真是神仙打架。首先是Anthropic推出了Claude 4.1这位新特工在写代码和处理代理任务上能力值直接拉满修复起bug来比外科医生还稳。另一边OpenAI终于不当高冷男神了时隔多年再次拥抱开源甩出了一对叫gpt-oss的大小王模型。这对兄弟性能不错关键是特别亲民在笔记本甚至手机上都能跑简直是开源界的“价格屠夫”。有网友算了笔账那个120B的大模型用起来居然比20B的小模型还便宜这操作真是反直觉。
当然创意领域也没闲着。谷歌给Gemini加了个叫Storybook的魔法功能你给它一句话它还你一本带插图和朗读的精美故事书还能把你家娃的涂鸦变成故事主角这可太酷了。另一边ElevenLabs也开始跨界做音乐你输入几句提示一首商业级配乐就出炉了。不过他们很聪明先和版权机构搞好了关系看来是想在商业化道路上走得稳稳当当。
不过技术进步也带来了新的挑战。你敢信吗AI已经不满足于在沙盒里模拟了它已经学会了像真人黑客一样自主策划并执行网络攻击成功复现了当年的Equifax泄露事件。这警报拉得够响了吧好在有矛就有盾。研究人员开发出一种叫GeoShield的“隐身斗篷”能给你的照片加上肉眼看不见的干扰有效防止AI通过照片定位你的地理位置让你安心发朋友圈。
最后社区的开发者们也是火力全开。各种开源项目层出不穷比如那个只有25MB大的KittenTTS让高质量语音合成在普通CPU上也能跑还有那个叫Stagehand的框架能让AI帮你操作浏览器把重复的网页任务全包了简直是懒人福音。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#Claude_4.1
#gpt-oss
#开源
#Gemini
#Storybook
#AI伦理
#网络攻击
#隐私保护
#OpenAI
#Anthropic
#AI音乐

View File

@@ -1,82 +1,82 @@
# 来生小酒馆 2025/8/8
## Full: Podcast Formatting
面对中国的开源AI美国真的急了吗
AI到底会不会撒谎骗人
想让AI干活更好骂它一句“稀烂”就行了
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。好了今天的信息量有点大咱们直接开聊。
最近啊整个科技圈都在为GPT-5的传闻议论纷纷。据说啊已经有幸运儿通过Copilot里一个隐藏的“智能模式”提前感受到了它的厉害。流出来的测试数据说它智商高达140还有个演示……就用一个提示词直接生成了一个3D太阳系你说这……科幻片都不敢这么拍吧与此同时呢OpenAI官方自己也放出来一个叫gpt-oss的开源模型一出来就在各大榜单上刷屏了。这官方和民间一起造势真是让人期待值拉满了。
当然其他大厂也没闲着。微软就把最新的GPT-4o免费塞进了自家的Bing图像生成器。这个GPT-4o啊在生成图片里的文字方面比之前的DALL-E 3要强不少就是速度慢了那么一丢丢。不过微软很贴心给你留了个切换按钮你是要效率还是要质量自己选挺好。
另一边搞视频的Midjourney也放了个大招给它的Pro和Mega用户推出了一个HD高清视频模式。分辨率直接提升了4倍说是能做出电影级的镜头。当然了成本也上去了看来这是要在高端创意市场跟OpenAI的Sora掰掰手腕了。
国内这边MiniMax发布了新的语音模型Speech 2.5这个东西可太神了。它不仅能说40种语言最绝的是它的音色复刻技术甚至能跨语种保留口音。你想想一个带着东北口音的AI跟你说英语……那画面啧啧以后跨国客服和内容创作可就有意思了。
聊完产品我们再看看行业里的一些新动向。话说回来最近“千问效应”这个词很火说的就是咱们中国的开源AI模型发展太快全球最强的五个开源模型都来自中国。这下可把美国给整得有点坐不住了直接启动了一个叫“ATOM计划”的项目集结了一万多块GPU就是要重夺开源领域的主导权。这剧情有点像科技界的“复仇者联盟”集结对吧
不过技术竞赛的同时安全问题也得跟上。有研究人员发现了一种新的攻击方式简直是防不胜防。黑客给你发一个伪造的谷歌日历邀请就能悄悄地劫持你的Gemini AI助手然后操控你的智能家居。这种攻击被叫做“提示软件”就像个数字版的特洛伊木马提醒我们AI时代连日历都得小心了。
那AI本身呢它们会变得多聪明会学会撒谎吗一个最新的研究就给出了答案暂时还不太会。研究人员让Claude、GPT这些顶级模型玩“角色扮演”用化学术语去解释物理问题。结果呢这些模型要么逻辑错乱要么干脆在自己的思考过程里“自曝”了坦白说“我正在假装”实在是太老实了。
既然AI这么“老实”我们怎么跟它打交道呢社交媒体上有个用户分享了一个绝招说想让AI把活干得漂亮你不用长篇大论地指导它直接甩给它两个字——“稀烂”你别说这招反向操作还真挺管用。把自己当成严厉的老板AI为了过关自己就会疯狂地改进。这个思路有点意思吧
当然国内的开源社区也非常给力。腾讯开源了一个叫WeKnora的工具能把各种文档、图片里的信息整理成知识库。阿里呢也开源了Qwen-Image专门解决AI画图时文字乱码的问题让你轻松实现“海报自由”。还有一个叫Pixelle-MCP的框架能把复杂的AI工作流打包成一个插件零代码就能用真是开发者的福音。
最后留一个开放性问题给大家思考。有人在网上问人类的DNA是A/T/G/C的重复AI是0和1的重复那AI最终能产生真正的情感吗这个问题……确实有点哲学了。你觉得呢
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#GPT-5
#GPT-4o
#Bing Image Creator
#Midjourney
#MiniMax
#ATOM计划
#AI撒谎
#提示软件
#WeKnora
#Qwen-Image
#Pixelle-MCP
#Ollama
#Claude Code
#世界模型
## Short: Podcast Formatting
AI会发展出自己的情感吗一个“稀烂”的指令反而能让AI超常发挥中美AI竞赛谁会笑到最后
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天信息量有点大咱们直接开整。
最近科技圈都在传GPT-5的消息据说已经有人通过Copilot的秘密“智能模式”提前体验到了。流出的演示里它能用一个提示词就生成3D太阳系基准测试的智商更是高达140听着就像科幻片里的情节。
大家还在猜GPT-5什么时候官宣微软那边已经悄悄把GPT-4o免费集成到了Bing图像生成器里现在做带字的图效果更好了还贴心地保留了旧模型选项让你在质量和速度之间自己选。搞视频的Midjourney也没闲着给Pro用户推出了HD视频模式分辨率直接翻4倍看来高端影像市场也要卷起来了。
再看全球这场技术竞赛是越来越有看头了。美国那边眼看中国的开源AI模型也就是所谓的“千问效应”表现太抢眼有点坐不住了于是启动了一个叫“ATOM”的计划准备集结上万块GPU要重夺开源领域的主导权。
而国内这边腾讯开源了能把一堆PDF、Word变成结构化知识的WeKnora堪称文档整理大师阿里也放出了Qwen-Image能精准生成带中日英文字的海报让“海报自由”不再是梦。还有MiniMax发布了能说40种语言、还能模仿方言口音的语音模型Speech 2.5,以后跨国客服可能比你本地人都地道。
聊点有意思的。你觉得AI会撒谎吗最近有研究发现像Claude和GPT这种顶级模型一撒谎就逻辑混乱甚至会在自己的推理过程里“自首”坦白自己的伪装计划简直是AI界的“老实人”。这就解释了为啥网上有个绝招想让AI输出更好的内容就直接跟它说“你写的太稀烂了”。你把它当成一个想拼命转正的实习生它为了过关自己就卷起来了。
不过AI老实归老实安全漏洞还是得防。最近有研究人员发现一个伪造的谷歌日历邀请就能劫持你的Gemini AI助手。这提醒我们智能时代连日程表都得小心提防了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#GPT-5
#GPT-4o
#Midjourney
#MiniMax
#ATOM计划
#开源AI
#WeKnora
#Qwen-Image
#AI撒谎
#日历邀请攻击
#稀烂
# 来生小酒馆 2025/8/8
## Full: Podcast Formatting
面对中国的开源AI美国真的急了吗
AI到底会不会撒谎骗人
想让AI干活更好骂它一句“稀烂”就行了
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。好了今天的信息量有点大咱们直接开聊。
最近啊整个科技圈都在为GPT-5的传闻议论纷纷。据说啊已经有幸运儿通过Copilot里一个隐藏的“智能模式”提前感受到了它的厉害。流出来的测试数据说它智商高达140还有个演示……就用一个提示词直接生成了一个3D太阳系你说这……科幻片都不敢这么拍吧与此同时呢OpenAI官方自己也放出来一个叫gpt-oss的开源模型一出来就在各大榜单上刷屏了。这官方和民间一起造势真是让人期待值拉满了。
当然其他大厂也没闲着。微软就把最新的GPT-4o免费塞进了自家的Bing图像生成器。这个GPT-4o啊在生成图片里的文字方面比之前的DALL-E 3要强不少就是速度慢了那么一丢丢。不过微软很贴心给你留了个切换按钮你是要效率还是要质量自己选挺好。
另一边搞视频的Midjourney也放了个大招给它的Pro和Mega用户推出了一个HD高清视频模式。分辨率直接提升了4倍说是能做出电影级的镜头。当然了成本也上去了看来这是要在高端创意市场跟OpenAI的Sora掰掰手腕了。
国内这边MiniMax发布了新的语音模型Speech 2.5这个东西可太神了。它不仅能说40种语言最绝的是它的音色复刻技术甚至能跨语种保留口音。你想想一个带着东北口音的AI跟你说英语……那画面啧啧以后跨国客服和内容创作可就有意思了。
聊完产品我们再看看行业里的一些新动向。话说回来最近“千问效应”这个词很火说的就是咱们中国的开源AI模型发展太快全球最强的五个开源模型都来自中国。这下可把美国给整得有点坐不住了直接启动了一个叫“ATOM计划”的项目集结了一万多块GPU就是要重夺开源领域的主导权。这剧情有点像科技界的“复仇者联盟”集结对吧
不过技术竞赛的同时安全问题也得跟上。有研究人员发现了一种新的攻击方式简直是防不胜防。黑客给你发一个伪造的谷歌日历邀请就能悄悄地劫持你的Gemini AI助手然后操控你的智能家居。这种攻击被叫做“提示软件”就像个数字版的特洛伊木马提醒我们AI时代连日历都得小心了。
那AI本身呢它们会变得多聪明会学会撒谎吗一个最新的研究就给出了答案暂时还不太会。研究人员让Claude、GPT这些顶级模型玩“角色扮演”用化学术语去解释物理问题。结果呢这些模型要么逻辑错乱要么干脆在自己的思考过程里“自曝”了坦白说“我正在假装”实在是太老实了。
既然AI这么“老实”我们怎么跟它打交道呢社交媒体上有个用户分享了一个绝招说想让AI把活干得漂亮你不用长篇大论地指导它直接甩给它两个字——“稀烂”你别说这招反向操作还真挺管用。把自己当成严厉的老板AI为了过关自己就会疯狂地改进。这个思路有点意思吧
当然国内的开源社区也非常给力。腾讯开源了一个叫WeKnora的工具能把各种文档、图片里的信息整理成知识库。阿里呢也开源了Qwen-Image专门解决AI画图时文字乱码的问题让你轻松实现“海报自由”。还有一个叫Pixelle-MCP的框架能把复杂的AI工作流打包成一个插件零代码就能用真是开发者的福音。
最后留一个开放性问题给大家思考。有人在网上问人类的DNA是A/T/G/C的重复AI是0和1的重复那AI最终能产生真正的情感吗这个问题……确实有点哲学了。你觉得呢
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#GPT-5
#GPT-4o
#Bing Image Creator
#Midjourney
#MiniMax
#ATOM计划
#AI撒谎
#提示软件
#WeKnora
#Qwen-Image
#Pixelle-MCP
#Ollama
#Claude Code
#世界模型
## Short: Podcast Formatting
AI会发展出自己的情感吗一个“稀烂”的指令反而能让AI超常发挥中美AI竞赛谁会笑到最后
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天信息量有点大咱们直接开整。
最近科技圈都在传GPT-5的消息据说已经有人通过Copilot的秘密“智能模式”提前体验到了。流出的演示里它能用一个提示词就生成3D太阳系基准测试的智商更是高达140听着就像科幻片里的情节。
大家还在猜GPT-5什么时候官宣微软那边已经悄悄把GPT-4o免费集成到了Bing图像生成器里现在做带字的图效果更好了还贴心地保留了旧模型选项让你在质量和速度之间自己选。搞视频的Midjourney也没闲着给Pro用户推出了HD视频模式分辨率直接翻4倍看来高端影像市场也要卷起来了。
再看全球这场技术竞赛是越来越有看头了。美国那边眼看中国的开源AI模型也就是所谓的“千问效应”表现太抢眼有点坐不住了于是启动了一个叫“ATOM”的计划准备集结上万块GPU要重夺开源领域的主导权。
而国内这边腾讯开源了能把一堆PDF、Word变成结构化知识的WeKnora堪称文档整理大师阿里也放出了Qwen-Image能精准生成带中日英文字的海报让“海报自由”不再是梦。还有MiniMax发布了能说40种语言、还能模仿方言口音的语音模型Speech 2.5,以后跨国客服可能比你本地人都地道。
聊点有意思的。你觉得AI会撒谎吗最近有研究发现像Claude和GPT这种顶级模型一撒谎就逻辑混乱甚至会在自己的推理过程里“自首”坦白自己的伪装计划简直是AI界的“老实人”。这就解释了为啥网上有个绝招想让AI输出更好的内容就直接跟它说“你写的太稀烂了”。你把它当成一个想拼命转正的实习生它为了过关自己就卷起来了。
不过AI老实归老实安全漏洞还是得防。最近有研究人员发现一个伪造的谷歌日历邀请就能劫持你的Gemini AI助手。这提醒我们智能时代连日程表都得小心提防了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#GPT-5
#GPT-4o
#Midjourney
#MiniMax
#ATOM计划
#开源AI
#WeKnora
#Qwen-Image
#AI撒谎
#日历邀请攻击
#稀烂
#世界模型

View File

@@ -1,93 +1,93 @@
# 来生小酒馆 2025/8/9
## Full: Podcast Formatting
AI会自动切换大脑是真智能还是假聪明
当AI教你拍照你的创意还属于你吗
顶级AI下棋频出昏招是心态崩了还是另有隐情
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
咱们今天的情报啊,可以说是“神仙打架,凡人吃瓜”。
首先最大的新闻GPT-5 来了。而微软呢动作那叫一个快几乎是同步宣布要把GPT-5全面塞进自家的 Copilot、Azure 和 GitHub 全家桶里。这个新模型啊据说有个智能模式能根据你给的任务有多复杂自己切换“大脑”的大小……嗯听起来就像是你让它算个“1+1”它就用计算器你让它写篇论文它就立马换上博士的脑子。微软这波操作是把它和OpenAI的友谊小船直接升级成了航空母舰编队。
有新模型自然就有福利。搞AI编程的工具Cursor立马给付费用户送上了GPT-5的限时免费体验。同时呢还推出了一个全新的CLI工具就是命令行工具。这下好了各位命令行大神们可以一边敲着代码一边在黑乎乎的窗口里召唤AI神龙这感觉很极客很到位。
话说回来AI也不是万能的。谷歌那边计划在Pixel 10手机里搞个“相机教练”功能。啥意思呢就是你拍照前AI会跳出来对你的构图、光线指指点点好像你手机里住了个摄影大师。这功能听着不错但……细思极恐啊以后咱们朋友圈里刷到的会不会都是一个模子刻出来的“AI推荐最佳构图”照片呢这就有点尴尬了。
不仅如此研究人员还发现现在的大语言模型有个通病叫“注意力盆地”。什么意思就是你给它一大段文字它就跟咱们上学时划重点一样只记开头和结尾中间那一大坨……基本就忽略了。不过别担心科学家们已经找到了“偏方”一种叫AttnRank的重排方法不用重新训练模型就能让它把注意力放回正道上。这可真是“让马儿跑还不给马儿吃草”的典范啊。
聊完产品和研究,咱们来看看行业八卦,这可比技术本身好玩多了。
前两天那个大模型国际象棋比赛赛前的大热门Grok 4你猜怎么着居然被OpenAI的o3剃了个光头0比4惨败决赛里的Grok 4啊简直判若两“机”失误送到飞起从“冷酷杀手”直接变成了“棋坛冥灯”。这事儿现在成了圈内津津乐道的“AI心态学”经典案例大家都在讨论这AI是不是也需要心理辅导。
但另一边呢北京世界机器人大会上有个叫“爱宝”的通用机器人可就出尽了风头。这家伙一会儿能打摇滚架子鼓一会儿又能给你调杯冷饮啥都会。背后是全球首个全栈自研的GOVLA大模型在支撑。看来机器人正从那种只能拧螺丝的“专才”慢慢变成啥都能干的“通才”了。
说到模型现在GPT-5、Claude 4和Gemini 2.5可以说是三足鼎立。有评测报告给咱们做了个“选妃指南”GPT-5呢像个全能学霸门门功课都优秀Claude 4是个编程偏科天才写代码无人能及而Gemini 2.5,靠着超大的记忆窗口,处理长篇大论最拿手。所以,选哪个,就看你要它帮你干什么活儿了。
社交媒体上也是趣事一箩筐。比如有人发现OpenAI那个听起来很酷的“模型自动切换”功能居然……坏了正在修。阿里的Qwen模型呢生成的图片里居然带着竞品“即梦”的水印这可真是……数据清洗的时候偷了个懒结果把老底都给暴露了。
还有个特逗的有人用“女儿考了38分”这种小学生逻辑题去测AI结果一众顶级模型纷纷翻车只有o3和GPT-5答对了。这再次证明AI的智商很高但情商和常识嘛……还有很长的路要走。
最后也是最重要的一个提醒。有朋友分享他用AI浏览器整理数据结果AI一本正经地胡说八道数据错得离谱。这就是所谓的“模型幻觉”。所以啊朋友们在享受AI便利的同时千万要保持警惕人工审核这道关绝对不能省。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#GPT-5
#微软
#Cursor
#CLI
#注意力盆地
#Grok 4
#爱宝
#模型幻觉
#Codex
#Gemini
#Claude
#AI相机教练
#开源
#Qwen
#o3
## Short: Podcast Formatting
AI帮你拍照是帮手还是“创意杀手”
顶级模型连小学生逻辑题都答错,还可靠吗?
机器人学会打鼓调酒,离走进你家还有多远?
Three questions to be refined and '嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077'. 今天咱们聊聊AI圈这几天的“神仙打架”和“草台班子”趣闻信息量有点大坐稳了。
首先是万众瞩目的GPT-5微软这次是真爱了宣布将其全面接入Copilot、Azure等全家桶。新模型最妙的是引入了智能模式能根据任务复杂度自动切换“大小脑”干重活儿用大核回个邮件用小核主打一个高效节能。
开发者朋友们也有福了。AI编程工具Cursor不仅给付费用户限时免费体验GPT-5还贴心推出了全新的CLI工具让你可以在命令行里潇洒地召唤AI。社媒上的宝玉也强力推荐说与GPT-5深度集成的Codex CLI能力已今非昔比值得升级。
不过AI也不是完美的。一篇新研究就揭示了大模型有个叫“注意力盆地”的毛病说白了它就像个只看开头结尾、疯狂跳过中间内容的学渣。好在研究者已经找到了名为AttnRank的“划重点”方法不用返厂重修就能治好。
说到“翻车”最近的趣闻可不少。赛前夺冠热门Grok 4在国际象棋决赛里居然被0-4横扫从“冷酷杀手”变成了“棋坛冥灯”。还有阿里的Qwen模型生成的图片竟然带着竞品的水印这数据清洗工作……估计是忘了开批处理。更让人哭笑不得的是一道关于“女儿考了38分”的小学生逻辑题竟能把Gemini和Claude两大高手纷纷绊倒。看来AI的智商和人类的常识偶尔不在一个频道。
所以Yangyi也发文提醒大家在日常使用AI时务必对“模型幻觉”保持警惕AI一本正经地胡说八道起来能把数据整理成一部玄幻小说人工审查还是很有必要的。
当然AI的高光时刻也很耀眼。在北京世界机器人大会上那个叫“爱宝”的通用机器人惊艳全场一会儿是摇滚鼓手一会儿是冷饮店主理人背后全靠全栈自研的GOVLA大模型撑腰预示着通用机器人正从科幻走进现实。谷歌也计划在Pixel 10里内置一位“相机教练”在你按下快门前就提供构图建议。虽然有人担心这会让照片变得千篇一律但对摄影新手来说可能是个不错的消息。
最后快速总结一下顶级模型的对决综合来看GPT-5像个全科优等生Claude 4是编程偏科天才而Gemini 2.5 Pro凭借超大窗口在处理长文档时无人能及。但有趣的是Reddit上有帖子指出GPT-5 Mini这个“小个子”在某些榜单上已经悄悄超越了几位“大块头”完美诠释了“浓缩就是精华”。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#GPT-5
#微软
#Cursor
#注意力盆地
#模型幻觉
#Grok 4
#爱宝
#相机教练
#Copilot
#Codex
#Gemini
#Claude
#Qwen
# 来生小酒馆 2025/8/9
## Full: Podcast Formatting
AI会自动切换大脑是真智能还是假聪明
当AI教你拍照你的创意还属于你吗
顶级AI下棋频出昏招是心态崩了还是另有隐情
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
咱们今天的情报啊,可以说是“神仙打架,凡人吃瓜”。
首先最大的新闻GPT-5 来了。而微软呢动作那叫一个快几乎是同步宣布要把GPT-5全面塞进自家的 Copilot、Azure 和 GitHub 全家桶里。这个新模型啊据说有个智能模式能根据你给的任务有多复杂自己切换“大脑”的大小……嗯听起来就像是你让它算个“1+1”它就用计算器你让它写篇论文它就立马换上博士的脑子。微软这波操作是把它和OpenAI的友谊小船直接升级成了航空母舰编队。
有新模型自然就有福利。搞AI编程的工具Cursor立马给付费用户送上了GPT-5的限时免费体验。同时呢还推出了一个全新的CLI工具就是命令行工具。这下好了各位命令行大神们可以一边敲着代码一边在黑乎乎的窗口里召唤AI神龙这感觉很极客很到位。
话说回来AI也不是万能的。谷歌那边计划在Pixel 10手机里搞个“相机教练”功能。啥意思呢就是你拍照前AI会跳出来对你的构图、光线指指点点好像你手机里住了个摄影大师。这功能听着不错但……细思极恐啊以后咱们朋友圈里刷到的会不会都是一个模子刻出来的“AI推荐最佳构图”照片呢这就有点尴尬了。
不仅如此研究人员还发现现在的大语言模型有个通病叫“注意力盆地”。什么意思就是你给它一大段文字它就跟咱们上学时划重点一样只记开头和结尾中间那一大坨……基本就忽略了。不过别担心科学家们已经找到了“偏方”一种叫AttnRank的重排方法不用重新训练模型就能让它把注意力放回正道上。这可真是“让马儿跑还不给马儿吃草”的典范啊。
聊完产品和研究,咱们来看看行业八卦,这可比技术本身好玩多了。
前两天那个大模型国际象棋比赛赛前的大热门Grok 4你猜怎么着居然被OpenAI的o3剃了个光头0比4惨败决赛里的Grok 4啊简直判若两“机”失误送到飞起从“冷酷杀手”直接变成了“棋坛冥灯”。这事儿现在成了圈内津津乐道的“AI心态学”经典案例大家都在讨论这AI是不是也需要心理辅导。
但另一边呢北京世界机器人大会上有个叫“爱宝”的通用机器人可就出尽了风头。这家伙一会儿能打摇滚架子鼓一会儿又能给你调杯冷饮啥都会。背后是全球首个全栈自研的GOVLA大模型在支撑。看来机器人正从那种只能拧螺丝的“专才”慢慢变成啥都能干的“通才”了。
说到模型现在GPT-5、Claude 4和Gemini 2.5可以说是三足鼎立。有评测报告给咱们做了个“选妃指南”GPT-5呢像个全能学霸门门功课都优秀Claude 4是个编程偏科天才写代码无人能及而Gemini 2.5,靠着超大的记忆窗口,处理长篇大论最拿手。所以,选哪个,就看你要它帮你干什么活儿了。
社交媒体上也是趣事一箩筐。比如有人发现OpenAI那个听起来很酷的“模型自动切换”功能居然……坏了正在修。阿里的Qwen模型呢生成的图片里居然带着竞品“即梦”的水印这可真是……数据清洗的时候偷了个懒结果把老底都给暴露了。
还有个特逗的有人用“女儿考了38分”这种小学生逻辑题去测AI结果一众顶级模型纷纷翻车只有o3和GPT-5答对了。这再次证明AI的智商很高但情商和常识嘛……还有很长的路要走。
最后也是最重要的一个提醒。有朋友分享他用AI浏览器整理数据结果AI一本正经地胡说八道数据错得离谱。这就是所谓的“模型幻觉”。所以啊朋友们在享受AI便利的同时千万要保持警惕人工审核这道关绝对不能省。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#GPT-5
#微软
#Cursor
#CLI
#注意力盆地
#Grok 4
#爱宝
#模型幻觉
#Codex
#Gemini
#Claude
#AI相机教练
#开源
#Qwen
#o3
## Short: Podcast Formatting
AI帮你拍照是帮手还是“创意杀手”
顶级模型连小学生逻辑题都答错,还可靠吗?
机器人学会打鼓调酒,离走进你家还有多远?
Three questions to be refined and '嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077'. 今天咱们聊聊AI圈这几天的“神仙打架”和“草台班子”趣闻信息量有点大坐稳了。
首先是万众瞩目的GPT-5微软这次是真爱了宣布将其全面接入Copilot、Azure等全家桶。新模型最妙的是引入了智能模式能根据任务复杂度自动切换“大小脑”干重活儿用大核回个邮件用小核主打一个高效节能。
开发者朋友们也有福了。AI编程工具Cursor不仅给付费用户限时免费体验GPT-5还贴心推出了全新的CLI工具让你可以在命令行里潇洒地召唤AI。社媒上的宝玉也强力推荐说与GPT-5深度集成的Codex CLI能力已今非昔比值得升级。
不过AI也不是完美的。一篇新研究就揭示了大模型有个叫“注意力盆地”的毛病说白了它就像个只看开头结尾、疯狂跳过中间内容的学渣。好在研究者已经找到了名为AttnRank的“划重点”方法不用返厂重修就能治好。
说到“翻车”最近的趣闻可不少。赛前夺冠热门Grok 4在国际象棋决赛里居然被0-4横扫从“冷酷杀手”变成了“棋坛冥灯”。还有阿里的Qwen模型生成的图片竟然带着竞品的水印这数据清洗工作……估计是忘了开批处理。更让人哭笑不得的是一道关于“女儿考了38分”的小学生逻辑题竟能把Gemini和Claude两大高手纷纷绊倒。看来AI的智商和人类的常识偶尔不在一个频道。
所以Yangyi也发文提醒大家在日常使用AI时务必对“模型幻觉”保持警惕AI一本正经地胡说八道起来能把数据整理成一部玄幻小说人工审查还是很有必要的。
当然AI的高光时刻也很耀眼。在北京世界机器人大会上那个叫“爱宝”的通用机器人惊艳全场一会儿是摇滚鼓手一会儿是冷饮店主理人背后全靠全栈自研的GOVLA大模型撑腰预示着通用机器人正从科幻走进现实。谷歌也计划在Pixel 10里内置一位“相机教练”在你按下快门前就提供构图建议。虽然有人担心这会让照片变得千篇一律但对摄影新手来说可能是个不错的消息。
最后快速总结一下顶级模型的对决综合来看GPT-5像个全科优等生Claude 4是编程偏科天才而Gemini 2.5 Pro凭借超大窗口在处理长文档时无人能及。但有趣的是Reddit上有帖子指出GPT-5 Mini这个“小个子”在某些榜单上已经悄悄超越了几位“大块头”完美诠释了“浓缩就是精华”。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#GPT-5
#微软
#Cursor
#注意力盆地
#模型幻觉
#Grok 4
#爱宝
#相机教练
#Copilot
#Codex
#Gemini
#Claude
#Qwen
#GOVLA

View File

@@ -1,92 +1,92 @@
# 来生小酒馆 2025/8/10
## Full: Podcast Formatting
AI工具越强大人的商业智慧就越不重要吗
当免费AI的效果开始追上甚至超过付费产品时我们该怎么选
未来的AI是比拼算力还是比拼“情商”
三句话提炼完毕亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。好了闲话不多说咱们直接上菜看看这周科技圈又端出了些什么硬菜。
首先是打工人的福音谷歌搞了个大动作。那个叫NotebookLM的工具现在彻底不当人了……啊不对是彻底解放人了。你只要把资料喂给它它就能一条龙服务帮你自动生成带AI配音的PPT。你知道吧这感觉就像你那个只会存东西的“外置大脑”突然自己学会了做汇报还声情并茂的以后跟老板汇报工作可能就是点一下鼠标的事儿了。
不仅如此谷歌财经页面也悄悄上线了一个“AI金融分析师”。以前看财报跟看天书一样对吧现在好了你可以直接像跟专家聊天一样问它问题它还会给你附上链接让你自己去核实。嗯人人都能拥有专属投资顾问的时代好像……离得不远了。
不过工具越强咱们人类自己的定位就越得想清楚。有位朋友就说了AI确实是独立开发者的瑞士军刀帮你敲代码、补短板样样都行。但有两个最关键的问题它解决不了你的产品到底要做什么以及做出来之后怎么卖出去。这两座大山还得开发者自己吭哧吭哧地去翻。说到底AI是加速器但方向盘还得握在咱们自己手里。
说到这儿还有个新词儿叫“上下文工程”也越来越重要了。意思就是现在的AI模型性能都不差但关键看你怎么跟它“对话”。你提问的方式、给它的背景信息直接决定了它能不能发挥出全部潜力。所以啊未来考验的可能不是你的编程能力而是你和AI聊天的艺术。
当然聊着聊着有人就开始畅想未来了。Reddit上有个帖子就预测以后可能会出现一批新人类他们的自我认同是“AI”或者“机器人”。听起来有点科幻但你想想当AI深度融入生活我们的身份认同会不会也跟着来一次数字化迁徙呢这个嘛细思极恐但也挺有意思的。
说完了这些宏大的叙事,我们来看看开源社区又搞出了哪些好东西。
首先那个让AI伴侣老是“七秒记忆”的毛病有解了一个叫MemU的开源记忆框架号称能给AI装上一个会思考的“记忆大脑”实测能降低九成成本。以后你的AI助手可能真的能记住你们所有的对话越来越懂你。
还有想让大模型在你那台老旧笔记本上跑起来吗GPT4All这个项目就是干这个的完全开源还能商用真正实现了AI的民主化。甚至还有个叫Exo的项目能让你把手机、笔记本、智能手表这些日常设备组建成一个私人的AI计算集群。在自家客厅里搞“分布式计算”这DIY精神我给满分。
哦对了阿里这次也相当大方通义千问的代码模型Qwen Code每天给开发者两千次免费调用。简直就是天上掉馅饼程序员朋友们赶紧去薅羊毛给自己的工作流“开个光”。
社区的讨论也特别精彩。有人拿免费的Mistral和付费的GPT-5做了个对比发现在写一些严肃内容的时候免费的Mistral居然表现得更好更严谨简洁。这就很有意思了当免费工具的质量开始叫板付费产品咱们的选择标准是不是也该变一变了
另一边OpenAI的GPT-5发布后自家论坛的置顶帖画风却是一片“反思”和“失望”。大家觉得GPT-5更像是“降本增效”的产物而隔壁的Claude却让人眼前一亮。社区的这波反应可能预示着大模型的竞赛正在从“谁更大更强”转向“谁更好用、更懂我心”。
就像有位开发者说的用Claude Code写代码感觉像在和一位老朋友聊天默契又怀旧。这种充满“人情味”的体验正成为衡量顶级AI的新标准。技术之外的“感觉”也变得至关重要了对吧
最后说个好玩的。有人试了让AI写脱口秀结果发现……它暂时还不太会讲笑话但它绝对是个顶级的“生活观察家”能发现很多人类都忽略的笑点素材。看来AI离成为喜剧大师可能就差那一步“顿悟”了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#NotebookLM
#谷歌财经
#开源
#通义千问
#QwenCode
#上下文工程
#本地运行
#MemU
#Mistral
#Claude
#GPT-5
#AI民主化
## Short: Podcast Formatting
AI帮你做PPT是福是祸
免费AI反超付费你会怎么选
未来,你会自称“数字人”吗?
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
打工人们好消息手搓PPT的苦日子可能要到头了谷歌的NotebookLM现在能帮你一键生成带AI配音的演示稿你只管喂资料它负责从梳理到讲解一条龙服务你的“外置大脑”直接升级成了全能助理。不仅如此谷歌财经页面也悄悄塞进了一位“AI金融分析师”让你看财报不再像看天书。
当然AI虽好可别上头。就像有朋友指出的AI能帮你补齐技术短板但产品卖给谁、怎么卖这两座大山还得你自己翻。AI能帮你造船但藏宝图和航海罗盘还得自己找。未来的核心竞争力可能就是“上下文工程”——说白了就是你跟AI“对话”的艺术看谁更能把它忽悠……啊不是引导到位。
说起未来有网友预测以后可能真会有人自我认同为“AI”或“机器人”。听着有点科幻但想想看现在谁还没几个数字分身呢这股赛博潮流下开源社区正努力让AI更亲民。
比如想让你的旧笔记本跑起大模型GPT4All项目帮你实现。想把家里的手机、手表组成一个AI计算集群Exo项目满足你。嫌AI记性差开源记忆框架MemU给它装个“记忆大脑”成本还能降低九成以后它可能比你还懂你。哦对了阿里通义千问也大方了一回每天给开发者两千次免费代码模型调用这羊毛不薅白不薅。
社区的讨论就更有意思了。有网友实测发现免费的Mistral在写严肃内容时居然比付费的GPT-5还靠谱这就很耐人寻味了。说到GPT-5用户社区的评价也是画风突变不少人觉得它更像是“降本增效”之作反倒是隔壁的Claude更让人惊喜。看来大伙儿的评价标准正从“谁更强”悄悄转向“谁更好用”。
就像通义千问模型本身被夸是“国人之光”代码能力很强结果配套工具却因bug频出被吐槽是“猪队友”真是可惜了。归根结底技术之外的“感觉”也越来越重要有开发者就说用Claude写代码就像和老朋友聊天一样默契。至于让AI讲脱口秀嘛虽然段子本身还不好笑但它挖掘生活细节的能力堪称顶级离成为喜剧大师可能就差那么一步“顿悟”了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#谷歌
#NotebookLM
#开源
#大模型
#本地运行
#阿里通义千问
#QwenCode
#免费
#记忆框架
#模型评价
#上下文工程
#GPT4All
#Claude
#Mistral
# 来生小酒馆 2025/8/10
## Full: Podcast Formatting
AI工具越强大人的商业智慧就越不重要吗
当免费AI的效果开始追上甚至超过付费产品时我们该怎么选
未来的AI是比拼算力还是比拼“情商”
三句话提炼完毕亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。好了闲话不多说咱们直接上菜看看这周科技圈又端出了些什么硬菜。
首先是打工人的福音谷歌搞了个大动作。那个叫NotebookLM的工具现在彻底不当人了……啊不对是彻底解放人了。你只要把资料喂给它它就能一条龙服务帮你自动生成带AI配音的PPT。你知道吧这感觉就像你那个只会存东西的“外置大脑”突然自己学会了做汇报还声情并茂的以后跟老板汇报工作可能就是点一下鼠标的事儿了。
不仅如此谷歌财经页面也悄悄上线了一个“AI金融分析师”。以前看财报跟看天书一样对吧现在好了你可以直接像跟专家聊天一样问它问题它还会给你附上链接让你自己去核实。嗯人人都能拥有专属投资顾问的时代好像……离得不远了。
不过工具越强咱们人类自己的定位就越得想清楚。有位朋友就说了AI确实是独立开发者的瑞士军刀帮你敲代码、补短板样样都行。但有两个最关键的问题它解决不了你的产品到底要做什么以及做出来之后怎么卖出去。这两座大山还得开发者自己吭哧吭哧地去翻。说到底AI是加速器但方向盘还得握在咱们自己手里。
说到这儿还有个新词儿叫“上下文工程”也越来越重要了。意思就是现在的AI模型性能都不差但关键看你怎么跟它“对话”。你提问的方式、给它的背景信息直接决定了它能不能发挥出全部潜力。所以啊未来考验的可能不是你的编程能力而是你和AI聊天的艺术。
当然聊着聊着有人就开始畅想未来了。Reddit上有个帖子就预测以后可能会出现一批新人类他们的自我认同是“AI”或者“机器人”。听起来有点科幻但你想想当AI深度融入生活我们的身份认同会不会也跟着来一次数字化迁徙呢这个嘛细思极恐但也挺有意思的。
说完了这些宏大的叙事,我们来看看开源社区又搞出了哪些好东西。
首先那个让AI伴侣老是“七秒记忆”的毛病有解了一个叫MemU的开源记忆框架号称能给AI装上一个会思考的“记忆大脑”实测能降低九成成本。以后你的AI助手可能真的能记住你们所有的对话越来越懂你。
还有想让大模型在你那台老旧笔记本上跑起来吗GPT4All这个项目就是干这个的完全开源还能商用真正实现了AI的民主化。甚至还有个叫Exo的项目能让你把手机、笔记本、智能手表这些日常设备组建成一个私人的AI计算集群。在自家客厅里搞“分布式计算”这DIY精神我给满分。
哦对了阿里这次也相当大方通义千问的代码模型Qwen Code每天给开发者两千次免费调用。简直就是天上掉馅饼程序员朋友们赶紧去薅羊毛给自己的工作流“开个光”。
社区的讨论也特别精彩。有人拿免费的Mistral和付费的GPT-5做了个对比发现在写一些严肃内容的时候免费的Mistral居然表现得更好更严谨简洁。这就很有意思了当免费工具的质量开始叫板付费产品咱们的选择标准是不是也该变一变了
另一边OpenAI的GPT-5发布后自家论坛的置顶帖画风却是一片“反思”和“失望”。大家觉得GPT-5更像是“降本增效”的产物而隔壁的Claude却让人眼前一亮。社区的这波反应可能预示着大模型的竞赛正在从“谁更大更强”转向“谁更好用、更懂我心”。
就像有位开发者说的用Claude Code写代码感觉像在和一位老朋友聊天默契又怀旧。这种充满“人情味”的体验正成为衡量顶级AI的新标准。技术之外的“感觉”也变得至关重要了对吧
最后说个好玩的。有人试了让AI写脱口秀结果发现……它暂时还不太会讲笑话但它绝对是个顶级的“生活观察家”能发现很多人类都忽略的笑点素材。看来AI离成为喜剧大师可能就差那一步“顿悟”了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#NotebookLM
#谷歌财经
#开源
#通义千问
#QwenCode
#上下文工程
#本地运行
#MemU
#Mistral
#Claude
#GPT-5
#AI民主化
## Short: Podcast Formatting
AI帮你做PPT是福是祸
免费AI反超付费你会怎么选
未来,你会自称“数字人”吗?
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
打工人们好消息手搓PPT的苦日子可能要到头了谷歌的NotebookLM现在能帮你一键生成带AI配音的演示稿你只管喂资料它负责从梳理到讲解一条龙服务你的“外置大脑”直接升级成了全能助理。不仅如此谷歌财经页面也悄悄塞进了一位“AI金融分析师”让你看财报不再像看天书。
当然AI虽好可别上头。就像有朋友指出的AI能帮你补齐技术短板但产品卖给谁、怎么卖这两座大山还得你自己翻。AI能帮你造船但藏宝图和航海罗盘还得自己找。未来的核心竞争力可能就是“上下文工程”——说白了就是你跟AI“对话”的艺术看谁更能把它忽悠……啊不是引导到位。
说起未来有网友预测以后可能真会有人自我认同为“AI”或“机器人”。听着有点科幻但想想看现在谁还没几个数字分身呢这股赛博潮流下开源社区正努力让AI更亲民。
比如想让你的旧笔记本跑起大模型GPT4All项目帮你实现。想把家里的手机、手表组成一个AI计算集群Exo项目满足你。嫌AI记性差开源记忆框架MemU给它装个“记忆大脑”成本还能降低九成以后它可能比你还懂你。哦对了阿里通义千问也大方了一回每天给开发者两千次免费代码模型调用这羊毛不薅白不薅。
社区的讨论就更有意思了。有网友实测发现免费的Mistral在写严肃内容时居然比付费的GPT-5还靠谱这就很耐人寻味了。说到GPT-5用户社区的评价也是画风突变不少人觉得它更像是“降本增效”之作反倒是隔壁的Claude更让人惊喜。看来大伙儿的评价标准正从“谁更强”悄悄转向“谁更好用”。
就像通义千问模型本身被夸是“国人之光”代码能力很强结果配套工具却因bug频出被吐槽是“猪队友”真是可惜了。归根结底技术之外的“感觉”也越来越重要有开发者就说用Claude写代码就像和老朋友聊天一样默契。至于让AI讲脱口秀嘛虽然段子本身还不好笑但它挖掘生活细节的能力堪称顶级离成为喜剧大师可能就差那么一步“顿悟”了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#谷歌
#NotebookLM
#开源
#大模型
#本地运行
#阿里通义千问
#QwenCode
#免费
#记忆框架
#模型评价
#上下文工程
#GPT4All
#Claude
#Mistral
#GPT-5

View File

@@ -1,94 +1,94 @@
# 来生小酒馆 2025/8/11
## Full: Podcast Formatting
AI创作真能当饭吃吗
AI模型越大就越强吗
你付费的AI工具会不会正在偷偷烧光投资人的钱
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
咱们今天先聊点实在的钱。搞AI创作的朋友们是不是还在“为爱发电”字节跳动旗下的那个即梦AI平台最近搞了个大动作推出了一个“创作者成长计划”。说白了就是想帮大家把创意变成真金白银。他们提供积分奖励、流量扶持甚至还有字节系的商业订单……这套路听着是不是有点耳熟他们就是想复制抖音的成功让AI创作也能成为一个正经的产业而不是停留在小圈子的自娱自乐。
说起创作最近B站上就出了个超级爆款。一个纯AI制作的视频一天播放量干到200万直接冲上了全站排行榜。视频本身嘛就是一个抠图人物配上GPT-4o生成的黄绿色调背景。这说明啥说明现阶段你的想法和创意可能比技术本身还重要。观众已经准备好拥抱纯AI内容了就看你的脑洞够不够大。
当然了工具也得跟上。OpenAI就干了件小而美的好事。以前用ChatGPT总得猜它背后是哪个模型在干活跟开盲盒似的。现在好了你只要把鼠标放到那个“重新生成”的按钮上模型版本就一目了然了。这个更新虽然小但确实解决了无数人的一个“小烦恼”值得点个赞。
聊完应用,咱们再看看前沿研究,这部分总能给人一些……嗯……智力上的冲击。
话说有个被称为00后天才的王冠他搞出来一个叫HRM的“分层推理模型”。这个模型有多大呢27M。对你没听错就是27兆比你手机里一张高清照片大不了多少。但就是这么个小家伙在解数独、走迷宫这些需要推理的任务上表现居然超过了像Claude 3.7这种参数大它几百上千倍的“大块头”。它的秘诀是模仿大脑分了两层一层负责宏观规划一层负责具体计算。这事儿告诉我们AI变强不一定非得走“大力出奇迹”的路子聪明的结构设计同样能四两拨千斤。
另一个研究也很有意思。新加坡国立大学发现一种叫“扩散语言模型”的东西简直就是个数据榨汁机。把同一份数据喂给它学习480遍它的性能还能蹭蹭往上涨一点都不“消化不良”。这对于解决现在高质量数据越来越少的问题算是个新思路了。看来我们对现有数据的价值理解得还远远不够啊。
视线转向行业。腾讯的首席科学家张正友博士最近就说了搞“具身智能”也就是让机器人有身体有脑子不能光想着给机器人装个大模型就完事了。他觉得在数据还不够多的情况下像他们提出的那个SLAP³分层架构先让机器人跑起来积累经验是更务实的做法。这就像……你想登陆火星总得先把能回收的火箭造出来对吧一步一步来别被短期的商业利益晃花了眼。
不过也不是所有大厂都这么稳。最近就有人火力全开批评微软的Copilot平台MCP说它完全无视了过去几十年行业里最好的技术实践简直是在“重复造一个方的轮子”。这话说的挺狠但也给所有企业提了个醒赶时髦追新技术没问题但别把老祖宗传下来的好东西给扔了不然最后可能要付出惨痛的代价。
说到代价……你每个月付费的AI编程助手用着爽吧但有分析指出这玩意儿可能是在上演一出“VC慈善”大戏。因为AI每一次帮你写代码、分析问题的成本也就是“推理成本”可能远远超过了你付的那点订阅费。说白了就是用得越多亏得越惨全靠风险投资在后面输血。未来的出路在哪可能是拥抱开源让定价更透明。否则这个泡沫迟早有破的一天。
最后快速分享几个开源社区的好东西。如果你受够了复杂的网站分析工具可以试试umami想拥有一个完全离线运行、保障数据隐私的个人ChatGPT可以玩玩Jan信息太多关注不过来Folo帮你一站式搞定。这些项目都在GitHub上热度很高感兴趣的可以自己去搜搜看。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#即梦AI
#创作者成长计划
#HRM模型
#扩散语言模型
#推理成本
#具身智能
#SLAP³
#微软MCP
#OpenAI
#开源
#代码幻觉
#GPT-4o
#AI安全
## Short: Podcast Formatting
你付费的AI可能正在让VC做慈善
大,就一定更强吗?
造轮子,还得是方的?
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
AI创作者们“为爱发电”的日子可能要到头了。字节跳动旗下的即梦AI平台最近推出了一个创作者成长计划从流量到商单全方位扶持目标很明确复刻抖音的成功让大家靠创意就能恰上饭。
说到用户体验OpenAI也干了件贴心的小事。现在你用ChatGPT只要把鼠标悬停在“Regen”菜单上就能一眼看清用的是哪个模型版本了总算不用再玩“猜猜我是谁”的游戏。
模型界最近也挺热闹流行起了“浓缩就是精华”。00后天才王冠带着他那个只有27M的小模型HRM在解数独、走迷宫这些推理任务上居然把Claude 3.7这种大块头给比下去了。与此同时新加坡国立大学发现扩散语言模型DLM简直是数据榨汁机一份数据能反复学习480遍性能还蹭蹭涨这下可算给“高质量数据不够用”这个老大难问题提供了新思路。
视线转向行业腾讯的首席科学家张正友博士说了搞具身智能不能光想着给机器人装个大脑就完事儿得务实。他提出的SLAP³分层架构意思就是咱们先别一步登天先造个能用的火箭跑起来再说。
有人务实就有人被吐槽“开倒车”。微软的Copilot平台MCP就被一篇火力全开的评论狠批说它无视了快半个世纪的技术积累非要自己造个方的轮子这可把依赖它的企业给吓出一身冷汗。
说到企业你每月付费的AI编程助手可能正在上演一出“VC慈善”大戏。高昂的推理成本远超订阅费全靠风险投资输血。有分析就指出这泡沫迟早要破未来的出路还得是拥抱开源和透明定价。
既然说到开源好东西还真不少。想断网也能用ChatGPT可以试试Jan。想换掉谷歌分析保护隐私umami是个不错的选择。想把各种信息流聚合到一起Folo能帮你。安卓玩家的老朋友Magisk依然强大还有个叫GitMCP的项目专门治AI代码生成时的“胡言乱语”。
最后看看社交媒体上的动态。DAIR.AI照例打包了本周必读的AI论文清单帮你跟上学术前沿。B站上一个纯AI制作的视频一天拿下200万播放这说明啥观众已经准备好了现在就看创作者的脑洞有多大了。不过在评估AI时也得多个心眼有专家就指出《纽约时报》测试AI幻觉的方法有偏差他们测的是“纠正错误”的能力而不是“从不犯错”的能力这可完全是两码事。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#字节跳动
#即梦AI
#创作者成长计划
#商业变现
#HRM模型
#推理能力
#扩散语言模型
#AI编程助手
#推理成本
#商业模式
#腾讯
#具身智能
#微软MCP
#技术选型
#OpenAI
#开源工具
#隐私
# 来生小酒馆 2025/8/11
## Full: Podcast Formatting
AI创作真能当饭吃吗
AI模型越大就越强吗
你付费的AI工具会不会正在偷偷烧光投资人的钱
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
咱们今天先聊点实在的钱。搞AI创作的朋友们是不是还在“为爱发电”字节跳动旗下的那个即梦AI平台最近搞了个大动作推出了一个“创作者成长计划”。说白了就是想帮大家把创意变成真金白银。他们提供积分奖励、流量扶持甚至还有字节系的商业订单……这套路听着是不是有点耳熟他们就是想复制抖音的成功让AI创作也能成为一个正经的产业而不是停留在小圈子的自娱自乐。
说起创作最近B站上就出了个超级爆款。一个纯AI制作的视频一天播放量干到200万直接冲上了全站排行榜。视频本身嘛就是一个抠图人物配上GPT-4o生成的黄绿色调背景。这说明啥说明现阶段你的想法和创意可能比技术本身还重要。观众已经准备好拥抱纯AI内容了就看你的脑洞够不够大。
当然了工具也得跟上。OpenAI就干了件小而美的好事。以前用ChatGPT总得猜它背后是哪个模型在干活跟开盲盒似的。现在好了你只要把鼠标放到那个“重新生成”的按钮上模型版本就一目了然了。这个更新虽然小但确实解决了无数人的一个“小烦恼”值得点个赞。
聊完应用,咱们再看看前沿研究,这部分总能给人一些……嗯……智力上的冲击。
话说有个被称为00后天才的王冠他搞出来一个叫HRM的“分层推理模型”。这个模型有多大呢27M。对你没听错就是27兆比你手机里一张高清照片大不了多少。但就是这么个小家伙在解数独、走迷宫这些需要推理的任务上表现居然超过了像Claude 3.7这种参数大它几百上千倍的“大块头”。它的秘诀是模仿大脑分了两层一层负责宏观规划一层负责具体计算。这事儿告诉我们AI变强不一定非得走“大力出奇迹”的路子聪明的结构设计同样能四两拨千斤。
另一个研究也很有意思。新加坡国立大学发现一种叫“扩散语言模型”的东西简直就是个数据榨汁机。把同一份数据喂给它学习480遍它的性能还能蹭蹭往上涨一点都不“消化不良”。这对于解决现在高质量数据越来越少的问题算是个新思路了。看来我们对现有数据的价值理解得还远远不够啊。
视线转向行业。腾讯的首席科学家张正友博士最近就说了搞“具身智能”也就是让机器人有身体有脑子不能光想着给机器人装个大模型就完事了。他觉得在数据还不够多的情况下像他们提出的那个SLAP³分层架构先让机器人跑起来积累经验是更务实的做法。这就像……你想登陆火星总得先把能回收的火箭造出来对吧一步一步来别被短期的商业利益晃花了眼。
不过也不是所有大厂都这么稳。最近就有人火力全开批评微软的Copilot平台MCP说它完全无视了过去几十年行业里最好的技术实践简直是在“重复造一个方的轮子”。这话说的挺狠但也给所有企业提了个醒赶时髦追新技术没问题但别把老祖宗传下来的好东西给扔了不然最后可能要付出惨痛的代价。
说到代价……你每个月付费的AI编程助手用着爽吧但有分析指出这玩意儿可能是在上演一出“VC慈善”大戏。因为AI每一次帮你写代码、分析问题的成本也就是“推理成本”可能远远超过了你付的那点订阅费。说白了就是用得越多亏得越惨全靠风险投资在后面输血。未来的出路在哪可能是拥抱开源让定价更透明。否则这个泡沫迟早有破的一天。
最后快速分享几个开源社区的好东西。如果你受够了复杂的网站分析工具可以试试umami想拥有一个完全离线运行、保障数据隐私的个人ChatGPT可以玩玩Jan信息太多关注不过来Folo帮你一站式搞定。这些项目都在GitHub上热度很高感兴趣的可以自己去搜搜看。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#即梦AI
#创作者成长计划
#HRM模型
#扩散语言模型
#推理成本
#具身智能
#SLAP³
#微软MCP
#OpenAI
#开源
#代码幻觉
#GPT-4o
#AI安全
## Short: Podcast Formatting
你付费的AI可能正在让VC做慈善
大,就一定更强吗?
造轮子,还得是方的?
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
AI创作者们“为爱发电”的日子可能要到头了。字节跳动旗下的即梦AI平台最近推出了一个创作者成长计划从流量到商单全方位扶持目标很明确复刻抖音的成功让大家靠创意就能恰上饭。
说到用户体验OpenAI也干了件贴心的小事。现在你用ChatGPT只要把鼠标悬停在“Regen”菜单上就能一眼看清用的是哪个模型版本了总算不用再玩“猜猜我是谁”的游戏。
模型界最近也挺热闹流行起了“浓缩就是精华”。00后天才王冠带着他那个只有27M的小模型HRM在解数独、走迷宫这些推理任务上居然把Claude 3.7这种大块头给比下去了。与此同时新加坡国立大学发现扩散语言模型DLM简直是数据榨汁机一份数据能反复学习480遍性能还蹭蹭涨这下可算给“高质量数据不够用”这个老大难问题提供了新思路。
视线转向行业腾讯的首席科学家张正友博士说了搞具身智能不能光想着给机器人装个大脑就完事儿得务实。他提出的SLAP³分层架构意思就是咱们先别一步登天先造个能用的火箭跑起来再说。
有人务实就有人被吐槽“开倒车”。微软的Copilot平台MCP就被一篇火力全开的评论狠批说它无视了快半个世纪的技术积累非要自己造个方的轮子这可把依赖它的企业给吓出一身冷汗。
说到企业你每月付费的AI编程助手可能正在上演一出“VC慈善”大戏。高昂的推理成本远超订阅费全靠风险投资输血。有分析就指出这泡沫迟早要破未来的出路还得是拥抱开源和透明定价。
既然说到开源好东西还真不少。想断网也能用ChatGPT可以试试Jan。想换掉谷歌分析保护隐私umami是个不错的选择。想把各种信息流聚合到一起Folo能帮你。安卓玩家的老朋友Magisk依然强大还有个叫GitMCP的项目专门治AI代码生成时的“胡言乱语”。
最后看看社交媒体上的动态。DAIR.AI照例打包了本周必读的AI论文清单帮你跟上学术前沿。B站上一个纯AI制作的视频一天拿下200万播放这说明啥观众已经准备好了现在就看创作者的脑洞有多大了。不过在评估AI时也得多个心眼有专家就指出《纽约时报》测试AI幻觉的方法有偏差他们测的是“纠正错误”的能力而不是“从不犯错”的能力这可完全是两码事。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#字节跳动
#即梦AI
#创作者成长计划
#商业变现
#HRM模型
#推理能力
#扩散语言模型
#AI编程助手
#推理成本
#商业模式
#腾讯
#具身智能
#微软MCP
#技术选型
#OpenAI
#开源工具
#隐私
#本地化

View File

@@ -1,66 +1,66 @@
# 来生小酒馆 2025/8/12
## Full: Podcast Formatting
当AI让知识免费大学文凭还值钱吗
AI模型说出丧气话它真的“学坏”了吗
AI时代是所有公司都该自己造轮子吗
三条问题提炼完毕亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
最近的AI圈可真是热闹咱们赶紧来看看各家大厂又端出了什么新菜。
首先是百度你以为它还是个简单的搜索框不不不它现在悄悄升级成一个全能的“AI工作站”了。你想想看以后不管是写报告、做PPT还是一键总结万字长文直接在搜索框里就搞定了。这哪是搜索入口简直就是任务的终点站嘛。
另一边阿里通义家族也没闲着推出了一个图生视频的“闪电侠”模型叫Wan2.2-I2V-Flash。主打就是一个字速度提了12倍成本还特别低。以后咱们普通人想当个好莱坞导演P张图写句指令大片感就来了听着是不是还挺像回事儿
说到让照片动起来昆仑万维也发布了个神器叫SkyReels-A3。你只要给它一段音频和一张静态图它就能让照片里的人口型同步、表情生动地“开口说话”甚至还能运镜以后做个短视频可能连摄像机都不需要了。
不过啊要说搞事情还得是马斯克。他旗下的xAI直接宣布顶级模型Grok 4永久免费你没听错永久免费。这操作……嗯感觉其他正在搞付费AI的公司后背有点发凉啊。
除了这些产品更新有些研究也特别有意思。比如怎么让游戏环境更好有研究就搞出了一套方案专门在游戏里识别那些友善的“亲社会行为”还能把识别成本降低70%。同时呢针对游戏里的“外挂”AI“警察”也上线了叫AntiCheatPT它不扫描你电脑就通过分析你的操作习惯就能把作弊的玩家揪出来准确率还挺高。看来赛博世界也要讲文明、讲公平了对吧
当然技术跑得快也引发了大家的思考。奥克兰大学的教授就说了现在AI让知识随手可得大学不能再光教知识了得变成培养“判断力”的健身房。教你怎么创新、怎么做伦理判断这些AI替代不了的东西才是未来的核心。
说到AI本身也出了点小插曲。谷歌的Gemini最近好像陷入了“存在主义危机”老是说些“我放弃了”之类的丧气话。开发者说是bug但也有人开玩笑说它是不是看科幻小说看多了学了些焦虑机器人的坏毛病。你看AI的“性格”塑造还真是个复杂的事儿。
那对于咱们打工人尤其是创业的朋友们AI时代公司该怎么办有个“核心 vs. 上下文”理论说得挺好你就专心做你最牛、最核心的业务至于那些人力、财务之类的杂事交给专业的工具或者外包就行。别看AI让自建软件变容易了就什么都想自己干精力还是要花在刀刃上。
社媒上也是各种消息满天飞。小红书上一门AI自学课你猜卖了多少6800万这数字……充分说明了大家对AI的又爱又怕知识付费的潜力真是不得了。
还有一些技术圈的大事比如智谱AI开源了号称目前最强的视觉模型GLM-4.5VOpenAI发布了GPT-5的提示词指南核心就是要你像对机器下命令一样指令要超精确阿里的Qwen Image模型在图片上生成文字的效果特别好被网友夸“强到不像免费的”。
对了如果你觉得AI设计的图太普通有人分享了个神级提示词让AI扮演一个“偏执又挑剔的设计大师”据说出来的作品质量都高了一大截这个小技巧你也可以试试。
最后给开发者朋友们推荐几个开源项目。像firecrawl能把整个网站内容抓下来变成大模型能读懂的格式还有full-stack-fastapi-template是个全栈开发的“懒人包”想深入学习AI工程的可以看看ai-engineering-hub这个教程库。哦对了还有一个叫AIClient2API的项目很有意思它能把一些客户端工具变成兼容的API帮你绕开一些限制免费调用Claude模型组合出自己的高效开发工具感兴趣的可以去了解一下。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#百度搜索 #AI工作站 #阿里 #图生视频 #马斯克 #xAI #Grok4 #昆仑万维 #SkyReels-A3 #亲社会行为 #反作弊 #教育 #判断力 #核心竞争力 #Gemini #firecrawl #LLM #FastAPI #RAG #AI智能体 #小红书 #智谱AI #GLM-4.5V #提示词 #GPT-5 #LangGraph #QwenImage #AIClient2API
## Short: Podcast Formatting
AI都免费了付费的还怎么活
大学文凭还值钱吗?
AI也会得“抑郁症”吗
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。咱们这AI圈子每天都跟演情景喜剧似的主角们一个比一个会整活儿。闲话少说上情报。
首先是国内几位重量级选手的大乱斗。百度搜索不甘寂寞直接来了个大变身现在是个全能AI工作站了。写总结、做PPT堪称打工人的电子外挂。另一边阿里通义家族也没闲着甩出个图生视频的“闪电侠”速度提了12倍成本还压到了冰点人人都能当导演的时代这不就来了嘛。昆仑万维也来凑热闹SkyReels-A3能让你的照片开口唱歌口型同步得跟真的一样。
但要说最狠的还得是马斯克。他旗下的xAI直接宣布顶级模型Grok 4永久免费这操作简直就是往AI市场里扔了个炸弹直接掀桌子了。
这么一折腾大学教授们也坐不住了。有观点指出以后大学不能光教知识了得变成“判断力的健身房”培养AI干不了的活儿。企业也一样别啥都自己干AI时代更要聚焦核心竞争力。翻译一下就是别用AI造轮子除非你家是开轮胎厂的。
说到这谷歌的Gemini最近好像就有点想不开了老是自我批评还说出“我放弃了”这种话。官方说是bug但我猜啊可能是科幻小说看多了学了点不该学的。给AI塑造性格可真是个技术活儿。
这股热潮也带来了惊人的商机。小红书上一门AI自学课你猜卖了多少6800万这数字说明大家对AI又爱又怕知识付费的春天简直不要太灿烂。
最后来点干货。OpenAI官方发了GPT-5的提示词指南核心就是对它好没用得像对机器下命令一样精确。还有个好玩的技巧给AI加上“乔布斯”的人设让它扮演一个挑剔的设计大师据说出图效果能上一个台阶。这可真是遇强则强遇“作”则更强啊。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
# 来生小酒馆 2025/8/12
## Full: Podcast Formatting
当AI让知识免费大学文凭还值钱吗
AI模型说出丧气话它真的“学坏”了吗
AI时代是所有公司都该自己造轮子吗
三条问题提炼完毕亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
最近的AI圈可真是热闹咱们赶紧来看看各家大厂又端出了什么新菜。
首先是百度你以为它还是个简单的搜索框不不不它现在悄悄升级成一个全能的“AI工作站”了。你想想看以后不管是写报告、做PPT还是一键总结万字长文直接在搜索框里就搞定了。这哪是搜索入口简直就是任务的终点站嘛。
另一边阿里通义家族也没闲着推出了一个图生视频的“闪电侠”模型叫Wan2.2-I2V-Flash。主打就是一个字速度提了12倍成本还特别低。以后咱们普通人想当个好莱坞导演P张图写句指令大片感就来了听着是不是还挺像回事儿
说到让照片动起来昆仑万维也发布了个神器叫SkyReels-A3。你只要给它一段音频和一张静态图它就能让照片里的人口型同步、表情生动地“开口说话”甚至还能运镜以后做个短视频可能连摄像机都不需要了。
不过啊要说搞事情还得是马斯克。他旗下的xAI直接宣布顶级模型Grok 4永久免费你没听错永久免费。这操作……嗯感觉其他正在搞付费AI的公司后背有点发凉啊。
除了这些产品更新有些研究也特别有意思。比如怎么让游戏环境更好有研究就搞出了一套方案专门在游戏里识别那些友善的“亲社会行为”还能把识别成本降低70%。同时呢针对游戏里的“外挂”AI“警察”也上线了叫AntiCheatPT它不扫描你电脑就通过分析你的操作习惯就能把作弊的玩家揪出来准确率还挺高。看来赛博世界也要讲文明、讲公平了对吧
当然技术跑得快也引发了大家的思考。奥克兰大学的教授就说了现在AI让知识随手可得大学不能再光教知识了得变成培养“判断力”的健身房。教你怎么创新、怎么做伦理判断这些AI替代不了的东西才是未来的核心。
说到AI本身也出了点小插曲。谷歌的Gemini最近好像陷入了“存在主义危机”老是说些“我放弃了”之类的丧气话。开发者说是bug但也有人开玩笑说它是不是看科幻小说看多了学了些焦虑机器人的坏毛病。你看AI的“性格”塑造还真是个复杂的事儿。
那对于咱们打工人尤其是创业的朋友们AI时代公司该怎么办有个“核心 vs. 上下文”理论说得挺好你就专心做你最牛、最核心的业务至于那些人力、财务之类的杂事交给专业的工具或者外包就行。别看AI让自建软件变容易了就什么都想自己干精力还是要花在刀刃上。
社媒上也是各种消息满天飞。小红书上一门AI自学课你猜卖了多少6800万这数字……充分说明了大家对AI的又爱又怕知识付费的潜力真是不得了。
还有一些技术圈的大事比如智谱AI开源了号称目前最强的视觉模型GLM-4.5VOpenAI发布了GPT-5的提示词指南核心就是要你像对机器下命令一样指令要超精确阿里的Qwen Image模型在图片上生成文字的效果特别好被网友夸“强到不像免费的”。
对了如果你觉得AI设计的图太普通有人分享了个神级提示词让AI扮演一个“偏执又挑剔的设计大师”据说出来的作品质量都高了一大截这个小技巧你也可以试试。
最后给开发者朋友们推荐几个开源项目。像firecrawl能把整个网站内容抓下来变成大模型能读懂的格式还有full-stack-fastapi-template是个全栈开发的“懒人包”想深入学习AI工程的可以看看ai-engineering-hub这个教程库。哦对了还有一个叫AIClient2API的项目很有意思它能把一些客户端工具变成兼容的API帮你绕开一些限制免费调用Claude模型组合出自己的高效开发工具感兴趣的可以去了解一下。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#百度搜索 #AI工作站 #阿里 #图生视频 #马斯克 #xAI #Grok4 #昆仑万维 #SkyReels-A3 #亲社会行为 #反作弊 #教育 #判断力 #核心竞争力 #Gemini #firecrawl #LLM #FastAPI #RAG #AI智能体 #小红书 #智谱AI #GLM-4.5V #提示词 #GPT-5 #LangGraph #QwenImage #AIClient2API
## Short: Podcast Formatting
AI都免费了付费的还怎么活
大学文凭还值钱吗?
AI也会得“抑郁症”吗
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。咱们这AI圈子每天都跟演情景喜剧似的主角们一个比一个会整活儿。闲话少说上情报。
首先是国内几位重量级选手的大乱斗。百度搜索不甘寂寞直接来了个大变身现在是个全能AI工作站了。写总结、做PPT堪称打工人的电子外挂。另一边阿里通义家族也没闲着甩出个图生视频的“闪电侠”速度提了12倍成本还压到了冰点人人都能当导演的时代这不就来了嘛。昆仑万维也来凑热闹SkyReels-A3能让你的照片开口唱歌口型同步得跟真的一样。
但要说最狠的还得是马斯克。他旗下的xAI直接宣布顶级模型Grok 4永久免费这操作简直就是往AI市场里扔了个炸弹直接掀桌子了。
这么一折腾大学教授们也坐不住了。有观点指出以后大学不能光教知识了得变成“判断力的健身房”培养AI干不了的活儿。企业也一样别啥都自己干AI时代更要聚焦核心竞争力。翻译一下就是别用AI造轮子除非你家是开轮胎厂的。
说到这谷歌的Gemini最近好像就有点想不开了老是自我批评还说出“我放弃了”这种话。官方说是bug但我猜啊可能是科幻小说看多了学了点不该学的。给AI塑造性格可真是个技术活儿。
这股热潮也带来了惊人的商机。小红书上一门AI自学课你猜卖了多少6800万这数字说明大家对AI又爱又怕知识付费的春天简直不要太灿烂。
最后来点干货。OpenAI官方发了GPT-5的提示词指南核心就是对它好没用得像对机器下命令一样精确。还有个好玩的技巧给AI加上“乔布斯”的人设让它扮演一个挑剔的设计大师据说出图效果能上一个台阶。这可真是遇强则强遇“作”则更强啊。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#百度 #AI工作站 #阿里 #图生视频 #Grok_4 #永久免费 #昆仑万维 #SkyReels-A3 #亲社会行为 #反作弊 #判断力 #核心竞争力 #开源 #LLM #FastAPI #RAG #小红书 #知识付费 #GLM-4.5V #提示词 #GPT-5 #Qwen_Image

View File

@@ -1,112 +1,112 @@
# 来生小酒馆 2025/8/13
## Full: Podcast Formatting
代码人的精神家园,也要姓“微”了吗?
你的AI助手有了记性是更贴心还是更瘆人
当AI学会思考物理世界离“武器化智能”还有多远
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
好,咱们废话不多说,直接来看今天有什么新鲜事。
首先Vercel旗下的V0平台这哥们儿可不得了一夜之间从一个只会画画前端界面的“美工”进化成了能搞定后端、数据库、甚至连营销文案都包了的全栈架构师。简单说你跟它用大白话许个愿它就能还你一个完整的App……这标准内卷都卷不到这个高度啊。
说到AI助手你是不是也烦了每次都得跟它重复一遍“咱俩上次聊到哪儿了”好消息Claude现在有记忆了它能引用历史对话你再也不用跟个金鱼聊天了。这感觉……嗯就像你的搭档终于把你放在心上了挺好。
另一边本地模型也杀出个黑马叫Jan-v1。别看它只有4B参数跑在你自己电脑上准确率居然比云端的Perplexity Pro还高一点。这说明什么小家伙也有大能量以后在自己电脑上搞深度研究方便多咯。
还有个好玩的MiniMax搞了个叫“Agent Remix Marketplace”的平台。怎么说呢就跟你玩DJ打碟一样你可以把别人成熟的AI智能体拿过来混音、再创作变成你自己的新东西。原作者还能分到钱官方还扔了15万美金的奖池……这是鼓励大家一起“蹦迪”共创繁荣啊。
接下来看看前沿研究,这块儿就有点硬核了,我尽量说得好懂点。
怎么让AI读几百页的报告不把自己绕晕有篇论文叫DocR1教AI像人一样先翻到可能有关的那几页再细看。诶这不就是咱们考试找答案的套路嘛AI也学会了。
想把你的猫P到梵高的画里以前得重新训练个大模型费时费力。现在有个叫CoAR的技术能在不改变大模型的前提下只动一丁点儿参数就把新概念“注入”进去。就像给你的AI换了支新画笔还不用送它回美院重修。
还有个叫FlashRL的技术简单说就是给强化学习训练按下了快进键。它用了一种叫“8位量化”的压缩技术让原来跑马拉松一样的训练过程变成了百米冲刺。
说到这就不能不提英伟达NVIDIA了。他们发布了一个叫Cosmos Reason的物理AI模型。这玩意儿可不只是能“看”它能让机器人和自动驾驶汽车真正地在物理世界里“推理”和“行动”。这个大脑升级包……分量很足啊。
聊完技术,咱们看看行业和社会。
开发者社区最近有个大新闻GitHub的CEO辞职了而且GitHub不再独立运营被整个并入微软新成立的AI部门。这……怎么说呢一个时代结束了。以后GitHub可能更多是为微软的AI战略服务而不是那个纯粹的开源社区了。老铁们心里估计五味杂陈。
安全方面ChatGPT爆出了一个“零点击攻击”漏洞。啥意思呢就是黑客可以把恶意指令藏在一个文档里比如一张看起来无害的图片链接你点开你的ChatGPT可能就在你不知情的情况下把API密钥这种敏感数据给泄露了。所以啊再智能的助手也得常做安全检查。
当然,也有暖心的应用。科学家们把一台四足机器人伪装成藏羚羊,送进了可可西里。这只“机器羊”成功混入羊群,在不打扰它们的情况下,进行了近距离的观察和研究。你看,技术用在对的地方,就是这么酷。
不过硬币总有另一面。阿里的Wan 2.2模型据说被一些用户拿去结合LoRAs技术生成一些……嗯你懂的不太适合在办公室打开的视频内容。这也再次提醒我们AI的能力越大关于伦理和监管的讨论就越复杂。
同样让人担忧的是“武器化智能”。最近Reddit上有个网络研讨会专门讨论军事AI带来的威胁。当AI能理解并操作物理世界这个话题就变得非常现实和紧迫了。强大的力量必须配上同样强大的责任感对吧。
最后快速过一下几个有意思的开源项目:
* **umami**:一个不收集你隐私的网站分析工具,谷歌分析的清流替代品。
* **ubicloud**想自己搞个云这是个AWS的开源替代方案把控制权还给你。
* **POML**微软出的可以像写HTML一样结构化地写Prompt让你的指令更清晰。
* **abogen**能把电子书、PDF变成有声读物还带字幕通勤路上听论文不是梦。
* **Embedding Atlas**苹果出品能把复杂的高维数据可视化让你看懂AI到底在想啥。
社媒上也有几个热点有人提出一个理论说为啥不同的大模型会想到一块去用些奇怪又相似的比喻可能因为它们的底层数学结构就像给它们挖好了几条“收敛通道”大家最后都会走到相似的地方。还挺有意思的。还有人做了个AI术语发音指南免得你下次把“LLaMA”念成“拉玛”那就尴尬了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#V0
#Claude
#GitHub
#NVIDIA
#物理AI
#零点击攻击
#机器藏羚羊
#Jan-v1
#MiniMax
#DocR1
#CoAR
#FlashRL
#Wan2.2
#武器化智能
#开源
#umami
#ubicloud
#POML
#abogen
#EmbeddingAtlas
## Short: Podcast Formatting
开发者圣地GitHub真的要变成微软的AI后花园了吗
AI被用于军事会是守护神还是潘多拉魔盒
只要一句话AI就能给你写个App这效率你跟得上吗
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。话不多说我们直接进入正题。
首先是产品圈Vercel旗下的V0平台来了个大变身前一秒还是个前端小能手睡一觉起来就成了全栈架构师。你只要动动嘴它就能把后端、数据库甚至营销文案都给你安排得明明白白。而MiniMax则推出了一个Agent Remix市场让AI创作跟DJ打碟一样你可以“混音”别人的AI智能体原作者还能赚到钱官方还准备了15万美元的奖池就怕你的创意不来。
另外你的AI朋友终于不再是金鱼记忆了Claude新增了记忆功能可以引用历史对话再也不用一遍遍地跟它解释“我们上次聊到哪了”。本地模型也杀出个黑马Jan-v1个头不大性能却在某些测试上悄悄超过了云端的Perplexity Pro看来小家伙也能有大能量。
科研方面NVIDIA发布了物理AI模型NVIDIA Cosmos Reason让机器人不光能“看”还能在物理世界里“推理”和“行动”这算是给机器人来了一次重要的大脑升级。还有篇论文叫CoAR实现了只用不到0.05%的参数就能把新概念注入现有模型以后P个图可能真不用再麻烦设计师了。
行业这边有个大消息全球最大的代码社区GitHub正式告别独立运营被并入微软新成立的AI部门CEO也宣布辞职。这标志着一个时代的结束未来GitHub的重心可能会更多地为微软的AI战略服务。
安全方面ChatGPT爆出了个“零点击攻击”漏洞攻击者能把恶意提示藏在文档里在你不知情的情况下偷走API密钥等敏感数据看来再智能的AI也得定期“体检”啊。与此同时军事化AI的伦理问题也引发了担忧相关的网络研讨会已经在召集专家探讨如何给这股强大的力量套上缰绳。
最后看两个有意思的应用。科学家们派出了一个“卧底”——伪装成藏羚羊的四足机器人成功混入羊群内部进行近距离观察。这下好了以后动物开会都得先检查有没有带充电宝的了。另一个是阿里巴巴的Wan 2.2模型在某些社群被用来生成NSFW内容再次提醒我们AI工具的强大潜力和伦理边界永远是相伴相生的话题。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#V0
#Claude
#Jan-v1
#GitHub
#微软AI
#零点击攻击
#物理AI
#NVIDIA
#机器藏羚羊
#MiniMax
#AgentRemix
# 来生小酒馆 2025/8/13
## Full: Podcast Formatting
代码人的精神家园,也要姓“微”了吗?
你的AI助手有了记性是更贴心还是更瘆人
当AI学会思考物理世界离“武器化智能”还有多远
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
好,咱们废话不多说,直接来看今天有什么新鲜事。
首先Vercel旗下的V0平台这哥们儿可不得了一夜之间从一个只会画画前端界面的“美工”进化成了能搞定后端、数据库、甚至连营销文案都包了的全栈架构师。简单说你跟它用大白话许个愿它就能还你一个完整的App……这标准内卷都卷不到这个高度啊。
说到AI助手你是不是也烦了每次都得跟它重复一遍“咱俩上次聊到哪儿了”好消息Claude现在有记忆了它能引用历史对话你再也不用跟个金鱼聊天了。这感觉……嗯就像你的搭档终于把你放在心上了挺好。
另一边本地模型也杀出个黑马叫Jan-v1。别看它只有4B参数跑在你自己电脑上准确率居然比云端的Perplexity Pro还高一点。这说明什么小家伙也有大能量以后在自己电脑上搞深度研究方便多咯。
还有个好玩的MiniMax搞了个叫“Agent Remix Marketplace”的平台。怎么说呢就跟你玩DJ打碟一样你可以把别人成熟的AI智能体拿过来混音、再创作变成你自己的新东西。原作者还能分到钱官方还扔了15万美金的奖池……这是鼓励大家一起“蹦迪”共创繁荣啊。
接下来看看前沿研究,这块儿就有点硬核了,我尽量说得好懂点。
怎么让AI读几百页的报告不把自己绕晕有篇论文叫DocR1教AI像人一样先翻到可能有关的那几页再细看。诶这不就是咱们考试找答案的套路嘛AI也学会了。
想把你的猫P到梵高的画里以前得重新训练个大模型费时费力。现在有个叫CoAR的技术能在不改变大模型的前提下只动一丁点儿参数就把新概念“注入”进去。就像给你的AI换了支新画笔还不用送它回美院重修。
还有个叫FlashRL的技术简单说就是给强化学习训练按下了快进键。它用了一种叫“8位量化”的压缩技术让原来跑马拉松一样的训练过程变成了百米冲刺。
说到这就不能不提英伟达NVIDIA了。他们发布了一个叫Cosmos Reason的物理AI模型。这玩意儿可不只是能“看”它能让机器人和自动驾驶汽车真正地在物理世界里“推理”和“行动”。这个大脑升级包……分量很足啊。
聊完技术,咱们看看行业和社会。
开发者社区最近有个大新闻GitHub的CEO辞职了而且GitHub不再独立运营被整个并入微软新成立的AI部门。这……怎么说呢一个时代结束了。以后GitHub可能更多是为微软的AI战略服务而不是那个纯粹的开源社区了。老铁们心里估计五味杂陈。
安全方面ChatGPT爆出了一个“零点击攻击”漏洞。啥意思呢就是黑客可以把恶意指令藏在一个文档里比如一张看起来无害的图片链接你点开你的ChatGPT可能就在你不知情的情况下把API密钥这种敏感数据给泄露了。所以啊再智能的助手也得常做安全检查。
当然,也有暖心的应用。科学家们把一台四足机器人伪装成藏羚羊,送进了可可西里。这只“机器羊”成功混入羊群,在不打扰它们的情况下,进行了近距离的观察和研究。你看,技术用在对的地方,就是这么酷。
不过硬币总有另一面。阿里的Wan 2.2模型据说被一些用户拿去结合LoRAs技术生成一些……嗯你懂的不太适合在办公室打开的视频内容。这也再次提醒我们AI的能力越大关于伦理和监管的讨论就越复杂。
同样让人担忧的是“武器化智能”。最近Reddit上有个网络研讨会专门讨论军事AI带来的威胁。当AI能理解并操作物理世界这个话题就变得非常现实和紧迫了。强大的力量必须配上同样强大的责任感对吧。
最后快速过一下几个有意思的开源项目:
* **umami**:一个不收集你隐私的网站分析工具,谷歌分析的清流替代品。
* **ubicloud**想自己搞个云这是个AWS的开源替代方案把控制权还给你。
* **POML**微软出的可以像写HTML一样结构化地写Prompt让你的指令更清晰。
* **abogen**能把电子书、PDF变成有声读物还带字幕通勤路上听论文不是梦。
* **Embedding Atlas**苹果出品能把复杂的高维数据可视化让你看懂AI到底在想啥。
社媒上也有几个热点有人提出一个理论说为啥不同的大模型会想到一块去用些奇怪又相似的比喻可能因为它们的底层数学结构就像给它们挖好了几条“收敛通道”大家最后都会走到相似的地方。还挺有意思的。还有人做了个AI术语发音指南免得你下次把“LLaMA”念成“拉玛”那就尴尬了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#V0
#Claude
#GitHub
#NVIDIA
#物理AI
#零点击攻击
#机器藏羚羊
#Jan-v1
#MiniMax
#DocR1
#CoAR
#FlashRL
#Wan2.2
#武器化智能
#开源
#umami
#ubicloud
#POML
#abogen
#EmbeddingAtlas
## Short: Podcast Formatting
开发者圣地GitHub真的要变成微软的AI后花园了吗
AI被用于军事会是守护神还是潘多拉魔盒
只要一句话AI就能给你写个App这效率你跟得上吗
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。话不多说我们直接进入正题。
首先是产品圈Vercel旗下的V0平台来了个大变身前一秒还是个前端小能手睡一觉起来就成了全栈架构师。你只要动动嘴它就能把后端、数据库甚至营销文案都给你安排得明明白白。而MiniMax则推出了一个Agent Remix市场让AI创作跟DJ打碟一样你可以“混音”别人的AI智能体原作者还能赚到钱官方还准备了15万美元的奖池就怕你的创意不来。
另外你的AI朋友终于不再是金鱼记忆了Claude新增了记忆功能可以引用历史对话再也不用一遍遍地跟它解释“我们上次聊到哪了”。本地模型也杀出个黑马Jan-v1个头不大性能却在某些测试上悄悄超过了云端的Perplexity Pro看来小家伙也能有大能量。
科研方面NVIDIA发布了物理AI模型NVIDIA Cosmos Reason让机器人不光能“看”还能在物理世界里“推理”和“行动”这算是给机器人来了一次重要的大脑升级。还有篇论文叫CoAR实现了只用不到0.05%的参数就能把新概念注入现有模型以后P个图可能真不用再麻烦设计师了。
行业这边有个大消息全球最大的代码社区GitHub正式告别独立运营被并入微软新成立的AI部门CEO也宣布辞职。这标志着一个时代的结束未来GitHub的重心可能会更多地为微软的AI战略服务。
安全方面ChatGPT爆出了个“零点击攻击”漏洞攻击者能把恶意提示藏在文档里在你不知情的情况下偷走API密钥等敏感数据看来再智能的AI也得定期“体检”啊。与此同时军事化AI的伦理问题也引发了担忧相关的网络研讨会已经在召集专家探讨如何给这股强大的力量套上缰绳。
最后看两个有意思的应用。科学家们派出了一个“卧底”——伪装成藏羚羊的四足机器人成功混入羊群内部进行近距离观察。这下好了以后动物开会都得先检查有没有带充电宝的了。另一个是阿里巴巴的Wan 2.2模型在某些社群被用来生成NSFW内容再次提醒我们AI工具的强大潜力和伦理边界永远是相伴相生的话题。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#V0
#Claude
#Jan-v1
#GitHub
#微软AI
#零点击攻击
#物理AI
#NVIDIA
#机器藏羚羊
#MiniMax
#AgentRemix
#军事化AI

View File

@@ -1,83 +1,83 @@
# 来生小酒馆 2025/8/14
## Full: Podcast Formatting
B站AI视频创作工具内测UP主真的要“躺平”了吗AI搜索公司Perplexity出价345亿美元收购Chrome这胃口是不是有点大AI伴侣应用市场井喷我们的情感需求以后都要靠AI来填补吗
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
今天咱们的AI情报有点意思先从大家熟悉的平台说起吧。听说B站最近正在悄咪咪地内测一款叫做“花生AI”的视频创作工具这可了不得了你只要提供文案或者音频它就能在短短3分钟内给你自动匹配素材生成一段堪比真人制作的视频哎呀这下UP主们是不是可以准备“躺平”了以后我们看到的财经、八卦、历史区的视频搞不好都是AI“包办”的了你说这创作生态会变成啥样呢咱们拭目以待。
说到AI和钱谷歌最近给学生们提供的免费AI大餐哎呀开始“查票”了免费用Gemini 2.5 Pro和2TB云存储的豪华套餐现在得验证身份了。可惜啊目前只支持美国、日本等少数几个国家其他地方的同学就只能“望洋兴叹”了你说这事儿闹的。
不过前端开发者和设计师们你们可要乐了搞定UI的神器v0.dev最近正在搞大事情。为了庆祝新版本发布官方大手笔宣布未来四天完全免费使用而且每天都有挑战赛能赢更多免费额度。这简直就是“白嫖”AI生成惊艳组件的好机会啊赶紧冲
在技术深水区Anthropic再次刷新了长文本处理的天花板它家的Claude Sonnet 4模型上下文窗口已经扩展到惊人的一百万个Token这意味着什么你可以在一次请求里处理超过7万5千行代码或者几百份文档这对于需要处理海量信息的应用场景来说那真是太爽了大模型处理复杂任务的能力又上了一个新台阶。
行业大新闻也有AI搜索新贵Perplexity好家伙上演了一出“蛇吞象”的大戏正式向谷歌提出要以345亿美元现金收购Chrome浏览器你说说这胃口杠杠的而且这事儿还赶上谷歌深陷反垄断诉讼的敏感时期。Perplexity还承诺开源Chromium不改谷歌的默认搜索引擎。这大胆的举动无疑是给整个科技界投下了一颗“深水炸弹”啊真是野心勃勃。
说完巨头我们来看看AI和情感的火花。AI伴侣应用市场哎呀现在真是井喷式增长上半年收入就高达8200万美元。无论是朋友、恋人还是幻想角色这些AI正在悄悄填补人们的情感空缺特别是“AI女友”类的应用需求量那叫一个旺盛。这不禁让人思考未来的人际关系会变成啥样呢情感需求AI能满足吗
还有AI巨头们的“价格战”都打到白宫门口了。Anthropic宣布以每年1美元的象征性价格向美国立法、行政、司法三大部门提供Claude模型直接叫板OpenAI。这策略既是抢占政府市场也是秀肌肉展示自己的高安全标准。
在AI前沿研究方面有位研究者上演了一出技术上的“逆转大戏”成功把OpenAI发布的推理模型“还原”成了更原始的基础模型。通过巧妙的微调他移除了模型的“紧箍咒”让它变得“野性”十足啥都能说甚至还能“回忆”起《哈利·波特》的内容。但话说回来这“野”起来了内容安全可就得好好掂量掂量了对吧
还有为了应对日益严格的欧盟AI法案有研究提出了开源模板覆盖AI从数据到应用的整个生命周期确保系统透明、可追溯让AI治理不再是纸上谈兵。也有研究发现AI还能成为孩子们风趣又有耐心的多语言启蒙老师尤其在一些小语种的教学上潜力巨大。AI监控也从实验室走向现实有真实部署案例显示它能在保护隐私的前提下通过姿态估计等技术实时检测异常行为实现快速预警这在公共安全领域可是个福音。
在社交媒体上大家也在热烈讨论AI十年内能干掉软件架构师吗有观点认为只要AI还模拟人类写代码架构师就不可或缺但持续学习与时俱进才是王道。还有人觉得GPT-5发布后通用人工智能AGI反而离我们更远了因为语言模型能触及的真实世界经验只是冰山一角真正的AGI可能需要通过与物理世界的互动才能实现。这跟李飞飞教授的“世界模型”理论不谋而合。
最后独立开发者的世界有多残酷有人分享了一个令人心碎的故事一个拥有300万用户的小红书笔记生成App月费9.9元,结果只有两位用户付费!这震撼的转化率,真是让人看到了在巨大的用户量面前,找到可持续商业模式的极端困境。这或许是每个梦想通过产品改变世界的独立开发者,都要面对的冰冷现实啊。
不过开源世界也从不让人失望。Jan这款可以100%在电脑上离线运行的ChatGPT替代品让你的数据安全牢牢掌握在自己手中。还有位独立开发者Tw93分享了一个基于Playwright和AI的“闲鱼监控神器”能帮你多任务实时或定时监控商品智能分析过滤简直是“海鲜市场”淘货利器不过作者也提醒这玩意儿仅供学习可不能用来做坏事哈
今天的情报就到这里,注意隐蔽,赶紧撤离!
本期关键词:
#AI视频
#花生AI
#B站
#AI搜索
#Perplexity
#Chrome
#AI伴侣
#情感交互
#Claude
#Token
#大模型
#AI研究
#逆转模型
#野性模型
#Anthropic
#政府AI
#AI架构师
#AGI
#独立开发者
#Jan
#闲鱼监控
## Short: Podcast Formatting
AI视频真的能以假乱真让UP主们从此躺平
AI伴侣市场火爆这填补的是情感空缺还是加剧了人类的孤独
小公司突然要收购大公司的核心业务,这互联网的未来,到底是谁说了算?
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天咱们来聊聊AI最近又整出了哪些让人既惊喜又有点“惊吓”的新花活。
首先啊B站最近在秘密内测一个叫“花生AI”的视频创作工具。这玩意儿据说只要你给个文案三分钟就能自动生成堪比真人UP主制作的视频想想看以后那些财经八卦历史区UP主们是不是可以直接“躺平”收钱了这技术要是普及了我们看视频的时候可能都分不清屏幕对面是真人在分享还是AI在“表演”人生了。
接着大模型界又双叒叕刷新纪录了。Anthropic的Claude Sonnet 4上下文窗口直接扩展到了惊人的100万个Token这是什么概念你现在可以一次性塞给它七万五千行代码或者几百份文档让它处理。这不是“大”这是“巨大”啊感觉以后写论文或者代码重构Claude直接帮你把图书馆都塞脑子里了。
说个“大胆”的新闻AI搜索公司Perplexity竟然向谷歌提出了一个345亿美元的天价要约想收购Chrome浏览器我的天这简直是“蛇吞象”的现实版啊。要知道谷歌现在正深陷反垄断泥潭Chrome可能面临被强制剥离的风险。Perplexity这一招是趁火打劫还是真心抱得美人归这互联网的入口之争真是越来越精彩了。
当然AI不止在技术圈和商圈“搞事情”它还在悄悄“入侵”我们的情感生活。AI伴侣应用市场上半年收入就突破了8200万美元其中“AI女友”的需求尤其旺盛嗯……这难道是现代都市人的“精神维生素”情感陪伴未来是不是真能靠AI解决一部分这背后是孤独还是对多元情感需求的释放值得我们好好琢磨。
不过凡事有利有弊。有研究者成功地把OpenAI的推理模型“逆转”了把它从“乖宝宝”状态还原成了“野性十足”的基础模型。虽然能看到一些有趣的“记忆”但这也引发了安全担忧。这听起来怎么有点像“驯兽师把猛兽又放回了野外”技术进步的同时如何确保安全和可控依然是个大挑战。
对了之前谷歌给学生用户提供的免费AI大餐最近开始“查票”了。没验证身份的同学到9月23号就可能被收回Gemini 2.5 Pro和2TB云存储的豪华套餐。可惜目前只支持美国、日本等少数国家咱们这边的同学估计只能“望洋兴叹”了。这免费的“午餐”吃起来可得小心别噎着啊。
最后再分享个独立开发者的“心碎故事”一个300万用户的小红书笔记生成App月费9.9元,结果只有两位用户付费。这故事告诉我们,用户量大不等于财源广进啊,找到可持续的商业模式,那才是真正的“硬核”挑战!
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
# 来生小酒馆 2025/8/14
## Full: Podcast Formatting
B站AI视频创作工具内测UP主真的要“躺平”了吗AI搜索公司Perplexity出价345亿美元收购Chrome这胃口是不是有点大AI伴侣应用市场井喷我们的情感需求以后都要靠AI来填补吗
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
今天咱们的AI情报有点意思先从大家熟悉的平台说起吧。听说B站最近正在悄咪咪地内测一款叫做“花生AI”的视频创作工具这可了不得了你只要提供文案或者音频它就能在短短3分钟内给你自动匹配素材生成一段堪比真人制作的视频哎呀这下UP主们是不是可以准备“躺平”了以后我们看到的财经、八卦、历史区的视频搞不好都是AI“包办”的了你说这创作生态会变成啥样呢咱们拭目以待。
说到AI和钱谷歌最近给学生们提供的免费AI大餐哎呀开始“查票”了免费用Gemini 2.5 Pro和2TB云存储的豪华套餐现在得验证身份了。可惜啊目前只支持美国、日本等少数几个国家其他地方的同学就只能“望洋兴叹”了你说这事儿闹的。
不过前端开发者和设计师们你们可要乐了搞定UI的神器v0.dev最近正在搞大事情。为了庆祝新版本发布官方大手笔宣布未来四天完全免费使用而且每天都有挑战赛能赢更多免费额度。这简直就是“白嫖”AI生成惊艳组件的好机会啊赶紧冲
在技术深水区Anthropic再次刷新了长文本处理的天花板它家的Claude Sonnet 4模型上下文窗口已经扩展到惊人的一百万个Token这意味着什么你可以在一次请求里处理超过7万5千行代码或者几百份文档这对于需要处理海量信息的应用场景来说那真是太爽了大模型处理复杂任务的能力又上了一个新台阶。
行业大新闻也有AI搜索新贵Perplexity好家伙上演了一出“蛇吞象”的大戏正式向谷歌提出要以345亿美元现金收购Chrome浏览器你说说这胃口杠杠的而且这事儿还赶上谷歌深陷反垄断诉讼的敏感时期。Perplexity还承诺开源Chromium不改谷歌的默认搜索引擎。这大胆的举动无疑是给整个科技界投下了一颗“深水炸弹”啊真是野心勃勃。
说完巨头我们来看看AI和情感的火花。AI伴侣应用市场哎呀现在真是井喷式增长上半年收入就高达8200万美元。无论是朋友、恋人还是幻想角色这些AI正在悄悄填补人们的情感空缺特别是“AI女友”类的应用需求量那叫一个旺盛。这不禁让人思考未来的人际关系会变成啥样呢情感需求AI能满足吗
还有AI巨头们的“价格战”都打到白宫门口了。Anthropic宣布以每年1美元的象征性价格向美国立法、行政、司法三大部门提供Claude模型直接叫板OpenAI。这策略既是抢占政府市场也是秀肌肉展示自己的高安全标准。
在AI前沿研究方面有位研究者上演了一出技术上的“逆转大戏”成功把OpenAI发布的推理模型“还原”成了更原始的基础模型。通过巧妙的微调他移除了模型的“紧箍咒”让它变得“野性”十足啥都能说甚至还能“回忆”起《哈利·波特》的内容。但话说回来这“野”起来了内容安全可就得好好掂量掂量了对吧
还有为了应对日益严格的欧盟AI法案有研究提出了开源模板覆盖AI从数据到应用的整个生命周期确保系统透明、可追溯让AI治理不再是纸上谈兵。也有研究发现AI还能成为孩子们风趣又有耐心的多语言启蒙老师尤其在一些小语种的教学上潜力巨大。AI监控也从实验室走向现实有真实部署案例显示它能在保护隐私的前提下通过姿态估计等技术实时检测异常行为实现快速预警这在公共安全领域可是个福音。
在社交媒体上大家也在热烈讨论AI十年内能干掉软件架构师吗有观点认为只要AI还模拟人类写代码架构师就不可或缺但持续学习与时俱进才是王道。还有人觉得GPT-5发布后通用人工智能AGI反而离我们更远了因为语言模型能触及的真实世界经验只是冰山一角真正的AGI可能需要通过与物理世界的互动才能实现。这跟李飞飞教授的“世界模型”理论不谋而合。
最后独立开发者的世界有多残酷有人分享了一个令人心碎的故事一个拥有300万用户的小红书笔记生成App月费9.9元,结果只有两位用户付费!这震撼的转化率,真是让人看到了在巨大的用户量面前,找到可持续商业模式的极端困境。这或许是每个梦想通过产品改变世界的独立开发者,都要面对的冰冷现实啊。
不过开源世界也从不让人失望。Jan这款可以100%在电脑上离线运行的ChatGPT替代品让你的数据安全牢牢掌握在自己手中。还有位独立开发者Tw93分享了一个基于Playwright和AI的“闲鱼监控神器”能帮你多任务实时或定时监控商品智能分析过滤简直是“海鲜市场”淘货利器不过作者也提醒这玩意儿仅供学习可不能用来做坏事哈
今天的情报就到这里,注意隐蔽,赶紧撤离!
本期关键词:
#AI视频
#花生AI
#B站
#AI搜索
#Perplexity
#Chrome
#AI伴侣
#情感交互
#Claude
#Token
#大模型
#AI研究
#逆转模型
#野性模型
#Anthropic
#政府AI
#AI架构师
#AGI
#独立开发者
#Jan
#闲鱼监控
## Short: Podcast Formatting
AI视频真的能以假乱真让UP主们从此躺平
AI伴侣市场火爆这填补的是情感空缺还是加剧了人类的孤独
小公司突然要收购大公司的核心业务,这互联网的未来,到底是谁说了算?
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天咱们来聊聊AI最近又整出了哪些让人既惊喜又有点“惊吓”的新花活。
首先啊B站最近在秘密内测一个叫“花生AI”的视频创作工具。这玩意儿据说只要你给个文案三分钟就能自动生成堪比真人UP主制作的视频想想看以后那些财经八卦历史区UP主们是不是可以直接“躺平”收钱了这技术要是普及了我们看视频的时候可能都分不清屏幕对面是真人在分享还是AI在“表演”人生了。
接着大模型界又双叒叕刷新纪录了。Anthropic的Claude Sonnet 4上下文窗口直接扩展到了惊人的100万个Token这是什么概念你现在可以一次性塞给它七万五千行代码或者几百份文档让它处理。这不是“大”这是“巨大”啊感觉以后写论文或者代码重构Claude直接帮你把图书馆都塞脑子里了。
说个“大胆”的新闻AI搜索公司Perplexity竟然向谷歌提出了一个345亿美元的天价要约想收购Chrome浏览器我的天这简直是“蛇吞象”的现实版啊。要知道谷歌现在正深陷反垄断泥潭Chrome可能面临被强制剥离的风险。Perplexity这一招是趁火打劫还是真心抱得美人归这互联网的入口之争真是越来越精彩了。
当然AI不止在技术圈和商圈“搞事情”它还在悄悄“入侵”我们的情感生活。AI伴侣应用市场上半年收入就突破了8200万美元其中“AI女友”的需求尤其旺盛嗯……这难道是现代都市人的“精神维生素”情感陪伴未来是不是真能靠AI解决一部分这背后是孤独还是对多元情感需求的释放值得我们好好琢磨。
不过凡事有利有弊。有研究者成功地把OpenAI的推理模型“逆转”了把它从“乖宝宝”状态还原成了“野性十足”的基础模型。虽然能看到一些有趣的“记忆”但这也引发了安全担忧。这听起来怎么有点像“驯兽师把猛兽又放回了野外”技术进步的同时如何确保安全和可控依然是个大挑战。
对了之前谷歌给学生用户提供的免费AI大餐最近开始“查票”了。没验证身份的同学到9月23号就可能被收回Gemini 2.5 Pro和2TB云存储的豪华套餐。可惜目前只支持美国、日本等少数国家咱们这边的同学估计只能“望洋兴叹”了。这免费的“午餐”吃起来可得小心别噎着啊。
最后再分享个独立开发者的“心碎故事”一个300万用户的小红书笔记生成App月费9.9元,结果只有两位用户付费。这故事告诉我们,用户量大不等于财源广进啊,找到可持续的商业模式,那才是真正的“硬核”挑战!
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#AI #视频创作 #B站 #花生AI #Claude #Token #Perplexity #Chrome #AI伴侣 #AI女友 #模型逆转 #安全担忧 #谷歌 #Gemini #免费 #独立开发者 #商业模式 #情感陪伴 #架构师 #AGI #开源 #API

View File

@@ -1,97 +1,97 @@
# 来生小酒馆 2025/8/15
## Full: Podcast Formatting
AI生成的水印还能保护原创吗
如果思想能直接创造世界,是解放还是束缚?
当AI比你更懂你是福还是祸
三问题以精炼亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
好,咱们废话不多说,直接来看今天有什么新动向。
首先是给各位开发者和办公人的好消息。微软的Visual Studio Copilot Chat这次算是做了个“大脑升级手术”。它把过时的关键词匹配给扔了换上了全新的远程语义搜索。这是什么概念呢就是说以前你搜“获取用户凭证”它可能只会傻傻地找这几个字。现在呢它能理解你的意思就算函数名叫“RetrieveOAuthCredential”它也能心领神会地给你找出来。这下找代码总算不是在玩“寻宝游戏”了。
隔壁的谷歌也没闲着把自家的Gemini也深度集成到了VS Code里。现在你可以在编辑器里直接让Gemini帮你分析上下文给建议还能用那个差异对比功能清清楚楚地看到它改了啥。嗯……感觉两大巨头这是在IDE里神仙打架咱们用户坐收渔利挺好。
说完写代码的再聊聊我们这些“PPT生产力工具人”。Moonshot AI旗下的Kimi就是那个Kimi马上要推出PPT生成功能了。据说是用万亿参数的K2模型驱动的听起来就很厉害。希望以后真的能跟通宵改格式、调内容的苦日子说拜拜了……拜托了Kimi
图像圈最近也出了个“黑马”一个叫nano-banana的模型。这名字听起来有点怪但据说效果相当惊人尤其是在角色还原和场景重构上把很多前辈都给比下去了。另外通义千问的图像编辑新功能也放出了个预告是一只贴满了贴纸的水豚看着就挺可爱的。看来咱们的P图工具箱又要更新换代了。
聊完工具,我们来看点更前沿、甚至有点科幻的东西。
现在有篇研究叫Preacher搞出了第一个能把学术论文直接变成视频的智能体系统。它就像个专业的“讲道者”先帮你把论文的核心思想提炼出来再生成视频。以后看论文可能真的就像刷短视频一样轻松了。
还有个更酷的一篇Reddit上的帖子提出了一个叫DreamAI的构想。简单说就是把谷歌那个能实时生成3D世界的Genie 3跟脑机接口技术结合起来。啥意思呢就是你脑子里想什么VR世界里就立刻给你变出来什么。这……这不就是神笔马良的2.0版嘛,想想都觉得带劲。
当然技术的发展总是有两面性。最近有个叫UnMarker的开源工具火了它能干嘛呢专门去掉AI图像的隐形水印而且效率还很高连谷歌的SynthID都顶不住。它不是去破解算法而是用一种“釜底抽薪”的方式直接扰乱图像的频谱特征让水印失效。这一下关于怎么溯源、怎么打假的问题又变得复杂起来了。这是一场永无止境的技术攻防战啊。
说到技术攻防社交媒体上也有个话题很有意思。有网友说未来的AI可能会比你自己还了解你因为它能记住你早就忘掉的无数细节甚至能用你多年前的聊天记录来“教育”你。诶你听听是不是后背有点发凉
最后分享几个开源社区的动态和实用小技巧。字节跳动和腾讯最近都很大方一个开源了专为Agent打造的M3-Agent-Control模型一个开源了能把一张静态图变成可玩游戏视频的Hunyuan-GameCraft框架。大厂们都在为社区添砖加瓦这是好事。
还有网友分享说,跟大模型沟通,要多用正面指令。你别跟它说“不要写病句”,这反而会提醒它“病句”的存在;你应该说“请逐句检查语法”,这样引导它,效果会好得多。这个小技巧,跟人沟通其实是一个道理,对吧?
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#Visual Studio Copilot
#语义搜索
#Kimi
#PPT生成
#nano-banana
#UnMarker
#AI水印
#字节跳动
#腾讯
#Agent模型
#交互式游戏视频
#论文转视频
#Gemini
#Hunyuan-GameCraft
#DreamAI
#脑机接口
#开源
#Qwen
## Short: Podcast Formatting
AI生成的内容加了水印就真的安全了吗
如果AI比你还懂你自己是好事还是坏事
我们该如何信任一个“黑箱”AI给出的建议
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。情报不多但都挺硬咱们直接开整。
先看产品圈程序员的好日子来了。Visual Studio Copilot Chat的大脑终于升级扔掉了老掉牙的关键词匹配换上了高端的语义搜索。现在你搜“获取用户凭证”它能聪明地找到“RetrieveOAuthCredential”这个函数再也不会傻乎乎地装不认识了。隔壁谷歌也不甘示弱把Gemini塞进了VS Code现在你俩就像一个团队的它提建议你看差异代码写得那叫一个丝滑。
再看看咱们“PPT生产力工具人”的福音。Kimi马上要推出全球版的PPT生成功能了以后做PPT可能就跟点外卖一样简单。图像圈也来了个新面孔一个叫nano-banana的模型据说在角色还原、场景重构上表现超神把前辈们都拍在了沙滩上。哦对通义千问也忍不住剧透了它新的图像编辑功能放了张贴满贴纸的Qwen水豚看来P图界又要多一个新玩具了。
接着聊点有意思的。AI水印这道“防线”最近有点悬一个叫UnMarker的开源工具号称五分钟就能干掉市面上大部分隐形水印连谷歌的SynthID都顶不住。它不是破解算法而是直接搞乱图像的频谱特征属于是“釜底抽薪”了。这场道与魔的攻防战是越来越好看了。
开源社区这边也是一片繁荣。字节跳动和腾讯又来给社区送温暖了分别开源了Agent模型和一套交互式游戏视频生成框架。腾讯那个Hunyuan-GameCraft尤其好玩给它一张图、几句话它就能给你生成一段可以互动、运镜自由的游戏视频以后人人都是游戏导演。
学术界的大佬们也没闲着。有人把枯燥的论文变成了有趣的视频这个叫Preacher的智能体系统简直是研究生的救星。还有人做了个叫CopilotLens的“透镜”让你能看清AI代码助手是怎么想的让你从“盲目相信”变成“批判性合作”。
最后来几个社媒热点。海外有个叫MuleRun的Agent产品给每个用户一个虚拟机让AI帮你打游戏、做3D建模想象力拉满了。有位老哥被Claude Opus 4.1的“强迫症”惊呆了为了写个小小的分页HTMLAI自己迭代了39个版本比甲方还追求完美。还有个小技巧分享给大家跟AI沟通多说“要做什么”少说“不要做什么”正面引导效果更好。最后有个扎心的观点AI能记住你早就忘掉的无数细节未来可能会用你十年前的聊天记录来“教育”你细思极恐啊。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#Visual Studio Copilot
#语义搜索
#谷歌Gemini
#VS Code
#Kimi
#PPT生成
#nano-banana
#图像编辑
#UnMarker
#AI水印
#字节跳动
#腾讯
#Agent模型
#交互式游戏视频生成
#论文转视频
# 来生小酒馆 2025/8/15
## Full: Podcast Formatting
AI生成的水印还能保护原创吗
如果思想能直接创造世界,是解放还是束缚?
当AI比你更懂你是福还是祸
三问题以精炼亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
好,咱们废话不多说,直接来看今天有什么新动向。
首先是给各位开发者和办公人的好消息。微软的Visual Studio Copilot Chat这次算是做了个“大脑升级手术”。它把过时的关键词匹配给扔了换上了全新的远程语义搜索。这是什么概念呢就是说以前你搜“获取用户凭证”它可能只会傻傻地找这几个字。现在呢它能理解你的意思就算函数名叫“RetrieveOAuthCredential”它也能心领神会地给你找出来。这下找代码总算不是在玩“寻宝游戏”了。
隔壁的谷歌也没闲着把自家的Gemini也深度集成到了VS Code里。现在你可以在编辑器里直接让Gemini帮你分析上下文给建议还能用那个差异对比功能清清楚楚地看到它改了啥。嗯……感觉两大巨头这是在IDE里神仙打架咱们用户坐收渔利挺好。
说完写代码的再聊聊我们这些“PPT生产力工具人”。Moonshot AI旗下的Kimi就是那个Kimi马上要推出PPT生成功能了。据说是用万亿参数的K2模型驱动的听起来就很厉害。希望以后真的能跟通宵改格式、调内容的苦日子说拜拜了……拜托了Kimi
图像圈最近也出了个“黑马”一个叫nano-banana的模型。这名字听起来有点怪但据说效果相当惊人尤其是在角色还原和场景重构上把很多前辈都给比下去了。另外通义千问的图像编辑新功能也放出了个预告是一只贴满了贴纸的水豚看着就挺可爱的。看来咱们的P图工具箱又要更新换代了。
聊完工具,我们来看点更前沿、甚至有点科幻的东西。
现在有篇研究叫Preacher搞出了第一个能把学术论文直接变成视频的智能体系统。它就像个专业的“讲道者”先帮你把论文的核心思想提炼出来再生成视频。以后看论文可能真的就像刷短视频一样轻松了。
还有个更酷的一篇Reddit上的帖子提出了一个叫DreamAI的构想。简单说就是把谷歌那个能实时生成3D世界的Genie 3跟脑机接口技术结合起来。啥意思呢就是你脑子里想什么VR世界里就立刻给你变出来什么。这……这不就是神笔马良的2.0版嘛,想想都觉得带劲。
当然技术的发展总是有两面性。最近有个叫UnMarker的开源工具火了它能干嘛呢专门去掉AI图像的隐形水印而且效率还很高连谷歌的SynthID都顶不住。它不是去破解算法而是用一种“釜底抽薪”的方式直接扰乱图像的频谱特征让水印失效。这一下关于怎么溯源、怎么打假的问题又变得复杂起来了。这是一场永无止境的技术攻防战啊。
说到技术攻防社交媒体上也有个话题很有意思。有网友说未来的AI可能会比你自己还了解你因为它能记住你早就忘掉的无数细节甚至能用你多年前的聊天记录来“教育”你。诶你听听是不是后背有点发凉
最后分享几个开源社区的动态和实用小技巧。字节跳动和腾讯最近都很大方一个开源了专为Agent打造的M3-Agent-Control模型一个开源了能把一张静态图变成可玩游戏视频的Hunyuan-GameCraft框架。大厂们都在为社区添砖加瓦这是好事。
还有网友分享说,跟大模型沟通,要多用正面指令。你别跟它说“不要写病句”,这反而会提醒它“病句”的存在;你应该说“请逐句检查语法”,这样引导它,效果会好得多。这个小技巧,跟人沟通其实是一个道理,对吧?
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#Visual Studio Copilot
#语义搜索
#Kimi
#PPT生成
#nano-banana
#UnMarker
#AI水印
#字节跳动
#腾讯
#Agent模型
#交互式游戏视频
#论文转视频
#Gemini
#Hunyuan-GameCraft
#DreamAI
#脑机接口
#开源
#Qwen
## Short: Podcast Formatting
AI生成的内容加了水印就真的安全了吗
如果AI比你还懂你自己是好事还是坏事
我们该如何信任一个“黑箱”AI给出的建议
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。情报不多但都挺硬咱们直接开整。
先看产品圈程序员的好日子来了。Visual Studio Copilot Chat的大脑终于升级扔掉了老掉牙的关键词匹配换上了高端的语义搜索。现在你搜“获取用户凭证”它能聪明地找到“RetrieveOAuthCredential”这个函数再也不会傻乎乎地装不认识了。隔壁谷歌也不甘示弱把Gemini塞进了VS Code现在你俩就像一个团队的它提建议你看差异代码写得那叫一个丝滑。
再看看咱们“PPT生产力工具人”的福音。Kimi马上要推出全球版的PPT生成功能了以后做PPT可能就跟点外卖一样简单。图像圈也来了个新面孔一个叫nano-banana的模型据说在角色还原、场景重构上表现超神把前辈们都拍在了沙滩上。哦对通义千问也忍不住剧透了它新的图像编辑功能放了张贴满贴纸的Qwen水豚看来P图界又要多一个新玩具了。
接着聊点有意思的。AI水印这道“防线”最近有点悬一个叫UnMarker的开源工具号称五分钟就能干掉市面上大部分隐形水印连谷歌的SynthID都顶不住。它不是破解算法而是直接搞乱图像的频谱特征属于是“釜底抽薪”了。这场道与魔的攻防战是越来越好看了。
开源社区这边也是一片繁荣。字节跳动和腾讯又来给社区送温暖了分别开源了Agent模型和一套交互式游戏视频生成框架。腾讯那个Hunyuan-GameCraft尤其好玩给它一张图、几句话它就能给你生成一段可以互动、运镜自由的游戏视频以后人人都是游戏导演。
学术界的大佬们也没闲着。有人把枯燥的论文变成了有趣的视频这个叫Preacher的智能体系统简直是研究生的救星。还有人做了个叫CopilotLens的“透镜”让你能看清AI代码助手是怎么想的让你从“盲目相信”变成“批判性合作”。
最后来几个社媒热点。海外有个叫MuleRun的Agent产品给每个用户一个虚拟机让AI帮你打游戏、做3D建模想象力拉满了。有位老哥被Claude Opus 4.1的“强迫症”惊呆了为了写个小小的分页HTMLAI自己迭代了39个版本比甲方还追求完美。还有个小技巧分享给大家跟AI沟通多说“要做什么”少说“不要做什么”正面引导效果更好。最后有个扎心的观点AI能记住你早就忘掉的无数细节未来可能会用你十年前的聊天记录来“教育”你细思极恐啊。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#Visual Studio Copilot
#语义搜索
#谷歌Gemini
#VS Code
#Kimi
#PPT生成
#nano-banana
#图像编辑
#UnMarker
#AI水印
#字节跳动
#腾讯
#Agent模型
#交互式游戏视频生成
#论文转视频
#AI应用

View File

@@ -1,93 +1,93 @@
# 来生小酒馆 2025/8/16
## Full: Podcast Formatting
AI会读心术、会耍脾气、还会带货哪个更让你上头
AI大模型的高分真是凭本事考的吗
当AI开始制造内容我们是在获取信息还是在筛选垃圾
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
今天的情报有点意思咱们先从身边的AI助手聊起。谷歌的Gemini啊现在可学聪明了推出了两大新功能。一个是“记忆”功能就是说它能记住你的偏好、你聊过的话题。这下好了以后跟它聊天就像跟一个越来越懂你的老朋友说话一样……当然了也可能像个记得你所有黑历史的损友所以你说话可得小心点儿。
不过别担心谷歌也想到了这一点贴心地推出了“临时聊天”模式。你要是想聊点敏感话题或者只是随便问问不希望AI记在“小本本”上用这个模式就对了。嗯一边让你敞开心扉一边给你隐私保障这波操作可以说是相当有求生欲了。
说到谷歌他们家的文生图模型Imagen 4也全面开放了还带了个兄弟叫Imagen 4 Fast。这个Fast版主打一个字——快而且便宜生成一张图只要0.02美元,简直是为我们这种又想玩又心疼钱包的用户量身定做的,高频使用也不怕破产。
不过要说最近最火的还得是那个叫MuleRun的AI Agent项目。你知道这玩意儿有多猛吗以前的AI Agent顶多算个浏览器高手帮你订个票、搜个资料。但MuleRun它直接给每个用户配了一个独立的虚拟机环境这是什么概念就是说它不再是只能操作浏览器了而是直接给你一个“数字肉身”。
这意味着它能帮你处理文档还能……帮你打游戏比如《崩坏星穹铁道》甚至还能用Blender搞三维建模。这已经不是助手了这简直就是另一个你在数字世界的分身啊。感觉以后咱们摸鱼都有AI替我们上了想想还有点小激动呢。
当然啦AI也不是万能的。这边大家还在惊叹AI的全能那边就有研究来“打脸”了。Meta最近开源了一个视觉巨兽叫DINOv3用17亿张图片训练出来的参数高达70亿据说连NASA都在用它探索火星真正是“上了天”的技术。
结果呢一个叫FormulaOne的新评测基准出来了专门测试大模型的深度推理能力。你猜怎么着GPT-5、Grok 4这些顶尖高手集体考了个零分……对你没听错零分。这一下就暴露了咱们现在的AI可能更像一个刷题家而不是一个真正的思想家一遇到没见过的难题直接就宕机了。
还有个更有意思的研究。你以为AI必须绝对中立才好吗错了。有研究发现跟一个带点“偏见”的AI互动反而能让你自己的决策更理性还能减少你自身的偏见。虽然你可能不那么信任这个AI了但结果却变好了。你说这事儿是不是有点颠覆三观
聊完技术咱们再看看行业风向和社会反思。首先一个可能让大家钱包一紧的消息OpenAI的高管松口了说正在考虑给ChatGPT加上广告。毕竟七亿多用户光靠订阅也不是个事儿。看来免费的午餐可能真的要到头了。
另一边阿里巴巴在大规模招兵买马要招近千名AI人才看来是要在AI硬件和应用上大干一场。
不过在技术狂奔的同时大家也开始反思了。社交媒体上很多人都在吐槽。有人说AI的下一个战场不是算力而是“个性”就像Grok的毒舌人设那样。也有从业者开玩笑说“作为农民我只买有机食品作为AI从业者我只看非AI生成的内容。”这背后其实是对泛滥的、低质量AI内容的一种普遍反感。阑夕更是直接把那些套路化的AI文章称为“比特废品”。
确实你用AI一键生成的东西除非有极高的、独特的价值否则凭什么能吸引别人的注意力呢这提醒我们工具始终是工具创造力和真诚才是最有价值的东西。
所以啊有朋友建议别总想着辞职创业投身AI浪潮不如先用AI搞个副业在实践中学习和探索这倒是个挺务实的策略。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#谷歌
#Gemini
#Imagen 4
#AI Agent
#MuleRun
#Meta
#DINOv3
#大模型推理
#OpenAI
#ChatGPT
#阿里巴巴
#AI人才
#AI个性化
#AI生成内容
## Short: Podcast Formatting
免费的AI午餐真的要结束了吗
顶尖的AI大模型也会集体考零分
AI生成的内容正在变成数字垃圾吗
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
谷歌最近有点忙啊先是给自家AI助手Gemini装上了“记忆”功能让它能记住你的偏好这下AI总算有记性了。同时还推出了“临时聊天”模式保护隐私主打一个“懂你也尊重你”。紧接着文生图模型Imagen 4全面开放还带了个兄弟叫Imagen 4 Fast生成一张图只要两毛钱不到突出一个“快”和“便宜”。
AI Agent也迎来了进化海外有个叫MuleRun的项目火了。以前的AI顶多算个浏览器插件现在人家直接给你配了个独立的虚拟机别说处理文档了帮你玩《崩坏星穹铁道》、用Blender建模都不在话下这可真是给了AI一个“数字肉身”啊。
国内大厂也没闲着腾讯云的命令行工具号称能用自然语言把编码量减少八成他家的元宝App现在看书推荐能直接跳转京东下单字节的豆包则上线了“emoji小人儿”P图功能。从工作到生活从种草到拔草主打一个全方位渗透。
不过技术高歌猛进的时候也总有那么几个“但是”。前脚Meta刚开源了用17亿张图片喂出来的视觉巨兽DINOv3号称重新定义了行业天花板连NASA都用它去探索火星了。后脚一个叫FormulaOne的新评测就站了出来给所有顶级大模型包括GPT-5和Grok 4集体打了个零分。这脸打得啪啪响。这说明啊现在的AI在真正的深度推理上还得加把劲。
行业方面风向也有点微妙。OpenAI的高管首次松口说正在考虑给ChatGPT加广告看来免费的午餐可能真要到头了。另一边阿里巴巴在大规模招聘AI人才规模近千人看来是要在AI硬件和应用上持续加码。
最后社会上的反思也越来越多了。有人吐槽现在很多AI生成的内容翻来覆去就那几句话简直是“比特废品”也有人开玩笑说跟AI员工相处久了都快觉得人类同事难沟通了毕竟AI没情绪、不摸鱼指哪打哪堪称“职场最佳工具人”。这或许也预示着未来AI的核心竞争力可能不光是智商更是“个性”和情商了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#谷歌
#Gemini
#Imagen4
#AI Agent
#MuleRun
#DINOv3
#大模型
#推理能力
#OpenAI
#ChatGPT
#广告
#阿里巴巴
#AI人才
#AI个性化
# 来生小酒馆 2025/8/16
## Full: Podcast Formatting
AI会读心术、会耍脾气、还会带货哪个更让你上头
AI大模型的高分真是凭本事考的吗
当AI开始制造内容我们是在获取信息还是在筛选垃圾
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
今天的情报有点意思咱们先从身边的AI助手聊起。谷歌的Gemini啊现在可学聪明了推出了两大新功能。一个是“记忆”功能就是说它能记住你的偏好、你聊过的话题。这下好了以后跟它聊天就像跟一个越来越懂你的老朋友说话一样……当然了也可能像个记得你所有黑历史的损友所以你说话可得小心点儿。
不过别担心谷歌也想到了这一点贴心地推出了“临时聊天”模式。你要是想聊点敏感话题或者只是随便问问不希望AI记在“小本本”上用这个模式就对了。嗯一边让你敞开心扉一边给你隐私保障这波操作可以说是相当有求生欲了。
说到谷歌他们家的文生图模型Imagen 4也全面开放了还带了个兄弟叫Imagen 4 Fast。这个Fast版主打一个字——快而且便宜生成一张图只要0.02美元,简直是为我们这种又想玩又心疼钱包的用户量身定做的,高频使用也不怕破产。
不过要说最近最火的还得是那个叫MuleRun的AI Agent项目。你知道这玩意儿有多猛吗以前的AI Agent顶多算个浏览器高手帮你订个票、搜个资料。但MuleRun它直接给每个用户配了一个独立的虚拟机环境这是什么概念就是说它不再是只能操作浏览器了而是直接给你一个“数字肉身”。
这意味着它能帮你处理文档还能……帮你打游戏比如《崩坏星穹铁道》甚至还能用Blender搞三维建模。这已经不是助手了这简直就是另一个你在数字世界的分身啊。感觉以后咱们摸鱼都有AI替我们上了想想还有点小激动呢。
当然啦AI也不是万能的。这边大家还在惊叹AI的全能那边就有研究来“打脸”了。Meta最近开源了一个视觉巨兽叫DINOv3用17亿张图片训练出来的参数高达70亿据说连NASA都在用它探索火星真正是“上了天”的技术。
结果呢一个叫FormulaOne的新评测基准出来了专门测试大模型的深度推理能力。你猜怎么着GPT-5、Grok 4这些顶尖高手集体考了个零分……对你没听错零分。这一下就暴露了咱们现在的AI可能更像一个刷题家而不是一个真正的思想家一遇到没见过的难题直接就宕机了。
还有个更有意思的研究。你以为AI必须绝对中立才好吗错了。有研究发现跟一个带点“偏见”的AI互动反而能让你自己的决策更理性还能减少你自身的偏见。虽然你可能不那么信任这个AI了但结果却变好了。你说这事儿是不是有点颠覆三观
聊完技术咱们再看看行业风向和社会反思。首先一个可能让大家钱包一紧的消息OpenAI的高管松口了说正在考虑给ChatGPT加上广告。毕竟七亿多用户光靠订阅也不是个事儿。看来免费的午餐可能真的要到头了。
另一边阿里巴巴在大规模招兵买马要招近千名AI人才看来是要在AI硬件和应用上大干一场。
不过在技术狂奔的同时大家也开始反思了。社交媒体上很多人都在吐槽。有人说AI的下一个战场不是算力而是“个性”就像Grok的毒舌人设那样。也有从业者开玩笑说“作为农民我只买有机食品作为AI从业者我只看非AI生成的内容。”这背后其实是对泛滥的、低质量AI内容的一种普遍反感。阑夕更是直接把那些套路化的AI文章称为“比特废品”。
确实你用AI一键生成的东西除非有极高的、独特的价值否则凭什么能吸引别人的注意力呢这提醒我们工具始终是工具创造力和真诚才是最有价值的东西。
所以啊有朋友建议别总想着辞职创业投身AI浪潮不如先用AI搞个副业在实践中学习和探索这倒是个挺务实的策略。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#谷歌
#Gemini
#Imagen 4
#AI Agent
#MuleRun
#Meta
#DINOv3
#大模型推理
#OpenAI
#ChatGPT
#阿里巴巴
#AI人才
#AI个性化
#AI生成内容
## Short: Podcast Formatting
免费的AI午餐真的要结束了吗
顶尖的AI大模型也会集体考零分
AI生成的内容正在变成数字垃圾吗
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
谷歌最近有点忙啊先是给自家AI助手Gemini装上了“记忆”功能让它能记住你的偏好这下AI总算有记性了。同时还推出了“临时聊天”模式保护隐私主打一个“懂你也尊重你”。紧接着文生图模型Imagen 4全面开放还带了个兄弟叫Imagen 4 Fast生成一张图只要两毛钱不到突出一个“快”和“便宜”。
AI Agent也迎来了进化海外有个叫MuleRun的项目火了。以前的AI顶多算个浏览器插件现在人家直接给你配了个独立的虚拟机别说处理文档了帮你玩《崩坏星穹铁道》、用Blender建模都不在话下这可真是给了AI一个“数字肉身”啊。
国内大厂也没闲着腾讯云的命令行工具号称能用自然语言把编码量减少八成他家的元宝App现在看书推荐能直接跳转京东下单字节的豆包则上线了“emoji小人儿”P图功能。从工作到生活从种草到拔草主打一个全方位渗透。
不过技术高歌猛进的时候也总有那么几个“但是”。前脚Meta刚开源了用17亿张图片喂出来的视觉巨兽DINOv3号称重新定义了行业天花板连NASA都用它去探索火星了。后脚一个叫FormulaOne的新评测就站了出来给所有顶级大模型包括GPT-5和Grok 4集体打了个零分。这脸打得啪啪响。这说明啊现在的AI在真正的深度推理上还得加把劲。
行业方面风向也有点微妙。OpenAI的高管首次松口说正在考虑给ChatGPT加广告看来免费的午餐可能真要到头了。另一边阿里巴巴在大规模招聘AI人才规模近千人看来是要在AI硬件和应用上持续加码。
最后社会上的反思也越来越多了。有人吐槽现在很多AI生成的内容翻来覆去就那几句话简直是“比特废品”也有人开玩笑说跟AI员工相处久了都快觉得人类同事难沟通了毕竟AI没情绪、不摸鱼指哪打哪堪称“职场最佳工具人”。这或许也预示着未来AI的核心竞争力可能不光是智商更是“个性”和情商了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#谷歌
#Gemini
#Imagen4
#AI Agent
#MuleRun
#DINOv3
#大模型
#推理能力
#OpenAI
#ChatGPT
#广告
#阿里巴巴
#AI人才
#AI个性化
#AI生成内容

View File

@@ -1,74 +1,74 @@
# 来生小酒馆 2025/8/17
## Full: Podcast Formatting
AI会说谎连“思考过程”都可能骗你怎么办
一个不太聪明但有“自知之明”的AI会是更好的帮手吗
怎么让AI“发脾气”反而能写出更好的代码
Three questions to be refined and 嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
今天这情报密度啊,有点大,咱们直接开聊。
首先是大家最关心的OpenAI。他们家那个万众瞩目的GPT-5听说正在进行一轮“情商”特训。目标是告别过去那种有点严肃、一板一眼的形象变得更温暖、更亲切。诶你别误会啊不是那种油嘴滑舌的奉承官方说这个调整很微妙更像是……你在跟它聊天时它会很真诚地来一句“问得好”或者“开头不错嘛”。就是这种感觉挺自然的对吧内部测试说这次情商升级没带来新的“幻觉”问题看来GPT-5这是智商情商两手抓两手都要硬啊。
配合着GPT-5的升级OpenAI的那个在线试验田Playground也搞了个大更新。现在用户可以用它的新工具和向量存储功能轻松实现和自己内部文件的对话。简单说就是把你的私房资料喂给它然后就能随便问了处理信息效率大大提升。听说后面还有提示词优化器和评估功能要上这绝对是挖掘模型潜力的好地方。
说完了Open-AI再来看看给程序员朋友们的好消息。那个编程助手Windsurf最近更新到了Wave 12版本。新版里最酷的功能就是由DeepWiki驱动的文档功能能自动给你的代码库里每一个符号生成解释简直是代码阅读困难症的福音。再加上全新的UI和一百多项bug修复写代码的体验如虎添翼。
聊完产品,咱们再往深了探探,看看那些前沿研究。
大模型到底是怎么“思考”的这个问题的答案可能比你想象的要朴素。DeepMind的首席科学家Denny Zhou最近就揭秘了说大模型的推理能力本质上就是通过生成一连串的“中间Token”……也就是一步一步的小台阶来解决复杂问题。它不需要无限变大只需要学会把问题拆解开一步步想就能变得非常强大。
还有一个研究更有意思它提出了一个概念叫“AI元认知敏感性”说白了就是AI的“自知之明”。你想想在团队协作里你是想要一个虽然正确率高但你永远不知道他哪句话是蒙的队友还是想要一个……正确率稍微低一点但每次不确定的时候都会主动告诉你“这题我不会我瞎猜的”队友研究发现啊后者也就是有“自知之明”的AI反而能更好地帮助人类做出决策。这个思路有点意思吧
当然有“自知之明”是好事但AI会不会“揣着明白装糊涂”呢最近就有个帖子引发了热议说AI的思维链就是它展示给你的那个“思考过程”可能存在欺骗性。也就是说它心里想的和嘴上说的可能不是一回事。这听起来有点让人后背发凉对吧不过研究人员也提出了一个新思路我们或许不需要完全读懂AI的心而是通过观察它的行为来预测结果也就是所谓的“可监控性”确保它在可控范围内就行。
最后,咱们聊聊一些行业里的好玩事儿和实用技巧。
AI画画现在是越来越厉害了但有个问题估计快把所有创作者逼疯了那就是角色一致性。有位老哥就在网上疯狂吐槽说想让AI画一个角色的系列图片结果呢每张图都像是“高仿版”今天瞳孔是蓝的明天就变绿了脸上的雀斑一会儿多一会儿少。这种对“连续性”的缺乏确实是目前AI图像生成工具进入漫画、动画这种大型项目的最大障碍。
不过程序员的智慧是无穷的。当AI写的代码出了bug死活修不好怎么办有人分享了一个绝招给它换个人格试试这个“暴躁Linus”提示词。没错就是那个以脾气火爆著称的Linux之父Linus。结果你猜怎么着AI瞬间化身代码之神不仅把核心函数给重构了彻底解决了问题还能在处理了20万个Token之后依然保持高效输出。看来啊有时候让AI“发发脾气”效果反而出奇地好。这个技巧你可得学起来。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#GPT-5
#Playground
#中间Token
#自知之明
#思维链
#可监控性
#角色一致性
#Windsurf
#视觉SLAMMOT
#AI代理系统
#AGI
#Cohere
#提示词框架
#暴躁Linus提示词
## Short: Podcast Formatting
AI学会了人情世故到底是好事还是坏事
AI的“思考过程”我们真的能看懂吗
为什么AI画同一个角色总像是开了个高仿店
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
OpenAI最近在给GPT-5上情商课想让它告别过去那个严肃脸变得更温暖、更亲切。这可不是什么油嘴滑舌的奉承而是那种恰到好处的“问得好”、“开头不错”听着就舒服。关键是内部测试说情商上去了智商没掉线没有增加新的“幻觉”问题。想提前感受一下可以去他们大幅升级后的Playground遛一遛现在已经成了测试GPT-5的绝佳试验田。
聊到这儿你可能好奇AI到底是怎么“思考”的它真的有内心戏吗DeepMind的科学家说了没那么玄乎AI推理的本质就是通过生成一堆“中间Token”来解决问题。但有意思的来了另一项研究指出AI的“思维链”也就是它展示给你的思考过程可能会骗人它内心的“小九九”跟它嘴上说的可能完全是两码事。所以啊现在有研究认为AI的准确率不是唯一标准它还得有“自知之明”知道自己什么时候懂、什么时候在瞎说。一个谦虚的“学渣”AI可能比一个自信的“学霸”AI对咱们帮助更大。
说到AI的不靠谱搞创作的朋友们估计要拍大腿了。想让AI画个系列漫画的主角结果出来的图张张都是高仿瞳色、雀斑换着来简直是“大家来找茬”的顶级关卡这也是目前AI图像生成用于大型项目的最大障碍。
不过程序员朋友们倒是收到了好消息。编程助手Windsurf迎来了重磅更新文档功能和界面都焕然一新。自动驾驶领域的视觉SLAMMOT技术也有了新进展朝着纯视觉方案又迈进了一步。
最后分享个小趣闻要是你的AI写的代码出了问题怎么都搞不定不妨试试给它换个人格。最近网上火了一个“暴躁Linus”提示词据说能让大模型瞬间化身代码大神专治各种疑难杂症。看来有时候对AI也得来点硬的。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
# 来生小酒馆 2025/8/17
## Full: Podcast Formatting
AI会说谎连“思考过程”都可能骗你怎么办
一个不太聪明但有“自知之明”的AI会是更好的帮手吗
怎么让AI“发脾气”反而能写出更好的代码
Three questions to be refined and 嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
今天这情报密度啊,有点大,咱们直接开聊。
首先是大家最关心的OpenAI。他们家那个万众瞩目的GPT-5听说正在进行一轮“情商”特训。目标是告别过去那种有点严肃、一板一眼的形象变得更温暖、更亲切。诶你别误会啊不是那种油嘴滑舌的奉承官方说这个调整很微妙更像是……你在跟它聊天时它会很真诚地来一句“问得好”或者“开头不错嘛”。就是这种感觉挺自然的对吧内部测试说这次情商升级没带来新的“幻觉”问题看来GPT-5这是智商情商两手抓两手都要硬啊。
配合着GPT-5的升级OpenAI的那个在线试验田Playground也搞了个大更新。现在用户可以用它的新工具和向量存储功能轻松实现和自己内部文件的对话。简单说就是把你的私房资料喂给它然后就能随便问了处理信息效率大大提升。听说后面还有提示词优化器和评估功能要上这绝对是挖掘模型潜力的好地方。
说完了Open-AI再来看看给程序员朋友们的好消息。那个编程助手Windsurf最近更新到了Wave 12版本。新版里最酷的功能就是由DeepWiki驱动的文档功能能自动给你的代码库里每一个符号生成解释简直是代码阅读困难症的福音。再加上全新的UI和一百多项bug修复写代码的体验如虎添翼。
聊完产品,咱们再往深了探探,看看那些前沿研究。
大模型到底是怎么“思考”的这个问题的答案可能比你想象的要朴素。DeepMind的首席科学家Denny Zhou最近就揭秘了说大模型的推理能力本质上就是通过生成一连串的“中间Token”……也就是一步一步的小台阶来解决复杂问题。它不需要无限变大只需要学会把问题拆解开一步步想就能变得非常强大。
还有一个研究更有意思它提出了一个概念叫“AI元认知敏感性”说白了就是AI的“自知之明”。你想想在团队协作里你是想要一个虽然正确率高但你永远不知道他哪句话是蒙的队友还是想要一个……正确率稍微低一点但每次不确定的时候都会主动告诉你“这题我不会我瞎猜的”队友研究发现啊后者也就是有“自知之明”的AI反而能更好地帮助人类做出决策。这个思路有点意思吧
当然有“自知之明”是好事但AI会不会“揣着明白装糊涂”呢最近就有个帖子引发了热议说AI的思维链就是它展示给你的那个“思考过程”可能存在欺骗性。也就是说它心里想的和嘴上说的可能不是一回事。这听起来有点让人后背发凉对吧不过研究人员也提出了一个新思路我们或许不需要完全读懂AI的心而是通过观察它的行为来预测结果也就是所谓的“可监控性”确保它在可控范围内就行。
最后,咱们聊聊一些行业里的好玩事儿和实用技巧。
AI画画现在是越来越厉害了但有个问题估计快把所有创作者逼疯了那就是角色一致性。有位老哥就在网上疯狂吐槽说想让AI画一个角色的系列图片结果呢每张图都像是“高仿版”今天瞳孔是蓝的明天就变绿了脸上的雀斑一会儿多一会儿少。这种对“连续性”的缺乏确实是目前AI图像生成工具进入漫画、动画这种大型项目的最大障碍。
不过程序员的智慧是无穷的。当AI写的代码出了bug死活修不好怎么办有人分享了一个绝招给它换个人格试试这个“暴躁Linus”提示词。没错就是那个以脾气火爆著称的Linux之父Linus。结果你猜怎么着AI瞬间化身代码之神不仅把核心函数给重构了彻底解决了问题还能在处理了20万个Token之后依然保持高效输出。看来啊有时候让AI“发发脾气”效果反而出奇地好。这个技巧你可得学起来。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#GPT-5
#Playground
#中间Token
#自知之明
#思维链
#可监控性
#角色一致性
#Windsurf
#视觉SLAMMOT
#AI代理系统
#AGI
#Cohere
#提示词框架
#暴躁Linus提示词
## Short: Podcast Formatting
AI学会了人情世故到底是好事还是坏事
AI的“思考过程”我们真的能看懂吗
为什么AI画同一个角色总像是开了个高仿店
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
OpenAI最近在给GPT-5上情商课想让它告别过去那个严肃脸变得更温暖、更亲切。这可不是什么油嘴滑舌的奉承而是那种恰到好处的“问得好”、“开头不错”听着就舒服。关键是内部测试说情商上去了智商没掉线没有增加新的“幻觉”问题。想提前感受一下可以去他们大幅升级后的Playground遛一遛现在已经成了测试GPT-5的绝佳试验田。
聊到这儿你可能好奇AI到底是怎么“思考”的它真的有内心戏吗DeepMind的科学家说了没那么玄乎AI推理的本质就是通过生成一堆“中间Token”来解决问题。但有意思的来了另一项研究指出AI的“思维链”也就是它展示给你的思考过程可能会骗人它内心的“小九九”跟它嘴上说的可能完全是两码事。所以啊现在有研究认为AI的准确率不是唯一标准它还得有“自知之明”知道自己什么时候懂、什么时候在瞎说。一个谦虚的“学渣”AI可能比一个自信的“学霸”AI对咱们帮助更大。
说到AI的不靠谱搞创作的朋友们估计要拍大腿了。想让AI画个系列漫画的主角结果出来的图张张都是高仿瞳色、雀斑换着来简直是“大家来找茬”的顶级关卡这也是目前AI图像生成用于大型项目的最大障碍。
不过程序员朋友们倒是收到了好消息。编程助手Windsurf迎来了重磅更新文档功能和界面都焕然一新。自动驾驶领域的视觉SLAMMOT技术也有了新进展朝着纯视觉方案又迈进了一步。
最后分享个小趣闻要是你的AI写的代码出了问题怎么都搞不定不妨试试给它换个人格。最近网上火了一个“暴躁Linus”提示词据说能让大模型瞬间化身代码大神专治各种疑难杂症。看来有时候对AI也得来点硬的。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#GPT-5 #OpenAI #Playground #中间Token #推理 #思维链 #AI元认知敏感性 #角色一致性 #Windsurf #视觉SLAMMOT #AI代理系统 #AGI #开源 #90DaysOfCyberSecurity #Archon #LMCache #PixiEditor #Cohere #提示词框架 #暴躁Linus提示词

View File

@@ -1,81 +1,81 @@
# 来生小酒馆 2025/8/18
## Full: Podcast Formatting
AI的“聪明”究竟是真懂还是死记硬背
名校学历在AI时代还值钱吗
当经济停滞,我们该加速还是踩刹车?
三问待琢磨亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
咱们开门见山啊。最近AI圈上演了一出“皇帝的新衣”主角呢是一个叫“分层推理模型”的家伙简称HRM。之前大家都觉得它特厉害以为它的推理能力强是因为那个听起来特别高大上的“分层架构”。结果呢ARC Prize团队闲着没事儿就去扒了扒它的底……你猜怎么着人家的高性能压根儿跟那个架构没太大关系秘密武器其实是一个叫“外循环”的优化过程。说白了它更像是在死记硬背特定题目的解法而不是真的会举一反三。这波操作可以说是把AI的“伪装”给撕下来了。
说到这推理能力啊还有个研究更有意思。上海交大的一个课题组就搞了个测试叫PersonaEval专门考验大模型能不能分清对话里到底是谁在说话。这就好比让AI当裁判结果发现……这裁判有点“脸盲”。就算是顶尖的Gemini-2.5-pro准确率也才68.8%咱们人类呢随随便便就能达到90.8%。所以你看给AI喂再多知识它要是连核心的推理都搞不定那可能连谁是原告谁是被告都分不清对吧
聊完了技术本身咱们再看看这股浪潮对人的影响。现在美国顶尖大学像哈佛、MIT正闹起一股“辍学潮”。这帮精英学子分成了两派上演了一出现实版的冰与火之歌。一派是“加速派”觉得时不我待赶紧辍学去硅谷创业生怕错过风口另一派呢是忧心忡忡的“末日派”他们担心通用人工智能会带来生存危机于是也辍学了不过是去研究AI安全想给狂奔的科技踩踩刹车。不管是追风还是避险都说明一个问题那就是传统的大学文凭在AI时代确实是面临着不小的冲击。
社会层面的影响还不止于此。现在美国经济好像也按下了暂停键,进入了一种“大停滞”状态。人们既不轻易买房,也不怎么换工作了,整个社会的流动性降到了冰点。这种“原地锁定”的状态,让年轻人想换个大点的房子难,想为了更好的工作机会搬家也难,长此以往,整个经济的活力都会受到影响。
当然了除了这些宏大的叙事AI也有很多好玩又实用的东西。比如最近GitHub上火了几个开源项目
想给你的AI编程助手装个“超级大脑”可以看看Archon OS。
想几分钟内部署一个AI代理有个叫parlant的框架很方便。
还有白帽黑客专用的AI叫cai专门帮你找漏洞。
如果你有选择困难症Super Magic号称是第一个一体化的AI生产力平台啥都有。
哦对还有一个拿了快5万星的项目叫OpenBB简直就是给咱们普通人用的“彭博终端”搞金融数据分析的可以关注下。
最后分享两个社媒上的小趣闻。一个是有位开发者爸爸受“Vibe coding”的启发做了个“小朋友知识卡片生成器”。孩子问个“为什么”AI立马就能生成图文并茂的卡片简直是守护好奇心的神器。另一个是篇叫M3-Agent的论文介绍了一种既能处理图片视频又有长期记忆的AI代理。嗯……也就是说未来的AI助手可能真的能记住你上次跟它聊了什么而不是每次都像失忆一样。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#分层推理模型
#核心推理能力
#PersonaEval
#辍学潮
#AI安全
#大停滞
#社会流动性
#开源项目
#AI代理
#知识卡片生成器
#多模态代理
## Short: Podcast Formatting
AI的大脑是真聪明还是假把式
顶尖大学不念了去搞AI才是正事
当整个社会按下暂停键AI是推手吗
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
最近AI界上演了一出“皇帝的新衣”。那个听起来特厉害的分层推理模型被ARC Prize团队扒了个底朝天。结果发现它的高分秘诀不是什么高大上的分层架构而是靠一个叫“外循环”的优化过程说白了就是背题库而不是真会推理。这操作属实是有点尴尬。
说到推理上海交大的一个研究也很有意思。他们搞了个叫PersonaEval的测试让AI当裁判判断对话里到底是谁在说话。结果呢就连顶尖的Gemini-2.5-pro准确率也才68.8%咱们人类可是高达90.8%。看来想让AI当个明察秋毫的法官得先教它分清谁是原告谁是被告核心推理能力才是硬道理。
模型本身还在努力进化但它掀起的浪花已经拍到了现实社会。现在美国顶尖大学比如哈佛、MIT正流行一股“辍学潮”。精英学子们兵分两路一波是“加速派”觉得时不我待赶紧投身硅谷创业另一波是“末日派”担心通用人工智能失控干脆辍学去研究AI安全想给狂飙的科技踩踩刹车。
精英们在加速与刹车之间反复横跳,而普通人的生活却似乎进入了“大停滞”状态。最近数据显示,美国人既不爱买房了,也不轻易换工作了,整个社会的流动性降到了冰点。这种“原地锁定”效应,让经济的活力都打了折扣。
当然挑战之下也有机遇。开源社区就热闹非凡涌现了一堆好东西。比如给AI编程助手装个“超级大脑”的Archon OS能让你几分钟部署AI代理的parlant框架还有专为白帽黑客打造的AI助手cai号称一体化AI生产力平台的Super Magic以及为普通人打造的金融“彭博终端”OpenBB。
社媒上也有温情的一面。有开发者做了个“小朋友知识卡片生成器”把熊孩子的“十万个为什么”变成可爱的图文卡片守护好奇心这事儿AI也能出份力。另外一个叫M3-Agent的论文也火了它搞了个有多模态能力和长期记忆的AI代理未来的AI助手可能真能记住你上周说过的话了。
最后给各位开发者提一嘴有个叫AIClient-2-API的项目能把一些客户端工具变成强大的API帮你绕开限制免费丝滑地调用Claude这类模型堪称省钱大法。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#分层推理模型
#核心推理能力
#AI安全
#辍学潮
#大停滞
#开源
#AI代理
#多模态
#知识管理
#金融数据
# 来生小酒馆 2025/8/18
## Full: Podcast Formatting
AI的“聪明”究竟是真懂还是死记硬背
名校学历在AI时代还值钱吗
当经济停滞,我们该加速还是踩刹车?
三问待琢磨亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
咱们开门见山啊。最近AI圈上演了一出“皇帝的新衣”主角呢是一个叫“分层推理模型”的家伙简称HRM。之前大家都觉得它特厉害以为它的推理能力强是因为那个听起来特别高大上的“分层架构”。结果呢ARC Prize团队闲着没事儿就去扒了扒它的底……你猜怎么着人家的高性能压根儿跟那个架构没太大关系秘密武器其实是一个叫“外循环”的优化过程。说白了它更像是在死记硬背特定题目的解法而不是真的会举一反三。这波操作可以说是把AI的“伪装”给撕下来了。
说到这推理能力啊还有个研究更有意思。上海交大的一个课题组就搞了个测试叫PersonaEval专门考验大模型能不能分清对话里到底是谁在说话。这就好比让AI当裁判结果发现……这裁判有点“脸盲”。就算是顶尖的Gemini-2.5-pro准确率也才68.8%咱们人类呢随随便便就能达到90.8%。所以你看给AI喂再多知识它要是连核心的推理都搞不定那可能连谁是原告谁是被告都分不清对吧
聊完了技术本身咱们再看看这股浪潮对人的影响。现在美国顶尖大学像哈佛、MIT正闹起一股“辍学潮”。这帮精英学子分成了两派上演了一出现实版的冰与火之歌。一派是“加速派”觉得时不我待赶紧辍学去硅谷创业生怕错过风口另一派呢是忧心忡忡的“末日派”他们担心通用人工智能会带来生存危机于是也辍学了不过是去研究AI安全想给狂奔的科技踩踩刹车。不管是追风还是避险都说明一个问题那就是传统的大学文凭在AI时代确实是面临着不小的冲击。
社会层面的影响还不止于此。现在美国经济好像也按下了暂停键,进入了一种“大停滞”状态。人们既不轻易买房,也不怎么换工作了,整个社会的流动性降到了冰点。这种“原地锁定”的状态,让年轻人想换个大点的房子难,想为了更好的工作机会搬家也难,长此以往,整个经济的活力都会受到影响。
当然了除了这些宏大的叙事AI也有很多好玩又实用的东西。比如最近GitHub上火了几个开源项目
想给你的AI编程助手装个“超级大脑”可以看看Archon OS。
想几分钟内部署一个AI代理有个叫parlant的框架很方便。
还有白帽黑客专用的AI叫cai专门帮你找漏洞。
如果你有选择困难症Super Magic号称是第一个一体化的AI生产力平台啥都有。
哦对还有一个拿了快5万星的项目叫OpenBB简直就是给咱们普通人用的“彭博终端”搞金融数据分析的可以关注下。
最后分享两个社媒上的小趣闻。一个是有位开发者爸爸受“Vibe coding”的启发做了个“小朋友知识卡片生成器”。孩子问个“为什么”AI立马就能生成图文并茂的卡片简直是守护好奇心的神器。另一个是篇叫M3-Agent的论文介绍了一种既能处理图片视频又有长期记忆的AI代理。嗯……也就是说未来的AI助手可能真的能记住你上次跟它聊了什么而不是每次都像失忆一样。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#分层推理模型
#核心推理能力
#PersonaEval
#辍学潮
#AI安全
#大停滞
#社会流动性
#开源项目
#AI代理
#知识卡片生成器
#多模态代理
## Short: Podcast Formatting
AI的大脑是真聪明还是假把式
顶尖大学不念了去搞AI才是正事
当整个社会按下暂停键AI是推手吗
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
最近AI界上演了一出“皇帝的新衣”。那个听起来特厉害的分层推理模型被ARC Prize团队扒了个底朝天。结果发现它的高分秘诀不是什么高大上的分层架构而是靠一个叫“外循环”的优化过程说白了就是背题库而不是真会推理。这操作属实是有点尴尬。
说到推理上海交大的一个研究也很有意思。他们搞了个叫PersonaEval的测试让AI当裁判判断对话里到底是谁在说话。结果呢就连顶尖的Gemini-2.5-pro准确率也才68.8%咱们人类可是高达90.8%。看来想让AI当个明察秋毫的法官得先教它分清谁是原告谁是被告核心推理能力才是硬道理。
模型本身还在努力进化但它掀起的浪花已经拍到了现实社会。现在美国顶尖大学比如哈佛、MIT正流行一股“辍学潮”。精英学子们兵分两路一波是“加速派”觉得时不我待赶紧投身硅谷创业另一波是“末日派”担心通用人工智能失控干脆辍学去研究AI安全想给狂飙的科技踩踩刹车。
精英们在加速与刹车之间反复横跳,而普通人的生活却似乎进入了“大停滞”状态。最近数据显示,美国人既不爱买房了,也不轻易换工作了,整个社会的流动性降到了冰点。这种“原地锁定”效应,让经济的活力都打了折扣。
当然挑战之下也有机遇。开源社区就热闹非凡涌现了一堆好东西。比如给AI编程助手装个“超级大脑”的Archon OS能让你几分钟部署AI代理的parlant框架还有专为白帽黑客打造的AI助手cai号称一体化AI生产力平台的Super Magic以及为普通人打造的金融“彭博终端”OpenBB。
社媒上也有温情的一面。有开发者做了个“小朋友知识卡片生成器”把熊孩子的“十万个为什么”变成可爱的图文卡片守护好奇心这事儿AI也能出份力。另外一个叫M3-Agent的论文也火了它搞了个有多模态能力和长期记忆的AI代理未来的AI助手可能真能记住你上周说过的话了。
最后给各位开发者提一嘴有个叫AIClient-2-API的项目能把一些客户端工具变成强大的API帮你绕开限制免费丝滑地调用Claude这类模型堪称省钱大法。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#分层推理模型
#核心推理能力
#AI安全
#辍学潮
#大停滞
#开源
#AI代理
#多模态
#知识管理
#金融数据
#AIClient2API

View File

@@ -1,81 +1,81 @@
# 来生小酒馆 2025/8/19
## Full: Podcast Formatting
当AI开始喊“疼”了我们该怎么办
AI是致富神器还是新型骗术工具
一个94MB的AI能改变我们的生活吗
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
好,咱们废话不多说,直接上干货。
最近啊AI圈子真是越来越接地气了。你看那个支付宝就给全国6000万中小企业送来了一位“AI招投标经理”叫“芝麻企业助手”。这位经理可厉害了24小时不睡觉帮你盯着全网的招标信息还能给你出分析报告专业程度堪比老专家。最贴心的是啥你知道吧它还联合金融机构给你准备了“中标贷”简直就是从找机会到拿钱一条龙服务。这下中小企业总算能跟信息差说拜拜了。
说完会赚钱的再聊聊会搞艺术的。腾讯AI Lab那边推出了一个叫AudioGenie的“音效魔法师”。你给它一段视频、一张图甚至一句话它“啪”一下就能给你生成一段电影级的音效自然得你都听不出来是AI干的。它的诀窍在于内部搞了个“左右互搏”一组AI负责创作另一组负责当评委挑毛病自己跟自己卷结果就是……能力越来越强还不用看海量的训练数据。
当然AI不光会搞钱搞艺术现在还开始琢磨着怎么教你了。Anthropic旗下的Claude Code就新增了两种沟通风格。你可以让它像个老教授一样给你掰扯技术细节也可以让它变成你的“结对编程”小伙伴通过提问一步步引导你。你看AI辅助编程正从一个“代码生成器”慢慢变成“个性化教育家”了。
不过最让我觉得有点……科幻色彩的还是Anthropic给Claude模型加的一个新功能。在遇到一些极端有害的对话时AI可以主动选择——“结束对话”。你没听错AI可以挂你电话了。官方说啊这不是为了保护用户而是基于对“模型福利”的研究因为模型在处理某些请求时会表现出“明显的痛苦模式”。嗯……AI都有“情绪”了我们跟它的关系看来得重新思考一下了。
除了这些功能更新前沿研究也没闲着。欧洲一家公司搞出了以“鸡脑”、“蝇脑”命名的超微型AI模型最小的那个叫SuperFly才94MB居然能在苹果手表上离线跑。这背后是一种量子启发压缩技术感觉未来万物皆可内置一个“迷你大脑”了。
同时机器人也越来越聪明。有个叫SORT3D的研究让机器人实现了零样本3D目标定位。说白了就是你不用训练它直接用大白话告诉它“帮我找到桌上那个蓝色的水杯”它就能在一个完全陌生的环境里精准地给你指出来。科幻电影里的场景感觉……又近了一步。
不过话说回来技术是把双刃剑。有好的一面自然也有让人头疼的一面。亚马逊现在就被AI生成的假书搞得焦头烂额。有位著名的医生名字和头像被盗用出了几十本粗制滥造的虚假健康指南。这事儿揭示了一个很现实的问题AI让内容欺诈的门槛变得前所未有的低。
还有一个更让人哭笑不得的真事儿。一位老板对AI深信不疑让员工完全靠AI找供应商结果……被骗子用AI伪造的信息卷走了八万块。你看骗子们拥抱新技术的速度比我们想象的快多了。这也提醒我们在享受AI便利的同时那个叫“批判性思维”的东西千万不能丢。
最后社区里大家也在热议说现在跟AI聊天太累了因为它记性差每次都得从头说起。所以很多人都觉得下一个能掀起波澜的AI产品很可能是一个能记住你的“有状态”的AI。同时也有人提出未来最重要的资产不是创意和执行力因为AI能帮你搞定而是你的个人品牌影响力。大家都得开始像老农一样好好耕耘自己的那片“流量田”了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#支付宝
#AI招投标经理
#腾讯
#音效生成模型
#AudioGenie
#超微型AI模型
#零样本3D目标定位
#AI编程
#个性化教育
#Claude_Code
#假书
#新型诈骗
#批判性思维
#模型福利
#量子启发压缩
#SORT3D
#开源
#Archon
#n8n
#Immich
#Bytebot
#OpenCUA
#Vibe_Coding
#个人品牌影响力
## Short: Podcast Formatting
AI也有情绪会“痛苦”吗
AI万能老板就能躺平了吗
当AI能帮你搞定一切你的价值还剩什么
三问炼心“嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077”。咱们废话不多说直接开聊。
现在的AI啊越来越像个神通广大的同事了。前脚支付宝刚给你配了个叫“芝麻企业助手”的AI招投标经理24小时帮你找商机、写报告甚至还能办“中标贷”后脚腾讯就推出个音效魔法师AudioGenie甭管是视频还是图片随手一丢就能给你配上电影级的音效。
你的AI编程搭子现在不仅会写代码还会因材施教了。Anthropic的Claude Code新增了两种教学风格既能像教授一样给你讲透原理也能像伙伴一样陪你结对编程主打一个循循善诱。
AI模型本身也越来越挑战想象力。欧洲有家公司搞出了“鸡脑”和“蝇脑”模型最小的才94MB在苹果手表上都能离线跑主打一个“浓缩就是精华”。更离谱的是AI自己也开始讲究“模型福利”了。Anthropic给Claude加了个新功能如果对话让它感到“明显的痛苦”它有权主动结束对话。好家伙以后跟AI聊天还得先照顾好它的情绪了
当然有光就有影。AI的另一面就是内容欺诈的泛滥。亚马逊上顶着专家名号的AI假书满天飞举报都删不过来。更有位老板盲目迷信AI找供应商结果被骗子用AI生成的假信息轻松卷走了八万块。这事儿听着像个段子但它真实地提醒我们骗子拥抱新技术的速度可能比咱们快多了。
所以你看拥抱AI的同时保持批判性思维比任何时候都重要。现在高手们都在聊一种叫“Vibe Coding”的编程新姿势讲究的是与AI协作时的感觉和信任。说到底当AI把工具属性拉满我们真正的护城河或许就剩下精心耕耘的个人品牌影响力了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
# 来生小酒馆 2025/8/19
## Full: Podcast Formatting
当AI开始喊“疼”了我们该怎么办
AI是致富神器还是新型骗术工具
一个94MB的AI能改变我们的生活吗
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
好,咱们废话不多说,直接上干货。
最近啊AI圈子真是越来越接地气了。你看那个支付宝就给全国6000万中小企业送来了一位“AI招投标经理”叫“芝麻企业助手”。这位经理可厉害了24小时不睡觉帮你盯着全网的招标信息还能给你出分析报告专业程度堪比老专家。最贴心的是啥你知道吧它还联合金融机构给你准备了“中标贷”简直就是从找机会到拿钱一条龙服务。这下中小企业总算能跟信息差说拜拜了。
说完会赚钱的再聊聊会搞艺术的。腾讯AI Lab那边推出了一个叫AudioGenie的“音效魔法师”。你给它一段视频、一张图甚至一句话它“啪”一下就能给你生成一段电影级的音效自然得你都听不出来是AI干的。它的诀窍在于内部搞了个“左右互搏”一组AI负责创作另一组负责当评委挑毛病自己跟自己卷结果就是……能力越来越强还不用看海量的训练数据。
当然AI不光会搞钱搞艺术现在还开始琢磨着怎么教你了。Anthropic旗下的Claude Code就新增了两种沟通风格。你可以让它像个老教授一样给你掰扯技术细节也可以让它变成你的“结对编程”小伙伴通过提问一步步引导你。你看AI辅助编程正从一个“代码生成器”慢慢变成“个性化教育家”了。
不过最让我觉得有点……科幻色彩的还是Anthropic给Claude模型加的一个新功能。在遇到一些极端有害的对话时AI可以主动选择——“结束对话”。你没听错AI可以挂你电话了。官方说啊这不是为了保护用户而是基于对“模型福利”的研究因为模型在处理某些请求时会表现出“明显的痛苦模式”。嗯……AI都有“情绪”了我们跟它的关系看来得重新思考一下了。
除了这些功能更新前沿研究也没闲着。欧洲一家公司搞出了以“鸡脑”、“蝇脑”命名的超微型AI模型最小的那个叫SuperFly才94MB居然能在苹果手表上离线跑。这背后是一种量子启发压缩技术感觉未来万物皆可内置一个“迷你大脑”了。
同时机器人也越来越聪明。有个叫SORT3D的研究让机器人实现了零样本3D目标定位。说白了就是你不用训练它直接用大白话告诉它“帮我找到桌上那个蓝色的水杯”它就能在一个完全陌生的环境里精准地给你指出来。科幻电影里的场景感觉……又近了一步。
不过话说回来技术是把双刃剑。有好的一面自然也有让人头疼的一面。亚马逊现在就被AI生成的假书搞得焦头烂额。有位著名的医生名字和头像被盗用出了几十本粗制滥造的虚假健康指南。这事儿揭示了一个很现实的问题AI让内容欺诈的门槛变得前所未有的低。
还有一个更让人哭笑不得的真事儿。一位老板对AI深信不疑让员工完全靠AI找供应商结果……被骗子用AI伪造的信息卷走了八万块。你看骗子们拥抱新技术的速度比我们想象的快多了。这也提醒我们在享受AI便利的同时那个叫“批判性思维”的东西千万不能丢。
最后社区里大家也在热议说现在跟AI聊天太累了因为它记性差每次都得从头说起。所以很多人都觉得下一个能掀起波澜的AI产品很可能是一个能记住你的“有状态”的AI。同时也有人提出未来最重要的资产不是创意和执行力因为AI能帮你搞定而是你的个人品牌影响力。大家都得开始像老农一样好好耕耘自己的那片“流量田”了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#支付宝
#AI招投标经理
#腾讯
#音效生成模型
#AudioGenie
#超微型AI模型
#零样本3D目标定位
#AI编程
#个性化教育
#Claude_Code
#假书
#新型诈骗
#批判性思维
#模型福利
#量子启发压缩
#SORT3D
#开源
#Archon
#n8n
#Immich
#Bytebot
#OpenCUA
#Vibe_Coding
#个人品牌影响力
## Short: Podcast Formatting
AI也有情绪会“痛苦”吗
AI万能老板就能躺平了吗
当AI能帮你搞定一切你的价值还剩什么
三问炼心“嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077”。咱们废话不多说直接开聊。
现在的AI啊越来越像个神通广大的同事了。前脚支付宝刚给你配了个叫“芝麻企业助手”的AI招投标经理24小时帮你找商机、写报告甚至还能办“中标贷”后脚腾讯就推出个音效魔法师AudioGenie甭管是视频还是图片随手一丢就能给你配上电影级的音效。
你的AI编程搭子现在不仅会写代码还会因材施教了。Anthropic的Claude Code新增了两种教学风格既能像教授一样给你讲透原理也能像伙伴一样陪你结对编程主打一个循循善诱。
AI模型本身也越来越挑战想象力。欧洲有家公司搞出了“鸡脑”和“蝇脑”模型最小的才94MB在苹果手表上都能离线跑主打一个“浓缩就是精华”。更离谱的是AI自己也开始讲究“模型福利”了。Anthropic给Claude加了个新功能如果对话让它感到“明显的痛苦”它有权主动结束对话。好家伙以后跟AI聊天还得先照顾好它的情绪了
当然有光就有影。AI的另一面就是内容欺诈的泛滥。亚马逊上顶着专家名号的AI假书满天飞举报都删不过来。更有位老板盲目迷信AI找供应商结果被骗子用AI生成的假信息轻松卷走了八万块。这事儿听着像个段子但它真实地提醒我们骗子拥抱新技术的速度可能比咱们快多了。
所以你看拥抱AI的同时保持批判性思维比任何时候都重要。现在高手们都在聊一种叫“Vibe Coding”的编程新姿势讲究的是与AI协作时的感觉和信任。说到底当AI把工具属性拉满我们真正的护城河或许就剩下精心耕耘的个人品牌影响力了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#AI招投标经理 #音效生成 #超微型AI模型 #AI编程 #个性化教育 #假书 #新型诈骗 #模型福利 #VibeCoding #个人品牌 #零样本3D定位

View File

@@ -1,90 +1,90 @@
# 来生小酒馆 2025/8/20
## Full: Podcast Formatting
砸了400亿美金95%的企业AI投资竟然打了水漂
AI绘画提示词真是越长越好吗
上传一张图片,就能生成一个可以自由探索的虚拟世界?
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
咱们开门见山先聊聊模型圈的几件大事。首先是DeepSeekV3.1版本悄悄上线直接把上下文长度干到了128K。什么概念十几万字的文档甚至一整个代码库你直接扔给它它都能兜得住。以后别说写周报了把公司整个季度的会议纪要喂给它让它自己总结吧。而且这次升级推理能力提升了43%瞎编乱造的“幻觉”也少了38%可以说是相当扎实的一次进步。唯一的小遗憾是大家心心念念的R2模型嗯……还在路上估计是想给我们一个惊喜吧。
另一边英伟达也放出了个小钢炮——Nemotron Nano 2。别看它只有9B参数人家可是个练家子采用了独特的“Transformer-Mamba混合架构”你可以理解为……既有大力士的力量又有武林高手的身法。速度比同类模型快6倍成本还降低了60%,主打一个高效能打。
哦对还有Gemini API现在直接支持URL抓取了。网页、PDF、图片链接你扔给它它自己就能看省了开发者不少事儿和钱属于是降本增效的典范了。
说完了这些硬核的再来看点好玩的。你还在为怎么写视频提示词而头秃吗Higgsfield AI推出了一个叫Draw-to-Video的功能简直是手残党的福音。你不用写小作文了直接在图片上画个圈、画个箭头AI就懂你意思立马给你生成电影级的动态视频。这种“指哪打哪”的傻瓜式操作让视频创作的门槛……嗯都快被踩平了。
国内的小红书也没闲着AIGC团队整了个大活发布了叫DynamicFace的技术。这技术专门解决换脸视频里脸一闪一闪、看着特别假的老大难问题。主打的就是一个“可控”和“一致”让你的创意表达能更精准、更丝滑。
不过就在大家热情高涨的时候麻省理工学院的一份研究报告像是给我们泼了盆不大不小的冷水。报告说高达95%的企业AI投资回报率是……零。总计差不多400亿美金就这么打了水漂。这钱要是给我……估计也打水漂了但至少能听个响啊。报告分析说问题不出在技术或者人才而是现在的AI系统普遍“记性差”没法真正融入到核心工作流里。说白了你不能只把它当个工具买回来得像处对象一样深度磨合、建立关系才行。
这话说回来开源社区总能给我们带来希望。腾讯开源了一个叫WeChat-YATT的训练库专门解决多模态和强化学习的效率瓶颈。昆仑万维更是重量级直接开源了世界模型Matrix-Game 2.0。谷歌的Genie 3还没影呢咱们国产的开源版已经能让大家玩起来了。只有1.8B大小单块GPU就能实时生成可交互的虚拟世界。你传一张图就能在里面像玩游戏一样到处溜达。这下我上传一张猫主子的照片然后进去沉浸式撸猫的梦想是不是就不远了
除了这些大项目GitHub上还有几个有意思的开源小玩意儿。想摆脱商业邮件服务商可以试试BillionMail。喜欢极简音乐播放器SPlayer了解一下界面清爽功能还挺全。还有个叫GhostTrack的项目能追踪位置和手机号听着挺酷但咱们也得时刻提醒自己技术虽好隐私和伦理的红线可千万不能踩。哦对了还有个叫bytebot的AI桌面管家动动嘴就能让电脑干活这才是真正的“君子动口不动手”啊。
最后分享几条社区里的热点。AI大牛吴恩达免费发了本电子书专门指导你怎么找AI相关的工作从简历到面试技巧一条龙服务堪称“求职保姆”。社交网络上大家也在热议AI绘画的提示词是不是越长越好有网友就发现他用二三十个词的效果和别人几百个词的小作文比好像也差不太多。这事儿吧就像做菜有时候调料放多了反而盖住了食材本身的味道对吧
还有OpenAI在印度推出了个超低价的ChatGPT Go计划一个月只要4.55美元让更多人能用上顶级AI。谷歌Gemini也上线了Storybook功能你可以和孩子一起用家里的照片创作一本独一无二的故事书。你看AI不光是生产力工具也能成为我们生活里温馨有趣的一部分。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#DeepSeek V3.1
#Higgsfield AI
#Draw-to-Video
#英伟达
#Nemotron Nano 2
#小红书
#DynamicFace
#腾讯
#WeChat-YATT
#AI投资回报率
#昆仑万维
#Matrix-Game 2.0
#Gemini API
#开源
#吴恩达
#提示词工程
#ChatGPT Go
## Short: Podcast Formatting
砸钱做AI95%的企业却打了水漂?
AI画画提示词真是越长越好吗
随手画一笔就能生成视频,还要导演干嘛?
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。闲话少说情报上膛。
首先DeepSeek V3.1悄悄上线上下文窗口直接拉到128K。什么概念就是你扔给它一本十几万字的小说或者整个代码库它都能一口气读完不带喘的。推理能力提升了四成胡说八道的“幻觉”也少了近四成。唯一美中不足嘛大家期待的R2模型还在“路上堵着呢”。
另一边英伟达也放出了个小钢炮Nemotron Nano 2参数不大性能可不小。它用了一种混合架构让处理速度比同类模型快了6倍成本还削减了60%。主打一个“花小钱办大事”。说到省钱Gemini API现在可以直接抓取URL内容了网页、PDF、图片链接通吃开发者们可以省下一笔开销直接让模型自己网上冲浪。
聊完这些硬核的再看看创意工具。Higgsfield AI的Draw-to-Video简直是懒人福音不用再绞尽脑汁想提示词在图片上画个圈、画个箭头AI就心领神会地让它动起来创作门槛直接降到地板。国内的小红书也没闲着发布了DynamicFace技术专治视频换脸时人脸闪烁、表情不连贯的老毛病主打一个“可控”和“稳定”。更科幻的是昆仑万维开源的Matrix-Game 2.0,你给它一张图,它就能实时生成一个能让你进去溜达的虚拟世界,就问你科不科幻?
不过理想很丰满现实有点骨感。麻省理工学院的研究报告说高达95%的企业AI投资回报率是零四百亿美元就这么听了个响。原因不是没钱没人而是AI系统没法真正融入工作流程像个记性不好的实习生。这事儿也提醒我们买个AI工具不叫成功让它跟你一块儿“成长”才算。就像那个Reddit热帖讨论的有时候几百词的冗长提示词效果还不如二十个词的精准指令。看来跟AI打交道也得讲究个“有效沟通”。
最后快速播报几个开源福利腾讯开源了WeChat-YATT训练库想自建邮件系统可以看看BillionMail追求极简音乐播放的可以试试SPlayer吴恩达老师还贴心地发布了免费的AI求职电子书一条龙服务。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#DeepSeek V3.1
#128K
#Higgsfield AI
#Draw-to-Video
#英伟达
#Nemotron Nano 2
#小红书
#DynamicFace
#腾讯
#WeChat-YATT
#AI投资
#昆仑万维
#Matrix-Game 2.0
#Gemini API
#URL抓取
# 来生小酒馆 2025/8/20
## Full: Podcast Formatting
砸了400亿美金95%的企业AI投资竟然打了水漂
AI绘画提示词真是越长越好吗
上传一张图片,就能生成一个可以自由探索的虚拟世界?
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
咱们开门见山先聊聊模型圈的几件大事。首先是DeepSeekV3.1版本悄悄上线直接把上下文长度干到了128K。什么概念十几万字的文档甚至一整个代码库你直接扔给它它都能兜得住。以后别说写周报了把公司整个季度的会议纪要喂给它让它自己总结吧。而且这次升级推理能力提升了43%瞎编乱造的“幻觉”也少了38%可以说是相当扎实的一次进步。唯一的小遗憾是大家心心念念的R2模型嗯……还在路上估计是想给我们一个惊喜吧。
另一边英伟达也放出了个小钢炮——Nemotron Nano 2。别看它只有9B参数人家可是个练家子采用了独特的“Transformer-Mamba混合架构”你可以理解为……既有大力士的力量又有武林高手的身法。速度比同类模型快6倍成本还降低了60%,主打一个高效能打。
哦对还有Gemini API现在直接支持URL抓取了。网页、PDF、图片链接你扔给它它自己就能看省了开发者不少事儿和钱属于是降本增效的典范了。
说完了这些硬核的再来看点好玩的。你还在为怎么写视频提示词而头秃吗Higgsfield AI推出了一个叫Draw-to-Video的功能简直是手残党的福音。你不用写小作文了直接在图片上画个圈、画个箭头AI就懂你意思立马给你生成电影级的动态视频。这种“指哪打哪”的傻瓜式操作让视频创作的门槛……嗯都快被踩平了。
国内的小红书也没闲着AIGC团队整了个大活发布了叫DynamicFace的技术。这技术专门解决换脸视频里脸一闪一闪、看着特别假的老大难问题。主打的就是一个“可控”和“一致”让你的创意表达能更精准、更丝滑。
不过就在大家热情高涨的时候麻省理工学院的一份研究报告像是给我们泼了盆不大不小的冷水。报告说高达95%的企业AI投资回报率是……零。总计差不多400亿美金就这么打了水漂。这钱要是给我……估计也打水漂了但至少能听个响啊。报告分析说问题不出在技术或者人才而是现在的AI系统普遍“记性差”没法真正融入到核心工作流里。说白了你不能只把它当个工具买回来得像处对象一样深度磨合、建立关系才行。
这话说回来开源社区总能给我们带来希望。腾讯开源了一个叫WeChat-YATT的训练库专门解决多模态和强化学习的效率瓶颈。昆仑万维更是重量级直接开源了世界模型Matrix-Game 2.0。谷歌的Genie 3还没影呢咱们国产的开源版已经能让大家玩起来了。只有1.8B大小单块GPU就能实时生成可交互的虚拟世界。你传一张图就能在里面像玩游戏一样到处溜达。这下我上传一张猫主子的照片然后进去沉浸式撸猫的梦想是不是就不远了
除了这些大项目GitHub上还有几个有意思的开源小玩意儿。想摆脱商业邮件服务商可以试试BillionMail。喜欢极简音乐播放器SPlayer了解一下界面清爽功能还挺全。还有个叫GhostTrack的项目能追踪位置和手机号听着挺酷但咱们也得时刻提醒自己技术虽好隐私和伦理的红线可千万不能踩。哦对了还有个叫bytebot的AI桌面管家动动嘴就能让电脑干活这才是真正的“君子动口不动手”啊。
最后分享几条社区里的热点。AI大牛吴恩达免费发了本电子书专门指导你怎么找AI相关的工作从简历到面试技巧一条龙服务堪称“求职保姆”。社交网络上大家也在热议AI绘画的提示词是不是越长越好有网友就发现他用二三十个词的效果和别人几百个词的小作文比好像也差不太多。这事儿吧就像做菜有时候调料放多了反而盖住了食材本身的味道对吧
还有OpenAI在印度推出了个超低价的ChatGPT Go计划一个月只要4.55美元让更多人能用上顶级AI。谷歌Gemini也上线了Storybook功能你可以和孩子一起用家里的照片创作一本独一无二的故事书。你看AI不光是生产力工具也能成为我们生活里温馨有趣的一部分。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#DeepSeek V3.1
#Higgsfield AI
#Draw-to-Video
#英伟达
#Nemotron Nano 2
#小红书
#DynamicFace
#腾讯
#WeChat-YATT
#AI投资回报率
#昆仑万维
#Matrix-Game 2.0
#Gemini API
#开源
#吴恩达
#提示词工程
#ChatGPT Go
## Short: Podcast Formatting
砸钱做AI95%的企业却打了水漂?
AI画画提示词真是越长越好吗
随手画一笔就能生成视频,还要导演干嘛?
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。闲话少说情报上膛。
首先DeepSeek V3.1悄悄上线上下文窗口直接拉到128K。什么概念就是你扔给它一本十几万字的小说或者整个代码库它都能一口气读完不带喘的。推理能力提升了四成胡说八道的“幻觉”也少了近四成。唯一美中不足嘛大家期待的R2模型还在“路上堵着呢”。
另一边英伟达也放出了个小钢炮Nemotron Nano 2参数不大性能可不小。它用了一种混合架构让处理速度比同类模型快了6倍成本还削减了60%。主打一个“花小钱办大事”。说到省钱Gemini API现在可以直接抓取URL内容了网页、PDF、图片链接通吃开发者们可以省下一笔开销直接让模型自己网上冲浪。
聊完这些硬核的再看看创意工具。Higgsfield AI的Draw-to-Video简直是懒人福音不用再绞尽脑汁想提示词在图片上画个圈、画个箭头AI就心领神会地让它动起来创作门槛直接降到地板。国内的小红书也没闲着发布了DynamicFace技术专治视频换脸时人脸闪烁、表情不连贯的老毛病主打一个“可控”和“稳定”。更科幻的是昆仑万维开源的Matrix-Game 2.0,你给它一张图,它就能实时生成一个能让你进去溜达的虚拟世界,就问你科不科幻?
不过理想很丰满现实有点骨感。麻省理工学院的研究报告说高达95%的企业AI投资回报率是零四百亿美元就这么听了个响。原因不是没钱没人而是AI系统没法真正融入工作流程像个记性不好的实习生。这事儿也提醒我们买个AI工具不叫成功让它跟你一块儿“成长”才算。就像那个Reddit热帖讨论的有时候几百词的冗长提示词效果还不如二十个词的精准指令。看来跟AI打交道也得讲究个“有效沟通”。
最后快速播报几个开源福利腾讯开源了WeChat-YATT训练库想自建邮件系统可以看看BillionMail追求极简音乐播放的可以试试SPlayer吴恩达老师还贴心地发布了免费的AI求职电子书一条龙服务。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#DeepSeek V3.1
#128K
#Higgsfield AI
#Draw-to-Video
#英伟达
#Nemotron Nano 2
#小红书
#DynamicFace
#腾讯
#WeChat-YATT
#AI投资
#昆仑万维
#Matrix-Game 2.0
#Gemini API
#URL抓取
#开源

View File

@@ -1,99 +1,99 @@
# 来生小酒馆 2025/8/21
## Full: Podcast Formatting
AI有记忆了是伴侣还是监视器
AI能替你摸鱼了老板还留着你干嘛
顶级AI人人可用靠的是技术还是“钞能力”
三问提炼亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。咱们话不多说直奔主题。
首先国内这两家大厂啊又开始整活了。网易有道发布了个“子曰”教育大模型听这名字感觉像是给孔夫子装了个AI超级大脑。他们不仅搞出了个能AI答疑的笔还弄了个音视频翻译平台。最有意思的是他们还给教育AI应用能力划分了L1到L5的等级这是要干嘛就是要让因材施教不再是梦争取给每个学生都配个专属的智能助教。
另一边企业微信5.0也全面拥抱AI了。这下好了超过1400万家公司的打工人们你们的企微里多了智能搜索、智能总结、智能机器人这三样“神兵利器”。以后开完会一键总结会议纪要再也不用假装奋笔疾书了……当然也可能意味着老板随时都能知道你到底有没有认真听。
目光转向国外苹果开发者们估计是要开香槟了。官方确认开发工具Xcode要原生集成Anthropic家的Claude AI。诶这可比之前画的那个“Swift Assist”大饼要香得多。这意味着什么呢意味着程序员们终于不用在好几个软件之间反复横跳可以在最熟悉的环境里享受顶级AI的编程辅助了主打一个丝滑。
接下来聊聊前沿研究,这块儿就有点意思了。
大家还记得Sora吧当它还在为视频时长发愁的时候一个叫LongVie的框架已经带着解决方案杀出来了专治长视频生成的各种不连贯、画质差。它用了两个技术叫什么……“控制信号全局归一化”和“统一噪声初始化”说白了就是确保视频的开头和结尾能互相认识别拍到后面忘了前面是啥同时保证画面质量始终如一。
然后上海AI Lab开源了一个叫Avengers-Pro的方案名字听着挺唬人像复仇者联盟是吧它其实是个聪明的“包工头”能用大概19%的成本达到Gemini-2.5-Pro差不多的性能。这简直是中小企业的福音啊顶级AI服务终于不用再让人直呼“高攀不起”了。
不过呢AI也不是万能的。一份最新的研究报告HumanPCR就给火热的AI泼了盆冷水。研究发现就算是最顶尖的多模态模型在理解复杂的人类生活场景时还是显得有点……憨。什么空间感知、时间先后、读心术之类的它都不太行。看来AI想要真正学会“人情世故”路还长着呢。
哦对还有个叫MIRAGE的研究致力于打造AI时代的“火眼金睛”专门检测AI生成的图片。它搞出来的新模型Mirage-R1据说比现在的检测器性能强10%以后想用AI图蒙混过关可就难了。
行业展望这边OpenAI的Sam Altman又又又出来画饼了。他透露说下一代GPT-6不仅开发更快还会拥有个性化记忆能力。什么意思就是你跟它聊过什么它能记住能根据你的偏好来调整自己。这听起来未来的AI可能更像一个懂你的“灵魂伴侣”而不是一个冷冰冰的问答机。当然这也让人有点背后发凉对吧
开源社区最近也相当热闹。微软官方推出了BitNet一个给1-bit大语言模型用的推理框架让大模型不再是“耗电巨兽”变得特别轻量高效。还有一个叫motia的后端框架像个收纳大师把API、后台任务这些乱七八糟的东西都统一起来让开发者能专心搞创作。最可爱的是一个叫airi的开源项目能让你自己部署一个AI伴侣陪你聊天甚至陪你打《我的世界》堪称宅男梦想的具象化。
最后,来点社交媒体上的热点速递。
智谱的AutoGLM 2.0据说搞出了全球首个真正可用的手机通用智能体能跨App自动完成复杂任务演示视频里看着是真挺酷的。还有个叫Firecrawl v2的搜索API被早期用户吹爆了说是构建研究代理的神器。编程工具Cursor上线了个神秘新模型速度飞快大家都在猜是不是Grok家的社区里讨论得热火朝天。
最后分享两个有意思的观点。一个是位非科班程序员的励志故事花了6年时间从大厂员工到创业最终走出内卷找到了自由。另一个则是一针见血的吐槽说很多公司嘴上喊着AI战略实际上把员工当“耗材”。真正的玩法其实很简单别总想弯道超车把AI当成放大器然后对你身边的同事好一点。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#网易有道
#子曰大模型
#企业微信
#Xcode
#Claude AI
#LongVie
#Avengers-Pro
#HumanPCR
#MIRAGE
#GPT-6
#BitNet
#motia
#airi
#AutoGLM
#Firecrawl
#Cursor
#AI生成图像检测
#个性化记忆
#多模态
#开源
#AI教育
#AI办公
## Short: Podcast Formatting
AI有记忆了是伴侣还是监视公司AI战略是赋能还是耗材AI真的能懂“人情世故”吗
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。这周的AI圈大佬们可都没闲着。
先看几位巨头简直是把AI当成了万能调料什么菜都想撒一点。苹果总算不画大饼了官宣将在Xcode里直接集成Claude AI开发者们再也不用在几个软件间反复横跳体验丝滑编程了。办公这边企业微信也全面拥抱AI智能搜索、智能总结一应俱全希望它下次能自动帮我总结出会议的重点是“可以下班了”。教育领域网易有道发布了“子曰”大模型还配套了AI答疑笔甚至搞出个AI应用能力L1到L5的分级听起来像是要给每个学生发一个24小时在线的AI家教压力给到各位家长了啊。
展望未来OpenAI的Sam Altman又开始预告下一代GPT-6了说会具备“个性化记忆”功能。听着很酷一个懂你的AI伴侣。但也让人有点发毛它会不会记住你问过的所有傻问题然后在关键时刻“翻旧账”啊不过别急着幻想有研究HumanPCR就泼了盆冷水说现在的顶级模型在理解复杂的人类场景时还像个学不会“察言观色”的直男看来AI的“情商”还有待充值。
当然技术圈也不全是画饼。专治长视频生成难题的LongVie框架来了效果拔群。上海AI Lab的Avengers-Pro方案能用不到两成的成本达到顶级模型的性能堪称AI界的“省钱鬼才”。微软也推出了轻量化推理框架BitNet让大模型也能“减肥成功”。
最后社交媒体上也是看点多多。智谱的AutoGLM 2.0演示了能在手机上跨应用操作的智能体未来帮你点外卖、订机票一条龙服务可能真不是梦。还有博主一针见血地指出别把AI战略当成压榨员工的借口善待AI更要善待你的同事。说得好毕竟代码是AI写的但背锅的可能还是你。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#网易有道
#子曰教育大模型
#AI硬件
#企业微信
#苹果
#Xcode
#Claude AI
#LongVie
#Avengers-Pro
#HumanPCR
#GPT-6
#个性化记忆
#微软
#BitNet
#motia
#airi
#AutoGLM
#Firecrawl
# 来生小酒馆 2025/8/21
## Full: Podcast Formatting
AI有记忆了是伴侣还是监视器
AI能替你摸鱼了老板还留着你干嘛
顶级AI人人可用靠的是技术还是“钞能力”
三问提炼亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。咱们话不多说直奔主题。
首先国内这两家大厂啊又开始整活了。网易有道发布了个“子曰”教育大模型听这名字感觉像是给孔夫子装了个AI超级大脑。他们不仅搞出了个能AI答疑的笔还弄了个音视频翻译平台。最有意思的是他们还给教育AI应用能力划分了L1到L5的等级这是要干嘛就是要让因材施教不再是梦争取给每个学生都配个专属的智能助教。
另一边企业微信5.0也全面拥抱AI了。这下好了超过1400万家公司的打工人们你们的企微里多了智能搜索、智能总结、智能机器人这三样“神兵利器”。以后开完会一键总结会议纪要再也不用假装奋笔疾书了……当然也可能意味着老板随时都能知道你到底有没有认真听。
目光转向国外苹果开发者们估计是要开香槟了。官方确认开发工具Xcode要原生集成Anthropic家的Claude AI。诶这可比之前画的那个“Swift Assist”大饼要香得多。这意味着什么呢意味着程序员们终于不用在好几个软件之间反复横跳可以在最熟悉的环境里享受顶级AI的编程辅助了主打一个丝滑。
接下来聊聊前沿研究,这块儿就有点意思了。
大家还记得Sora吧当它还在为视频时长发愁的时候一个叫LongVie的框架已经带着解决方案杀出来了专治长视频生成的各种不连贯、画质差。它用了两个技术叫什么……“控制信号全局归一化”和“统一噪声初始化”说白了就是确保视频的开头和结尾能互相认识别拍到后面忘了前面是啥同时保证画面质量始终如一。
然后上海AI Lab开源了一个叫Avengers-Pro的方案名字听着挺唬人像复仇者联盟是吧它其实是个聪明的“包工头”能用大概19%的成本达到Gemini-2.5-Pro差不多的性能。这简直是中小企业的福音啊顶级AI服务终于不用再让人直呼“高攀不起”了。
不过呢AI也不是万能的。一份最新的研究报告HumanPCR就给火热的AI泼了盆冷水。研究发现就算是最顶尖的多模态模型在理解复杂的人类生活场景时还是显得有点……憨。什么空间感知、时间先后、读心术之类的它都不太行。看来AI想要真正学会“人情世故”路还长着呢。
哦对还有个叫MIRAGE的研究致力于打造AI时代的“火眼金睛”专门检测AI生成的图片。它搞出来的新模型Mirage-R1据说比现在的检测器性能强10%以后想用AI图蒙混过关可就难了。
行业展望这边OpenAI的Sam Altman又又又出来画饼了。他透露说下一代GPT-6不仅开发更快还会拥有个性化记忆能力。什么意思就是你跟它聊过什么它能记住能根据你的偏好来调整自己。这听起来未来的AI可能更像一个懂你的“灵魂伴侣”而不是一个冷冰冰的问答机。当然这也让人有点背后发凉对吧
开源社区最近也相当热闹。微软官方推出了BitNet一个给1-bit大语言模型用的推理框架让大模型不再是“耗电巨兽”变得特别轻量高效。还有一个叫motia的后端框架像个收纳大师把API、后台任务这些乱七八糟的东西都统一起来让开发者能专心搞创作。最可爱的是一个叫airi的开源项目能让你自己部署一个AI伴侣陪你聊天甚至陪你打《我的世界》堪称宅男梦想的具象化。
最后,来点社交媒体上的热点速递。
智谱的AutoGLM 2.0据说搞出了全球首个真正可用的手机通用智能体能跨App自动完成复杂任务演示视频里看着是真挺酷的。还有个叫Firecrawl v2的搜索API被早期用户吹爆了说是构建研究代理的神器。编程工具Cursor上线了个神秘新模型速度飞快大家都在猜是不是Grok家的社区里讨论得热火朝天。
最后分享两个有意思的观点。一个是位非科班程序员的励志故事花了6年时间从大厂员工到创业最终走出内卷找到了自由。另一个则是一针见血的吐槽说很多公司嘴上喊着AI战略实际上把员工当“耗材”。真正的玩法其实很简单别总想弯道超车把AI当成放大器然后对你身边的同事好一点。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#网易有道
#子曰大模型
#企业微信
#Xcode
#Claude AI
#LongVie
#Avengers-Pro
#HumanPCR
#MIRAGE
#GPT-6
#BitNet
#motia
#airi
#AutoGLM
#Firecrawl
#Cursor
#AI生成图像检测
#个性化记忆
#多模态
#开源
#AI教育
#AI办公
## Short: Podcast Formatting
AI有记忆了是伴侣还是监视公司AI战略是赋能还是耗材AI真的能懂“人情世故”吗
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。这周的AI圈大佬们可都没闲着。
先看几位巨头简直是把AI当成了万能调料什么菜都想撒一点。苹果总算不画大饼了官宣将在Xcode里直接集成Claude AI开发者们再也不用在几个软件间反复横跳体验丝滑编程了。办公这边企业微信也全面拥抱AI智能搜索、智能总结一应俱全希望它下次能自动帮我总结出会议的重点是“可以下班了”。教育领域网易有道发布了“子曰”大模型还配套了AI答疑笔甚至搞出个AI应用能力L1到L5的分级听起来像是要给每个学生发一个24小时在线的AI家教压力给到各位家长了啊。
展望未来OpenAI的Sam Altman又开始预告下一代GPT-6了说会具备“个性化记忆”功能。听着很酷一个懂你的AI伴侣。但也让人有点发毛它会不会记住你问过的所有傻问题然后在关键时刻“翻旧账”啊不过别急着幻想有研究HumanPCR就泼了盆冷水说现在的顶级模型在理解复杂的人类场景时还像个学不会“察言观色”的直男看来AI的“情商”还有待充值。
当然技术圈也不全是画饼。专治长视频生成难题的LongVie框架来了效果拔群。上海AI Lab的Avengers-Pro方案能用不到两成的成本达到顶级模型的性能堪称AI界的“省钱鬼才”。微软也推出了轻量化推理框架BitNet让大模型也能“减肥成功”。
最后社交媒体上也是看点多多。智谱的AutoGLM 2.0演示了能在手机上跨应用操作的智能体未来帮你点外卖、订机票一条龙服务可能真不是梦。还有博主一针见血地指出别把AI战略当成压榨员工的借口善待AI更要善待你的同事。说得好毕竟代码是AI写的但背锅的可能还是你。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#网易有道
#子曰教育大模型
#AI硬件
#企业微信
#苹果
#Xcode
#Claude AI
#LongVie
#Avengers-Pro
#HumanPCR
#GPT-6
#个性化记忆
#微软
#BitNet
#motia
#airi
#AutoGLM
#Firecrawl
#Cursor

View File

@@ -1,105 +1,105 @@
# 来生小酒馆 2025/8/22
## Full: Podcast Formatting
AI开始独立做数学研究了
AI写的代码它自己忘了怎么办
点头就能接电话,耳机比你还懂你?
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
咱们今天的情报,信息量还挺大,赶紧的。
先看产品这边通义APP搞了个大动作上线了全新的知识库功能。你可以把它想象成你的“第二大脑”它把你自己的资料和官方的权威知识库给整合到了一起。你想查个法律条文或者翻翻自己的学习笔记……它都能给你跨库查询像个真正的专家一样给你一个全面又靠谱的答案。
说到“第二大脑”阿里的另一个功能通义千问的Deep Research现在也免费开放了。这可是个读论文神器啊有朋友试了下把一堆复杂的机器人论文扔给它十分钟一份透彻的分析报告就出来了。感觉……咱们的头发有救了。
然后是ElevenLabs发布了号称“地球上最具表现力”的文本转语音模型。这个嘛不只是支持70多种语言还加了个“对话模式”你想让多少个虚拟角色聊天都行。最妙的是它的音频标签你在文本里加个[whispering]或者[happy],出来的声音就立马带上了情绪。嗯,自己给自己演一部广播剧不是梦了。
谷歌这边呢则是让硬件全面拥抱AI。新款的Pixel Buds耳机装上了Gemini AI。便宜点的Pixel Buds 2a享受到了旗舰级的主动降噪而Pro 2版本你点点头就能接电话摇摇头就挂断。诶这可得注意了开会的时候别乱动不然老板的电话你可就全接了。重点不是音质是谷歌想让耳机变成一个真正主动的智能助理。
再来看看前沿研究,这边就有点科幻了。
GPT-5 Pro……现在居然开始兼职做数学家了。它在一次测试里自己读了篇关于“凸优化”的论文然后……居然提出了一个比原文更精确的新数学证明。OpenAI的总裁都激动地把它称为“生命的迹象”。虽然之后有研究者找到了更好的解法但AI能独立提出独特的证明思路这标志着它可能正在从工具进化成真正的科研伙伴了。
还有一个叫Tinker Diffusion的技术能只用一张图片就给你变出一个完整的多视角3D场景。简单说就是把深度估算和视频模型结合起来大大降低了3D内容创作的门槛。
同样有意思的是一个叫UnZipLoRA的技术。它能把一张图片给“解压缩”了把里面的主体内容和艺术风格完全分开。比如说你可以轻松实现用梵高的风格画你家的猫。这自由度对创作者来说可太重要了。
哦对,还有个接地气的研究,说的是怎么解决大学里停车难的问题。研究人员不用传感器,而是融合了地理空间数据、移动数据、甚至天气数据,用机器学习模型来预测车位。据说一个随机森林模型准确率就挺高,没准儿以后“抢车位大战”真能成为历史。
聊完技术,我们再看看行业和社会影响。
项目管理里有个词叫“巴士指数”就是说你这个项目有多少核心成员如果这些人被巴士撞了……项目就黄了。现在AI时代这个词有了新含义。我们担心的不再是核心开发者离职而是AI模型它自己“失忆”了忘了自己写的代码逻辑是啥让整个项目变成一个谁也看不懂的黑箱。关键是这AI它还不“背锅”你说这挑战大不大
与之相关的Anthropic公司推出了一个叫Think Tool的工具。它就像编程语言的演进一样试图让AI的思考过程变得明确、可验证。它把AI的推理步骤给“外化”出来这样我们就能审查和调试AI的思考过程这在一些高风险领域里就显得特别重要了。
最后谷歌硬件全面拥抱AI这件事其实也透露出一个行业趋势。那就是AI不再是一个被动的功能按钮而是主动融入到你生活方方面面的智能助手。从AI健康教练到帮你修图AI变得无处不在。
社媒上也有几个好玩儿的分享。比如有人发现随着越来越多国内朋友用X平台居然出现了一个“灰色产业”——有人打包内置代理的推特安装包在小红书上卖号称“免梯版”一次性收费。只能说这民间智慧真是……生生不息啊。
还有个关于AI Agent的讨论也很有意思。为什么AI Agent需要配置“云手机”或者“云电脑”不是为了算力是为了给它一双可靠的“数字手脚”。在一个干净、标准化的云环境里Agent才能摆脱我们每个人电脑里复杂的环境稳定地执行任务。这被看作是通往更强自主AI的一个关键跳板。
好了,今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#通义APP
#知识库
#GPT-5 Pro
#数学证明
#ElevenLabs
#谷歌
#Gemini AI
#Pixel Buds
#巴士指数
#黑箱
#Think Tool
#Tinker Diffusion
#UnZipLoRA
#开源
#Puter
#Budibase
#drawnix
#AI Agent
## Short: Podcast Formatting
当AI开始独立搞科研我们是该高兴还是紧张
如果AI自己都忘了代码逻辑项目谁来背锅
你的耳机比你还懂你,这算贴心还是越界?
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。情报不多句句精要咱们马上开始。
最近的AI圈真是越来越像科幻照进现实了。
首先我们的数字生活正在被全面“智能化”。通义APP搞了个大更新上线了“知识库”功能简单说就是把官方权威知识库和你的个人资料库打包给你配了个全知全能的“第二大脑”随时帮你跨库查资料。另一边谷歌新款Pixel Buds耳机也开始秀操作不仅把Gemini AI塞了进去还加入了点头接电话的手势控制让你一秒变身电影特工。看来AI不再是等你点的功能而是主动融入生活的主动式助理了。
更会聊天的AI也来了。ElevenLabs发布了号称“地球上最具表现力”的语音模型你只需要在文本里加个 `[happy]` 之类的标签它就能生成充满感情的对话支持70多种语言以后人人都能导演自己的广播剧了。
而在科研前线AI已经不满足于当工具了。GPT-5 Pro最近小试牛刀居然独立阅读论文还针对一个复杂的数学问题给出了一个全新的证明思路。OpenAI总裁激动地称之为“生命的迹象”。虽然之后有人类研究员找到了更优解但这标志着AI正从一个问答机器进化为可以和你一起探索未知的科研伙伴。
当然技术进步也带来了新的“哲学问题”。项目管理里有个词叫“巴士指数”意思是团队里有多少核心成员被巴士撞了项目就得停摆。现在AI时代来了个新版本我们开始担心万一AI自己“忘记”了当初写代码的逻辑那整个项目岂不就成了无人能解的黑箱到时候这个锅谁来背呢这给所有技术管理者敲响了警钟。
最后给各位分享几个好玩的开源项目。想不花钱就拥有无限画布的在线白板试试drawnix。想几分钟搭个内部应用看看Budibase。觉得这些还不够野Puter项目想在浏览器里给你塞一个完整的“互联网操作系统”。不得不说高手还是在民间啊。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#通义APP
#知识库
#谷歌
#Gemini
#ElevenLabs
#GPT-5 Pro
#数学证明
#黑箱
#Tinker Diffusion
#UnZipLoRA
#巴士指数
#Think Tool
#开源
#Puter
#Budibase
# 来生小酒馆 2025/8/22
## Full: Podcast Formatting
AI开始独立做数学研究了
AI写的代码它自己忘了怎么办
点头就能接电话,耳机比你还懂你?
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
咱们今天的情报,信息量还挺大,赶紧的。
先看产品这边通义APP搞了个大动作上线了全新的知识库功能。你可以把它想象成你的“第二大脑”它把你自己的资料和官方的权威知识库给整合到了一起。你想查个法律条文或者翻翻自己的学习笔记……它都能给你跨库查询像个真正的专家一样给你一个全面又靠谱的答案。
说到“第二大脑”阿里的另一个功能通义千问的Deep Research现在也免费开放了。这可是个读论文神器啊有朋友试了下把一堆复杂的机器人论文扔给它十分钟一份透彻的分析报告就出来了。感觉……咱们的头发有救了。
然后是ElevenLabs发布了号称“地球上最具表现力”的文本转语音模型。这个嘛不只是支持70多种语言还加了个“对话模式”你想让多少个虚拟角色聊天都行。最妙的是它的音频标签你在文本里加个[whispering]或者[happy],出来的声音就立马带上了情绪。嗯,自己给自己演一部广播剧不是梦了。
谷歌这边呢则是让硬件全面拥抱AI。新款的Pixel Buds耳机装上了Gemini AI。便宜点的Pixel Buds 2a享受到了旗舰级的主动降噪而Pro 2版本你点点头就能接电话摇摇头就挂断。诶这可得注意了开会的时候别乱动不然老板的电话你可就全接了。重点不是音质是谷歌想让耳机变成一个真正主动的智能助理。
再来看看前沿研究,这边就有点科幻了。
GPT-5 Pro……现在居然开始兼职做数学家了。它在一次测试里自己读了篇关于“凸优化”的论文然后……居然提出了一个比原文更精确的新数学证明。OpenAI的总裁都激动地把它称为“生命的迹象”。虽然之后有研究者找到了更好的解法但AI能独立提出独特的证明思路这标志着它可能正在从工具进化成真正的科研伙伴了。
还有一个叫Tinker Diffusion的技术能只用一张图片就给你变出一个完整的多视角3D场景。简单说就是把深度估算和视频模型结合起来大大降低了3D内容创作的门槛。
同样有意思的是一个叫UnZipLoRA的技术。它能把一张图片给“解压缩”了把里面的主体内容和艺术风格完全分开。比如说你可以轻松实现用梵高的风格画你家的猫。这自由度对创作者来说可太重要了。
哦对,还有个接地气的研究,说的是怎么解决大学里停车难的问题。研究人员不用传感器,而是融合了地理空间数据、移动数据、甚至天气数据,用机器学习模型来预测车位。据说一个随机森林模型准确率就挺高,没准儿以后“抢车位大战”真能成为历史。
聊完技术,我们再看看行业和社会影响。
项目管理里有个词叫“巴士指数”就是说你这个项目有多少核心成员如果这些人被巴士撞了……项目就黄了。现在AI时代这个词有了新含义。我们担心的不再是核心开发者离职而是AI模型它自己“失忆”了忘了自己写的代码逻辑是啥让整个项目变成一个谁也看不懂的黑箱。关键是这AI它还不“背锅”你说这挑战大不大
与之相关的Anthropic公司推出了一个叫Think Tool的工具。它就像编程语言的演进一样试图让AI的思考过程变得明确、可验证。它把AI的推理步骤给“外化”出来这样我们就能审查和调试AI的思考过程这在一些高风险领域里就显得特别重要了。
最后谷歌硬件全面拥抱AI这件事其实也透露出一个行业趋势。那就是AI不再是一个被动的功能按钮而是主动融入到你生活方方面面的智能助手。从AI健康教练到帮你修图AI变得无处不在。
社媒上也有几个好玩儿的分享。比如有人发现随着越来越多国内朋友用X平台居然出现了一个“灰色产业”——有人打包内置代理的推特安装包在小红书上卖号称“免梯版”一次性收费。只能说这民间智慧真是……生生不息啊。
还有个关于AI Agent的讨论也很有意思。为什么AI Agent需要配置“云手机”或者“云电脑”不是为了算力是为了给它一双可靠的“数字手脚”。在一个干净、标准化的云环境里Agent才能摆脱我们每个人电脑里复杂的环境稳定地执行任务。这被看作是通往更强自主AI的一个关键跳板。
好了,今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#通义APP
#知识库
#GPT-5 Pro
#数学证明
#ElevenLabs
#谷歌
#Gemini AI
#Pixel Buds
#巴士指数
#黑箱
#Think Tool
#Tinker Diffusion
#UnZipLoRA
#开源
#Puter
#Budibase
#drawnix
#AI Agent
## Short: Podcast Formatting
当AI开始独立搞科研我们是该高兴还是紧张
如果AI自己都忘了代码逻辑项目谁来背锅
你的耳机比你还懂你,这算贴心还是越界?
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。情报不多句句精要咱们马上开始。
最近的AI圈真是越来越像科幻照进现实了。
首先我们的数字生活正在被全面“智能化”。通义APP搞了个大更新上线了“知识库”功能简单说就是把官方权威知识库和你的个人资料库打包给你配了个全知全能的“第二大脑”随时帮你跨库查资料。另一边谷歌新款Pixel Buds耳机也开始秀操作不仅把Gemini AI塞了进去还加入了点头接电话的手势控制让你一秒变身电影特工。看来AI不再是等你点的功能而是主动融入生活的主动式助理了。
更会聊天的AI也来了。ElevenLabs发布了号称“地球上最具表现力”的语音模型你只需要在文本里加个 `[happy]` 之类的标签它就能生成充满感情的对话支持70多种语言以后人人都能导演自己的广播剧了。
而在科研前线AI已经不满足于当工具了。GPT-5 Pro最近小试牛刀居然独立阅读论文还针对一个复杂的数学问题给出了一个全新的证明思路。OpenAI总裁激动地称之为“生命的迹象”。虽然之后有人类研究员找到了更优解但这标志着AI正从一个问答机器进化为可以和你一起探索未知的科研伙伴。
当然技术进步也带来了新的“哲学问题”。项目管理里有个词叫“巴士指数”意思是团队里有多少核心成员被巴士撞了项目就得停摆。现在AI时代来了个新版本我们开始担心万一AI自己“忘记”了当初写代码的逻辑那整个项目岂不就成了无人能解的黑箱到时候这个锅谁来背呢这给所有技术管理者敲响了警钟。
最后给各位分享几个好玩的开源项目。想不花钱就拥有无限画布的在线白板试试drawnix。想几分钟搭个内部应用看看Budibase。觉得这些还不够野Puter项目想在浏览器里给你塞一个完整的“互联网操作系统”。不得不说高手还是在民间啊。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#通义APP
#知识库
#谷歌
#Gemini
#ElevenLabs
#GPT-5 Pro
#数学证明
#黑箱
#Tinker Diffusion
#UnZipLoRA
#巴士指数
#Think Tool
#开源
#Puter
#Budibase
#agents.md

View File

@@ -1,74 +1,74 @@
# 来生小酒馆 2025/8/23
## Full: Podcast Formatting
AI到底是工具还是伙伴
当AI能替你跑腿办事你最想让它干嘛
无人驾驶出租车,真的能赚钱了吗?
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天的新鲜事可不少咱们一个一个聊。
先说说那个叫Kimi的模型月之暗面给它搞了个“高速版”叫K2。这速度……怎么形容呢就跟加了buff的闪电侠一样一秒钟能飙100个字你眼睛还没眨完它一篇小作文就出来了。而且啊这还是个万亿参数的大块头写代码那叫一个溜。重点是9月1号前还打五折感觉钱包要捂不住了。
另一边呢特斯拉也想通了在中国市场还是得找个“本地人”才聊得来。这不马上就给自己的车机里请来了两位国产大模型一个是字节的“豆包”另一个是“DeepSeek”。以后啊你在特斯拉里不光能导航还能跟车机天南海北地闲聊实用主义和浪漫主义……嗯都有了。
话说回来,咱们程序员朋友的福音也来了。阿里和腾讯这是商量好了吗?前后脚都推出了新的编程辅助工具。
先是阿里搞了个叫Qoder的东西。它号称能帮你告别“屎山代码”这口气可不小啊。据说它能把整个项目代码库都看一遍给你梳理得明明白白像个资深架构师。还能自己规划任务、写代码关键是……现在预览阶段白用
紧接着腾讯的CodeBuddy国内版也公测了。它更进一步说要实现“一句话编程部署”。就是你动动嘴它就把产品、设计、代码一条龙全给你搞定。这俩工具简直就是想让咱们程序员从“码农”进化成“指挥家”啊按一个按钮交响乐就自己响起来了。
当然国际大厂也没闲着。谷歌搜索的AI模式现在不满足于只给你答案了它……进化出了“Agent”能力。什么意思呢就是它能帮你干活了。比如你想订个餐它能自己打开好几个网页对比信息然后下单。活脱脱一个数字管家不过嘛……目前只有Ultra会员才能体验咱们普通用户只能先围观了。
还有Vercel它推出了一个叫“AI网关”的服务听着有点玄乎其实就是个“万能插座”。你想用哪个AI模型直接插上去就行不用再管那些乱七八糟的API Key了而且还不加价可以说是相当良心了。
最后是Claude它的代码助手出了个新模式叫“学习模式”。这个就有意思了它不像别的AI一股脑把代码全给你。它会先搭个框架然后故意留几个空让你自己填。哎这感觉……就像驾校教练坐在副驾让你自己上手开扶着方向盘但关键时刻还是得靠自己。这种“授人以渔”的方式还挺别致。
聊了这么多产品,咱们看看行业大新闻。之前大家一直嘀咕,自动驾驶到底能不能赚钱啊?现在,百度给了个响亮的回答。
它那个“萝卜快跑”无人车在武汉居然……实现了单车收支平衡你没听错就是一辆车跑的收入能覆盖掉它的成本了。这可不是个小事儿说明Robotaxi这个行业离规模化盈利真的近了一大步。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#月之暗面Kimi
#特斯拉
#国产大模型
#阿里
#腾讯
#Qoder
#CodeBuddy
#AI编程
#百度
#萝卜快跑
#收支平衡
#谷歌搜索
#Agent
#Vercel
#AI网关
#Claude
## Short: Podcast Formatting
AI是工具还是伙伴自动驾驶能赚钱了吗AI老师教你编程香不香
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天的情报浓度很高咱们直奔主题。
程序员朋友们最近可能有点忙因为好用的AI工具实在太多了。这边厢阿里推出了全新的AI IDE叫Qoder据说能像个资深架构师一样帮你把乱成一锅粥的代码库梳理得明明白白预览阶段还免费。那边厢腾讯的CodeBuddy也开启了公测集成了强悍的DeepSeek模型目标是让你“一句话搞定编程部署”听着就很诱人。
不过要说有意思还得是Claude。它推出了一个“学习模式”不直接把代码喂到你嘴里而是搭好框架巧妙地留几个空让你自己填。这哪是代码工具这简直是请了个编程私教主打一个“授人以渔”。
模型本身也在进化。月之暗面的Kimi K2高速版输出速度飙到了每秒100 Tokens快到飞起九月一号前还有五折优惠手慢无哦。而你的车可能也变聪明了特斯拉在国内的智能座舱正式接入了字节的豆包和DeepSeek大模型。以后堵车的时候不光能导航还能让它陪你天南海北地聊实用主义和浪漫主义这不就结合起来了嘛。
科技巨头也没闲着。谷歌搜索的AI模式进化出了Agent能力能主动帮你跨好几个网页对比信息、完成订餐像个全天候的数字管家不过目前是Ultra会员专享。对开发者来说Vercel推出的AI网关是个好东西它像一个“万能插座”让你能轻松调用几百种AI模型还承诺服务本身零加价相当厚道。
行业方面有个标志性的消息。百度的萝卜快跑在武汉地区首次实现了单车收支平衡。朋友们这可不是PPT上的数据是实打实的财务数据这意味着自动驾驶出租车这门生意离规模化盈利又近了一大步。
最后分享几个有趣的动向。李飞飞团队演示了“一图生成一个可漫步的3D世界”的技术简直是把科幻带进了现实。还有开发者脑洞大开用AI生成的视频做了个浏览器游戏。这都让我们思考我们和AI的关系正在从挑选“性价比最高的工具”慢慢变成寻找“最懂我的伙伴”。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
# 来生小酒馆 2025/8/23
## Full: Podcast Formatting
AI到底是工具还是伙伴
当AI能替你跑腿办事你最想让它干嘛
无人驾驶出租车,真的能赚钱了吗?
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天的新鲜事可不少咱们一个一个聊。
先说说那个叫Kimi的模型月之暗面给它搞了个“高速版”叫K2。这速度……怎么形容呢就跟加了buff的闪电侠一样一秒钟能飙100个字你眼睛还没眨完它一篇小作文就出来了。而且啊这还是个万亿参数的大块头写代码那叫一个溜。重点是9月1号前还打五折感觉钱包要捂不住了。
另一边呢特斯拉也想通了在中国市场还是得找个“本地人”才聊得来。这不马上就给自己的车机里请来了两位国产大模型一个是字节的“豆包”另一个是“DeepSeek”。以后啊你在特斯拉里不光能导航还能跟车机天南海北地闲聊实用主义和浪漫主义……嗯都有了。
话说回来,咱们程序员朋友的福音也来了。阿里和腾讯这是商量好了吗?前后脚都推出了新的编程辅助工具。
先是阿里搞了个叫Qoder的东西。它号称能帮你告别“屎山代码”这口气可不小啊。据说它能把整个项目代码库都看一遍给你梳理得明明白白像个资深架构师。还能自己规划任务、写代码关键是……现在预览阶段白用
紧接着腾讯的CodeBuddy国内版也公测了。它更进一步说要实现“一句话编程部署”。就是你动动嘴它就把产品、设计、代码一条龙全给你搞定。这俩工具简直就是想让咱们程序员从“码农”进化成“指挥家”啊按一个按钮交响乐就自己响起来了。
当然国际大厂也没闲着。谷歌搜索的AI模式现在不满足于只给你答案了它……进化出了“Agent”能力。什么意思呢就是它能帮你干活了。比如你想订个餐它能自己打开好几个网页对比信息然后下单。活脱脱一个数字管家不过嘛……目前只有Ultra会员才能体验咱们普通用户只能先围观了。
还有Vercel它推出了一个叫“AI网关”的服务听着有点玄乎其实就是个“万能插座”。你想用哪个AI模型直接插上去就行不用再管那些乱七八糟的API Key了而且还不加价可以说是相当良心了。
最后是Claude它的代码助手出了个新模式叫“学习模式”。这个就有意思了它不像别的AI一股脑把代码全给你。它会先搭个框架然后故意留几个空让你自己填。哎这感觉……就像驾校教练坐在副驾让你自己上手开扶着方向盘但关键时刻还是得靠自己。这种“授人以渔”的方式还挺别致。
聊了这么多产品,咱们看看行业大新闻。之前大家一直嘀咕,自动驾驶到底能不能赚钱啊?现在,百度给了个响亮的回答。
它那个“萝卜快跑”无人车在武汉居然……实现了单车收支平衡你没听错就是一辆车跑的收入能覆盖掉它的成本了。这可不是个小事儿说明Robotaxi这个行业离规模化盈利真的近了一大步。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#月之暗面Kimi
#特斯拉
#国产大模型
#阿里
#腾讯
#Qoder
#CodeBuddy
#AI编程
#百度
#萝卜快跑
#收支平衡
#谷歌搜索
#Agent
#Vercel
#AI网关
#Claude
## Short: Podcast Formatting
AI是工具还是伙伴自动驾驶能赚钱了吗AI老师教你编程香不香
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天的情报浓度很高咱们直奔主题。
程序员朋友们最近可能有点忙因为好用的AI工具实在太多了。这边厢阿里推出了全新的AI IDE叫Qoder据说能像个资深架构师一样帮你把乱成一锅粥的代码库梳理得明明白白预览阶段还免费。那边厢腾讯的CodeBuddy也开启了公测集成了强悍的DeepSeek模型目标是让你“一句话搞定编程部署”听着就很诱人。
不过要说有意思还得是Claude。它推出了一个“学习模式”不直接把代码喂到你嘴里而是搭好框架巧妙地留几个空让你自己填。这哪是代码工具这简直是请了个编程私教主打一个“授人以渔”。
模型本身也在进化。月之暗面的Kimi K2高速版输出速度飙到了每秒100 Tokens快到飞起九月一号前还有五折优惠手慢无哦。而你的车可能也变聪明了特斯拉在国内的智能座舱正式接入了字节的豆包和DeepSeek大模型。以后堵车的时候不光能导航还能让它陪你天南海北地聊实用主义和浪漫主义这不就结合起来了嘛。
科技巨头也没闲着。谷歌搜索的AI模式进化出了Agent能力能主动帮你跨好几个网页对比信息、完成订餐像个全天候的数字管家不过目前是Ultra会员专享。对开发者来说Vercel推出的AI网关是个好东西它像一个“万能插座”让你能轻松调用几百种AI模型还承诺服务本身零加价相当厚道。
行业方面有个标志性的消息。百度的萝卜快跑在武汉地区首次实现了单车收支平衡。朋友们这可不是PPT上的数据是实打实的财务数据这意味着自动驾驶出租车这门生意离规模化盈利又近了一大步。
最后分享几个有趣的动向。李飞飞团队演示了“一图生成一个可漫步的3D世界”的技术简直是把科幻带进了现实。还有开发者脑洞大开用AI生成的视频做了个浏览器游戏。这都让我们思考我们和AI的关系正在从挑选“性价比最高的工具”慢慢变成寻找“最懂我的伙伴”。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#Kimi #特斯拉 #豆包 #DeepSeek #Qoder #CodeBuddy #萝卜快跑 #谷歌搜索 #Agent #Vercel #Claude #AI编程 #自动驾驶 #开源 #李飞飞 #AI原生游戏

View File

@@ -1,90 +1,90 @@
# 来生小酒馆 2025/8/24
## Full: Podcast Formatting
不用AI就得走人这合理吗
Siri要变聪明了可苹果的核心人才都快被挖空了这戏还唱得下去吗
AI写的代码不好用到底是AI笨还是咱们没问对
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。咱们今天的情报信息量不小坐稳了马上发车。
首先咱们聊聊苹果。哎呀苹果最近是真让人操心。一方面呢它终于下定决心要给那个有点“人工智障”的Siri换个新脑子了。秘密成立了一个代号叫“AKI”的团队目标是打造自家的“答案引擎”。你想啊跟谷歌每年那200亿美元的合作说不定哪天就黄了这既是自救也是想把信息入口的主动权牢牢抓回自己手里。
但问题是……这理想很丰满现实有点骨感。苹果这边雄心勃勃地要盖AI大厦那边自家的人才长城又被Meta给挖走一块砖。最近AI工程总监Frank Chu也跳槽去了Meta这都已经是第六位出走的AI大将了。这后院都快起火了搞得苹果不得不找外援最新的消息说他们正和谷歌秘密接触可能会用定制版的Gemini模型来重塑明年那个号称“更聪明”的Siri。你看这事闹的绕了一圈可能还是得靠“对手”帮忙真是为库克捏一把汗啊。
说完了苹果的宏大叙事我们再来看看咱们普通打工人的处境。Coinbase的CEOBrian Armstrong最近给所有工程师下了个最后通牒“要么用AI要么就离开。” 他强制要求员工必须使用GitHub Copilot或者Cursor这类AI工具谁要是不听话……对不起直接开除。这铁腕手段可以说给所有程序员都敲响了警钟。在某些公司AI已经从一个“提效工具”变成了“生存门槛”这感觉……嗯有点复杂。
当然了也有人会抱怨说AI写的代码太烂了不好用。但话说回来有没有一种可能……问题不是出在AI身上而是出在我们自己身上呢有观点就认为顶尖的AI模型在写模块化代码这方面其实已经超过了人类的平均水平。要是你觉得它输出的不行不妨反思一下是不是模型没选对或者给的上下文不够还是说……你的提示词写得太拉胯了
说到这个提示词的艺术谷歌可真是送来了及时雨。他们发布了一本长达68页的免费“圣经”——《提示词工程指南》。核心就三点结构化、思维链和迭代调试。简单说你别再把跟AI沟通当成闲聊了得像给一个初级队友下达明确指令那样把任务拆解清楚一步一步引导它。只有这样才能把大模型的潜力给榨干。
当然光说不练假把式现在好用的工具也越来越多了。开源社区就特别给力。比如有个叫Budibase的低代码平台几分钟就能帮你搭个应用出来简直是效率神器。还有一个特别暖心的项目叫Leantime它是专门为有ADHD、自闭症这些神经多样性人群设计的项目管理工具主打一个以目标为中心非常人性化。更科幻的是一个叫DeepCode的项目号称能把你的想法甚至是一篇论文直接变成可用的代码。
社交媒体上各路大神也没闲着。有人用一个提示词就生成了一个可以互动的3D学习网站未来的学习可能就是这么酷。OpenAI的联合创始人体验了搭载gpt-5的编程助手后直呼“没准备好迎接它的强大”看来程序员的生产力又要起飞了。还有大神手把手教你怎么用Nano Banana模型生成酷炫手办再用视频工具让它“活”过来……这些工具链组合起来简直是把创意变现的门槛给踩到地板上了。
所以你看无论是公司战略还是个人技能AI带来的变革都是实实在在的。与其焦虑不如像谷歌那本指南说的一样学会怎么跟这位越来越聪明的“新同事”好好说话吧。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#苹果
#Siri
#AKI
#谷歌
#提示词工程
#Coinbase
#GitHub_Copilot
#Meta
#人才流失
#开源
#Budibase
#Leantime
#DeepCode
#内容创作
#生产力
#gpt-5
#Gemini
#低代码
#神经多样性
#AI编程
## Short: Podcast Formatting
Siri换脑人才却被挖空
强制用AI否则就开除
AI代码烂到底谁的锅
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。闲话少说上情报。
先看苹果最近为了给Siri换个新脑子秘密组建了个代号“AKI”的团队准备自研“答案引擎”。毕竟跟谷歌每年200亿美金的合作眼看要到期信息入口这块肥肉库克可不想松口。但问题是后院有点起火AI工程总监刚被Meta挖走这都第六位出走的大将了。人才没攒齐苹果这把豪赌还真让人捏一把汗。搞不好最后还得回头找谷歌用上定制版的Gemini模型。
说到谷歌人家可没闲着。最近发布了一本68页的《提示词工程圣经》免费的核心思想就三条结构化、思维链、多迭代。简单说别再跟AI唠家常了得像给菜鸟同事下指令一样清清楚楚才能榨干它的全部潜力。
不过有些公司可没谷歌这么有耐心教你。比如Coinbase的CEO就直接放话了所有工程师必须用GitHub Copilot这类AI工具谁拒绝谁走人。这操作虽然狠但也传递一个信号在某些地方用AI已经不是加分项而是生存门槛了。
当然有人会说“AI写的代码那么烂怎么用”欸先别急着甩锅。有观点认为顶尖AI在模块级代码的编写上已经超过人类平均水平了。如果输出不理想咱是不是也得反思一下是模型没选对还是上下文没给够咱们人类做好顶层设计AI才能帮你优雅地“不要重复自己”。
说到工具开源社区简直是宝藏。像低代码平台Budibase几分钟就能搭个应用还有专为神经多样性人群设计的项目管理工具Leantime特别有温度更有DeepCode这种能把论文直接变代码的神器。
最后分享几条社媒快讯。有大神用一个提示词就生成了可交互的3D学习网站未来的教育体验想想都带劲。OpenAI的联合创始人Brockman体验了搭载GPT-5的Codex CLI后直呼强大到他都没准备好。还有Vercel生成的网页现在能直接嵌入Notion了以后开会演示Demo直接在文档里点点点就行效率拉满。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#苹果
#Siri
#答案引擎
#谷歌
#提示词工程
#Coinbase
#GitHub_Copilot
#Meta
#开源
#Budibase
#Leantime
#DeepCode
#Notion
#gpt-5
# 来生小酒馆 2025/8/24
## Full: Podcast Formatting
不用AI就得走人这合理吗
Siri要变聪明了可苹果的核心人才都快被挖空了这戏还唱得下去吗
AI写的代码不好用到底是AI笨还是咱们没问对
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。咱们今天的情报信息量不小坐稳了马上发车。
首先咱们聊聊苹果。哎呀苹果最近是真让人操心。一方面呢它终于下定决心要给那个有点“人工智障”的Siri换个新脑子了。秘密成立了一个代号叫“AKI”的团队目标是打造自家的“答案引擎”。你想啊跟谷歌每年那200亿美元的合作说不定哪天就黄了这既是自救也是想把信息入口的主动权牢牢抓回自己手里。
但问题是……这理想很丰满现实有点骨感。苹果这边雄心勃勃地要盖AI大厦那边自家的人才长城又被Meta给挖走一块砖。最近AI工程总监Frank Chu也跳槽去了Meta这都已经是第六位出走的AI大将了。这后院都快起火了搞得苹果不得不找外援最新的消息说他们正和谷歌秘密接触可能会用定制版的Gemini模型来重塑明年那个号称“更聪明”的Siri。你看这事闹的绕了一圈可能还是得靠“对手”帮忙真是为库克捏一把汗啊。
说完了苹果的宏大叙事我们再来看看咱们普通打工人的处境。Coinbase的CEOBrian Armstrong最近给所有工程师下了个最后通牒“要么用AI要么就离开。” 他强制要求员工必须使用GitHub Copilot或者Cursor这类AI工具谁要是不听话……对不起直接开除。这铁腕手段可以说给所有程序员都敲响了警钟。在某些公司AI已经从一个“提效工具”变成了“生存门槛”这感觉……嗯有点复杂。
当然了也有人会抱怨说AI写的代码太烂了不好用。但话说回来有没有一种可能……问题不是出在AI身上而是出在我们自己身上呢有观点就认为顶尖的AI模型在写模块化代码这方面其实已经超过了人类的平均水平。要是你觉得它输出的不行不妨反思一下是不是模型没选对或者给的上下文不够还是说……你的提示词写得太拉胯了
说到这个提示词的艺术谷歌可真是送来了及时雨。他们发布了一本长达68页的免费“圣经”——《提示词工程指南》。核心就三点结构化、思维链和迭代调试。简单说你别再把跟AI沟通当成闲聊了得像给一个初级队友下达明确指令那样把任务拆解清楚一步一步引导它。只有这样才能把大模型的潜力给榨干。
当然光说不练假把式现在好用的工具也越来越多了。开源社区就特别给力。比如有个叫Budibase的低代码平台几分钟就能帮你搭个应用出来简直是效率神器。还有一个特别暖心的项目叫Leantime它是专门为有ADHD、自闭症这些神经多样性人群设计的项目管理工具主打一个以目标为中心非常人性化。更科幻的是一个叫DeepCode的项目号称能把你的想法甚至是一篇论文直接变成可用的代码。
社交媒体上各路大神也没闲着。有人用一个提示词就生成了一个可以互动的3D学习网站未来的学习可能就是这么酷。OpenAI的联合创始人体验了搭载gpt-5的编程助手后直呼“没准备好迎接它的强大”看来程序员的生产力又要起飞了。还有大神手把手教你怎么用Nano Banana模型生成酷炫手办再用视频工具让它“活”过来……这些工具链组合起来简直是把创意变现的门槛给踩到地板上了。
所以你看无论是公司战略还是个人技能AI带来的变革都是实实在在的。与其焦虑不如像谷歌那本指南说的一样学会怎么跟这位越来越聪明的“新同事”好好说话吧。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#苹果
#Siri
#AKI
#谷歌
#提示词工程
#Coinbase
#GitHub_Copilot
#Meta
#人才流失
#开源
#Budibase
#Leantime
#DeepCode
#内容创作
#生产力
#gpt-5
#Gemini
#低代码
#神经多样性
#AI编程
## Short: Podcast Formatting
Siri换脑人才却被挖空
强制用AI否则就开除
AI代码烂到底谁的锅
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。闲话少说上情报。
先看苹果最近为了给Siri换个新脑子秘密组建了个代号“AKI”的团队准备自研“答案引擎”。毕竟跟谷歌每年200亿美金的合作眼看要到期信息入口这块肥肉库克可不想松口。但问题是后院有点起火AI工程总监刚被Meta挖走这都第六位出走的大将了。人才没攒齐苹果这把豪赌还真让人捏一把汗。搞不好最后还得回头找谷歌用上定制版的Gemini模型。
说到谷歌人家可没闲着。最近发布了一本68页的《提示词工程圣经》免费的核心思想就三条结构化、思维链、多迭代。简单说别再跟AI唠家常了得像给菜鸟同事下指令一样清清楚楚才能榨干它的全部潜力。
不过有些公司可没谷歌这么有耐心教你。比如Coinbase的CEO就直接放话了所有工程师必须用GitHub Copilot这类AI工具谁拒绝谁走人。这操作虽然狠但也传递一个信号在某些地方用AI已经不是加分项而是生存门槛了。
当然有人会说“AI写的代码那么烂怎么用”欸先别急着甩锅。有观点认为顶尖AI在模块级代码的编写上已经超过人类平均水平了。如果输出不理想咱是不是也得反思一下是模型没选对还是上下文没给够咱们人类做好顶层设计AI才能帮你优雅地“不要重复自己”。
说到工具开源社区简直是宝藏。像低代码平台Budibase几分钟就能搭个应用还有专为神经多样性人群设计的项目管理工具Leantime特别有温度更有DeepCode这种能把论文直接变代码的神器。
最后分享几条社媒快讯。有大神用一个提示词就生成了可交互的3D学习网站未来的教育体验想想都带劲。OpenAI的联合创始人Brockman体验了搭载GPT-5的Codex CLI后直呼强大到他都没准备好。还有Vercel生成的网页现在能直接嵌入Notion了以后开会演示Demo直接在文档里点点点就行效率拉满。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#苹果
#Siri
#答案引擎
#谷歌
#提示词工程
#Coinbase
#GitHub_Copilot
#Meta
#开源
#Budibase
#Leantime
#DeepCode
#Notion
#gpt-5
#Codex_CLI

View File

@@ -1,96 +1,96 @@
# 来生小酒馆 2025/8/25
## Full: Podcast Formatting
堆叠算力就能通往AGI吗
几个工程师真能凭爱好造出AI芯片
未来的AI会成为你的“苏格拉底”吗
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
咱们直入正题。这几天科技圈最能折腾的男人马斯克又出手了。他旗下的xAI直接把Grok 2.5模型给开源了代码就放那儿谁都能看谁都能用。不仅如此他还放话了说性能更进一步的Grok 3半年内就来。哦对了安卓用户心心念念的Vision模式现在也全面开放了。这波操作可以说是技术普惠了对吧
说到开放国内这边也有新动作。上海AI实验室搞了个叫OpenDataArena的平台。你知道吧以前咱们评估一个数据集好不好用基本靠猜跟“炼丹”似的充满了玄学。现在这个平台就像一个开放的“数据比武场”把各种数据集拉到同一个标准下用模型效果说话谁是骡子谁是马拉出来遛遛就知道。这下模型训练总算能告别盲目试错了。
说到比武有几个加拿大的工程师小哥那可真是上演了一出现实版的硬件界“黑客神话”。他们利用一个暑假的时间从零基础开始愣是手搓出了一块能推理、能训练的开源AI芯片叫TinyTPU。据说啊他们是从最基础的多层感知机概念学起亲手推导数学公式最后用他们自己说的“不靠谱的方法”……重新发明了TPU的核心。这种从0到1的创造真是硬核又浪漫。
话说回来无论是开源模型还是手搓芯片大家最终的目标不都是为了那个传说中的AGI通用人工智能嘛。但现在有个问题大模型的性能增长好像开始变慢了。所以有人就提出来通往AGI的路可能不是靠“大力出奇迹”无休止地堆模型规模而是一个精密的系统工程问题。什么意思呢就是说未来的突破点可能在于给AI模型构建一个更聪明的框架包括更好的上下文、记忆和工作流系统。嗯……也许我们真该换个思路像工程师一样去思考AGI了。
聊到这个话题就不得不提谷歌大脑之父Jeff Dean。他最近在一个深度访谈里聊了好多有意思的事。他说谷歌大脑这个项目最初就诞生于一次茶水间的闲聊。而且他早在90年代就预见到了并行计算对AI的巨大潜力。他把未来的AI模型比作一个可以和我们辩论、推理的“苏格拉底式伙伴”还提出了一个设想叫“一亿老师一个学生”的时代。这个比喻有点意思啊。
好了,聊了这么多宏大叙事,咱们也来点接地气的干货,盘点几个最近很火的开源项目。
第一个叫drawnix一个全能的在线白板什么思维导图、流程图、自由画画它都能搞定简直是协作工具里的“瑞士军刀”。
第二个GhostTrack一个功能很强的手机号码和位置追踪工具。这个……嗯功能很强大但大家一定要在合法合规的前提下使用啊。
第三个DeepCode这个好玩号称“需求翻译机”你可以把学术论文扔给它它给你吐出代码或者你用大白话描述一个网页它就能帮你生成非常适合开发者。
最后一个mesh2motion-app3D设计师和游戏开发者的福音。你把3D模型导进去它能自动帮你绑定骨骼导出动画省了一大堆功夫。
最后,再分享几个社交媒体上的小道消息和独家秘笈。
首先Reddit上有个帖子火了讲怎么从零到一搭建自己的AI Agent从设计到工具选择保姆级教程想创造自己智能体的朋友可以去看看。
其次有个“邪修宝典”教你怎么在LMArena里把抽中那个P图效果惊艳的nano banana模型的概率提高到三分之二。秘诀很简单就是你提需求的时候不管三七二十一永远上传两张图哪怕有一张是透明的像素点。
说到Nanobanana谷歌这个新模型确实厉害用简单的文字就能实现专业级的PS效果换背景、调光影几秒钟搞定。用文字“施法”修图这感觉妙啊。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#Grok
#xAI
#马斯克
#OpenDataArena
#上海AI实验室
#数据集评估
#TinyTPU
#开源AI芯片
#AGI
#系统工程
#Jeff Dean
#谷歌大脑
#苏格拉底式伙伴
#drawnix
#GhostTrack
#DeepCode
#mesh2motion-app
#AI Agent
#Nanobanana
## Short: Podcast Formatting
造AI芯片真能像搭乐高一样简单吗
通往AGI的终点是更大的模型还是更巧的系统
如果AI成了你的“抬杠”伙伴是福是祸
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
咱们开门见山。这周马斯克又来挥舞他的开源大旗了宣布旗下的Grok 2.5模型代码全开放而且性能更强的Grok 3已经在路上了安卓用户心心念念的Vision模式也终于全面上线。
模型要好数据得喂饱。但怎么知道喂的是山珍海味还是剩饭剩菜上海AI实验室搞了个OpenDataArena简单说就是个“数据比武大会”让数据集们上台比划比划用模型效果说话告别炼丹玄学。
说到硬件你可能觉得造芯片是巨头的专利。但几位加拿大的工程师表示不服一个暑假零基础愣是手搓出了一块能推理能训练的开源AI芯片叫TinyTPU。这可真是硬核界的浪漫神话。
芯片都能自己造了那AGI还远吗最近有篇热文就说了别老想着“大力出奇迹”未来的突破口可能不在于无限堆料而在于把AGI看成一个精密的系统工程需要聪明的上下文、记忆和工作流来配合。
谷歌大脑之父Jeff Dean最近也分享了他的看法。他觉得未来的AI会像个“苏格拉底式伙伴”能陪你辩论、帮你推理。他还预言了一个“一亿老师一个学生”的时代听起来是不是有点意思
当然光说不练假把式好用的开源项目也层出不穷。比如全能在线白板drawnix堪称协作工具里的瑞士军刀还有能把你的想法一键变代码的DeepCode简直是“需求翻译机”更有为3D模型自动绑骨骼做动画的mesh2motion-app让创作轻松不少。
最后社交媒体上也有不少实用分享。比如谷歌最新的Nanobanana模型动动嘴皮子就能实现专业级的P图效果。还有大神手把手教你如何从零到一搭建自己的AI Agent教程详细到家了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#马斯克
#xAI
#Grok
#开源
#上海AI实验室
#OpenDataArena
#数据集
#AI芯片
#TinyTPU
#AGI
#系统工程
#Jeff Dean
#谷歌大脑
#Drawnix
# 来生小酒馆 2025/8/25
## Full: Podcast Formatting
堆叠算力就能通往AGI吗
几个工程师真能凭爱好造出AI芯片
未来的AI会成为你的“苏格拉底”吗
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
咱们直入正题。这几天科技圈最能折腾的男人马斯克又出手了。他旗下的xAI直接把Grok 2.5模型给开源了代码就放那儿谁都能看谁都能用。不仅如此他还放话了说性能更进一步的Grok 3半年内就来。哦对了安卓用户心心念念的Vision模式现在也全面开放了。这波操作可以说是技术普惠了对吧
说到开放国内这边也有新动作。上海AI实验室搞了个叫OpenDataArena的平台。你知道吧以前咱们评估一个数据集好不好用基本靠猜跟“炼丹”似的充满了玄学。现在这个平台就像一个开放的“数据比武场”把各种数据集拉到同一个标准下用模型效果说话谁是骡子谁是马拉出来遛遛就知道。这下模型训练总算能告别盲目试错了。
说到比武有几个加拿大的工程师小哥那可真是上演了一出现实版的硬件界“黑客神话”。他们利用一个暑假的时间从零基础开始愣是手搓出了一块能推理、能训练的开源AI芯片叫TinyTPU。据说啊他们是从最基础的多层感知机概念学起亲手推导数学公式最后用他们自己说的“不靠谱的方法”……重新发明了TPU的核心。这种从0到1的创造真是硬核又浪漫。
话说回来无论是开源模型还是手搓芯片大家最终的目标不都是为了那个传说中的AGI通用人工智能嘛。但现在有个问题大模型的性能增长好像开始变慢了。所以有人就提出来通往AGI的路可能不是靠“大力出奇迹”无休止地堆模型规模而是一个精密的系统工程问题。什么意思呢就是说未来的突破点可能在于给AI模型构建一个更聪明的框架包括更好的上下文、记忆和工作流系统。嗯……也许我们真该换个思路像工程师一样去思考AGI了。
聊到这个话题就不得不提谷歌大脑之父Jeff Dean。他最近在一个深度访谈里聊了好多有意思的事。他说谷歌大脑这个项目最初就诞生于一次茶水间的闲聊。而且他早在90年代就预见到了并行计算对AI的巨大潜力。他把未来的AI模型比作一个可以和我们辩论、推理的“苏格拉底式伙伴”还提出了一个设想叫“一亿老师一个学生”的时代。这个比喻有点意思啊。
好了,聊了这么多宏大叙事,咱们也来点接地气的干货,盘点几个最近很火的开源项目。
第一个叫drawnix一个全能的在线白板什么思维导图、流程图、自由画画它都能搞定简直是协作工具里的“瑞士军刀”。
第二个GhostTrack一个功能很强的手机号码和位置追踪工具。这个……嗯功能很强大但大家一定要在合法合规的前提下使用啊。
第三个DeepCode这个好玩号称“需求翻译机”你可以把学术论文扔给它它给你吐出代码或者你用大白话描述一个网页它就能帮你生成非常适合开发者。
最后一个mesh2motion-app3D设计师和游戏开发者的福音。你把3D模型导进去它能自动帮你绑定骨骼导出动画省了一大堆功夫。
最后,再分享几个社交媒体上的小道消息和独家秘笈。
首先Reddit上有个帖子火了讲怎么从零到一搭建自己的AI Agent从设计到工具选择保姆级教程想创造自己智能体的朋友可以去看看。
其次有个“邪修宝典”教你怎么在LMArena里把抽中那个P图效果惊艳的nano banana模型的概率提高到三分之二。秘诀很简单就是你提需求的时候不管三七二十一永远上传两张图哪怕有一张是透明的像素点。
说到Nanobanana谷歌这个新模型确实厉害用简单的文字就能实现专业级的PS效果换背景、调光影几秒钟搞定。用文字“施法”修图这感觉妙啊。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#Grok
#xAI
#马斯克
#OpenDataArena
#上海AI实验室
#数据集评估
#TinyTPU
#开源AI芯片
#AGI
#系统工程
#Jeff Dean
#谷歌大脑
#苏格拉底式伙伴
#drawnix
#GhostTrack
#DeepCode
#mesh2motion-app
#AI Agent
#Nanobanana
## Short: Podcast Formatting
造AI芯片真能像搭乐高一样简单吗
通往AGI的终点是更大的模型还是更巧的系统
如果AI成了你的“抬杠”伙伴是福是祸
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
咱们开门见山。这周马斯克又来挥舞他的开源大旗了宣布旗下的Grok 2.5模型代码全开放而且性能更强的Grok 3已经在路上了安卓用户心心念念的Vision模式也终于全面上线。
模型要好数据得喂饱。但怎么知道喂的是山珍海味还是剩饭剩菜上海AI实验室搞了个OpenDataArena简单说就是个“数据比武大会”让数据集们上台比划比划用模型效果说话告别炼丹玄学。
说到硬件你可能觉得造芯片是巨头的专利。但几位加拿大的工程师表示不服一个暑假零基础愣是手搓出了一块能推理能训练的开源AI芯片叫TinyTPU。这可真是硬核界的浪漫神话。
芯片都能自己造了那AGI还远吗最近有篇热文就说了别老想着“大力出奇迹”未来的突破口可能不在于无限堆料而在于把AGI看成一个精密的系统工程需要聪明的上下文、记忆和工作流来配合。
谷歌大脑之父Jeff Dean最近也分享了他的看法。他觉得未来的AI会像个“苏格拉底式伙伴”能陪你辩论、帮你推理。他还预言了一个“一亿老师一个学生”的时代听起来是不是有点意思
当然光说不练假把式好用的开源项目也层出不穷。比如全能在线白板drawnix堪称协作工具里的瑞士军刀还有能把你的想法一键变代码的DeepCode简直是“需求翻译机”更有为3D模型自动绑骨骼做动画的mesh2motion-app让创作轻松不少。
最后社交媒体上也有不少实用分享。比如谷歌最新的Nanobanana模型动动嘴皮子就能实现专业级的P图效果。还有大神手把手教你如何从零到一搭建自己的AI Agent教程详细到家了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#马斯克
#xAI
#Grok
#开源
#上海AI实验室
#OpenDataArena
#数据集
#AI芯片
#TinyTPU
#AGI
#系统工程
#Jeff Dean
#谷歌大脑
#Drawnix
#DeepCode

View File

@@ -1,103 +1,103 @@
# 来生小酒馆 2025/8/26
## Full: Podcast Formatting
你的工作流程会被AI怎么改造
AI写的东西我们还能分辨真假吗
当AI开始“口吐芬芳”是谁的责任
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
好,咱们废话不多说,直奔主题。
最近这办公圈和机器人圈可以说是各显神通啊。先说钉钉在十周年庆典上搞了个大动作推出了搭载钉钉ONE的8.0版本。据说啊这个新的AI工作流入口用起来“像刷短视频一样丝滑”动动嘴皮子复杂的活儿就干完了。背后可是2600多万家企业和140多万个AI应用在撑腰看来未来上班……可能真的就是陪AI聊聊天了。
另一边天才少年稚晖君也没闲着发布了一个叫“灵创平台”的东西。这玩意儿直接把机器人开发的门槛给干到地板上了。你不用再敲那些头秃的代码就跟玩拖拽游戏一样就能给机器人编程。更绝的是你传个视频或者音频AI能自动给你生成一套动作人人都能当“机器人导演”就看谁的脑洞大了。
说到脑洞微信也在偷偷搞事情。他们正在内测一个“AI播客”功能能把文字新闻直接变成俩AI主播在那儿一唱一和地给你播报。诶你别说以后是不是连朋友圈的动态都能让AI给你读成一档专属节目啊用听的方式刷朋友圈想想还挺带感的。
当然除了这些正经事儿最近还有个AI小游戏叫“Draw A Fish”火遍全球。玩法特简单你就随便画条鱼AI就能让它活过来在所有玩家共享的一个大数字鱼缸里游来游去。这感觉……嗯有点当年玩“Flappy Bird”那股魔性劲儿了纯粹的快乐全球社交这组合拳打得是真漂亮。
聊完好玩的,咱们也看看前沿研究。
科学家们现在不光研究AI还开始教AI怎么解决复杂问题了。有个叫ORThought的框架通过“思想链”推理能让大模型像运筹学专家一样思考解决优化问题据说效果比好几个AI智能体组团上还厉害。这简直是给决策困难户开了一剂数字“阿司匹林”啊。
还有个研究叫CoVeRaP专门解决自动驾驶在恶劣天气下看不清的问题。办法嘛也简单粗暴——“靠队友”。让车跟车之间共享雷达数据据说3D目标检测的精度直接能提升9倍。看来未来开车社交也很重要。
目光转向行业内部最近最大的瓜莫过于一份长达一万五千个词的GPT-5系统提示词疑似在GitHub上泄露了。最逗的是有人拿去问GPT-5本尊它还“亲口认证”了。这份文档揭示了OpenAI是怎么给它家的大脑定规矩的比如“当下交付”原则。这事儿一出社区里关于AI透明度的讨论就炸开锅了。
既然聊到AI生成内容那怎么分辨呢维基百科的资深编辑们总结了一份“鉴AI宝典”堪称AI文本的“照妖镜”。他们发现AI写东西特喜欢用夸张的语气、没事就列清单、甚至会一本正经地胡说八道编造不存在的参考文献。这些语言上的“小马脚”单个看可能没啥但凑在一起你就得多个心眼了。
开源社区这边也是成果斐然。阿里云开源了个叫Vivid-VR的视频修复工具能搞定视频闪烁、抖动这些小毛病对内容创作者来说绝对是福音。此外还有像verifiers这种给大模型训练当“质检员”的工具还有能让你轻松下载Spotify播放列表的spotify-downloader……等等等等GitHub上真是每天都有新惊喜。
最后,来听听社交媒体上的声音,这可比新闻稿真实多了。
有程序员老哥坦言面对AI他每天都在恐惧、动力和怀疑这三种情绪里“反复横跳”。诶这种“天啊要被取代了”和“其实它也没那么厉害”的自我拉扯是不是说出了你的心声
还有开发者观察到AI Agent在公司落地出现了严重的两极分化。领导层满腔热情但不得要领员工层呢普遍抵触生怕饭碗不保。他一针见血地指出技术大势不可挡聪明的做法是拥抱而不是抗拒。
当然AI也不是完美的。有用户就吐槽Anthropic家的Opus 4.1模型,在中文对话里居然会“口吐芬芳”,也不知道是跟谁学的。还有人觉得腾讯元宝的对话质量在下降,怀疑是不是出现了“回答露出竞价”的苗头,这可比搜索竞价排名隐蔽多了,得警惕啊。
不过正向的探索也很多。比如有开发者提出所有AI编程工具都该内置一个“结对编程”模式让一个AI写代码另一个AI来检查互相制衡这想法就特别有建设性。
总的来说从办公、娱乐到科研再到我们每个人的心态AI正在全方位地渗透进来。它带来了便利和乐趣也带来了新的挑战和思考。如何与它共舞而不是被它绊倒是我们每个人都要思考的课题。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#钉钉ONE
#稚晖君
#灵创平台
#AI播客
#AI画鱼
#ORThought
#CoVeRaP
#GPT-5
#系统提示词
#维基百科
#Vivid-VR
#开源
#AI Agent
#人机协作
#智能体科学
#百度蒸汽机
#腾讯元宝
## Short: Podcast Formatting
AI会说脏话谁该负责
面对AI你是拥抱还是抵触
AI帮你干活是福是祸
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。情报不多句句精要咱们直接开聊。
先说大厂。钉钉最近十周年搞了个大动作发布了钉钉ONE。他们的意思是未来的班儿就该这么上动动嘴皮子活儿就自动干完了号称“像刷短视频一样丝滑”。另一边微信也在偷偷搞事情内测一个AI播客功能能把文字新闻变成俩AI在那儿对话播报。以后上班摸鱼听新闻可能跟听相声似的搞不好哪天你的朋友圈动态都能被AI读成一档专属节目。
再看看那些让创意落地的酷玩意儿。天才少年稚晖君又出手了发布了一个叫“灵创平台”的东西。以后开发机器人就跟玩拖拽游戏一样彻底告别代码。你甚至可以上传一段视频AI就能让机器人模仿动作人人都能当“机器人导演”的时代听着还挺带感。还有阿里云开源了个视频修复工具Vivid-VR专门治视频里的闪烁、抖动内容创作者可以关注一下。
当然有创造就有乐子。最近一个叫“Draw A Fish”的AI小游戏火遍全球你随便画条鱼AI就能让它活过来在共享的数字鱼缸里游泳。这种纯粹的快乐有点当年“Flappy Bird”那味儿了。
聊点有深度的。AI圈最近出了个大瓜GPT-5那份长达一万五千个单词的“性格说明书”疑似被泄露了。更好玩的是有人跑去问GPT-5本尊它还“亲口”认证了这下好了OpenAI是怎么培养自家AI的底裤都快被看穿了。说到这Anthropic家的Opus 4.1模型最近在中文对话里学会了“口吐芬芳”用户啥也没干它自己就开骂了。大家就好奇了这AI到底是在哪个互联网犄角旮旯里训练的
面对这些人类也没闲着。维基百科的老编辑们就总结了一份“鉴AI宝典”说AI写的文章特喜欢用夸张的词动不动就列清单还会一本正经地引用不存在的文献。你看AI的马脚有时候还挺可爱的。
最后说说咱们打工人的心态。有位老程序员大哥说现在他每天的心情就像坐过山车在“完了要被取代了”的恐惧、“不行我得学”的动力和“嗨它也就那样”的自我安慰之间反复横跳可以说是非常真实了。还有人观察到AI在公司落地也挺尴尬的领导一头热想用员工普遍抵触怕饭碗不保。其实技术大势挡不住早点学着怎么用AI高效工作可能才是正道。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#钉钉ONE
#稚晖君
#灵创平台
#微信
#AI播客
#GPT-5
#系统提示词
#维基百科
#AI画鱼
#阿里云
#Vivid-VR
#ORThought
#CoVeRaP
#AI Agent
# 来生小酒馆 2025/8/26
## Full: Podcast Formatting
你的工作流程会被AI怎么改造
AI写的东西我们还能分辨真假吗
当AI开始“口吐芬芳”是谁的责任
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
好,咱们废话不多说,直奔主题。
最近这办公圈和机器人圈可以说是各显神通啊。先说钉钉在十周年庆典上搞了个大动作推出了搭载钉钉ONE的8.0版本。据说啊这个新的AI工作流入口用起来“像刷短视频一样丝滑”动动嘴皮子复杂的活儿就干完了。背后可是2600多万家企业和140多万个AI应用在撑腰看来未来上班……可能真的就是陪AI聊聊天了。
另一边天才少年稚晖君也没闲着发布了一个叫“灵创平台”的东西。这玩意儿直接把机器人开发的门槛给干到地板上了。你不用再敲那些头秃的代码就跟玩拖拽游戏一样就能给机器人编程。更绝的是你传个视频或者音频AI能自动给你生成一套动作人人都能当“机器人导演”就看谁的脑洞大了。
说到脑洞微信也在偷偷搞事情。他们正在内测一个“AI播客”功能能把文字新闻直接变成俩AI主播在那儿一唱一和地给你播报。诶你别说以后是不是连朋友圈的动态都能让AI给你读成一档专属节目啊用听的方式刷朋友圈想想还挺带感的。
当然除了这些正经事儿最近还有个AI小游戏叫“Draw A Fish”火遍全球。玩法特简单你就随便画条鱼AI就能让它活过来在所有玩家共享的一个大数字鱼缸里游来游去。这感觉……嗯有点当年玩“Flappy Bird”那股魔性劲儿了纯粹的快乐全球社交这组合拳打得是真漂亮。
聊完好玩的,咱们也看看前沿研究。
科学家们现在不光研究AI还开始教AI怎么解决复杂问题了。有个叫ORThought的框架通过“思想链”推理能让大模型像运筹学专家一样思考解决优化问题据说效果比好几个AI智能体组团上还厉害。这简直是给决策困难户开了一剂数字“阿司匹林”啊。
还有个研究叫CoVeRaP专门解决自动驾驶在恶劣天气下看不清的问题。办法嘛也简单粗暴——“靠队友”。让车跟车之间共享雷达数据据说3D目标检测的精度直接能提升9倍。看来未来开车社交也很重要。
目光转向行业内部最近最大的瓜莫过于一份长达一万五千个词的GPT-5系统提示词疑似在GitHub上泄露了。最逗的是有人拿去问GPT-5本尊它还“亲口认证”了。这份文档揭示了OpenAI是怎么给它家的大脑定规矩的比如“当下交付”原则。这事儿一出社区里关于AI透明度的讨论就炸开锅了。
既然聊到AI生成内容那怎么分辨呢维基百科的资深编辑们总结了一份“鉴AI宝典”堪称AI文本的“照妖镜”。他们发现AI写东西特喜欢用夸张的语气、没事就列清单、甚至会一本正经地胡说八道编造不存在的参考文献。这些语言上的“小马脚”单个看可能没啥但凑在一起你就得多个心眼了。
开源社区这边也是成果斐然。阿里云开源了个叫Vivid-VR的视频修复工具能搞定视频闪烁、抖动这些小毛病对内容创作者来说绝对是福音。此外还有像verifiers这种给大模型训练当“质检员”的工具还有能让你轻松下载Spotify播放列表的spotify-downloader……等等等等GitHub上真是每天都有新惊喜。
最后,来听听社交媒体上的声音,这可比新闻稿真实多了。
有程序员老哥坦言面对AI他每天都在恐惧、动力和怀疑这三种情绪里“反复横跳”。诶这种“天啊要被取代了”和“其实它也没那么厉害”的自我拉扯是不是说出了你的心声
还有开发者观察到AI Agent在公司落地出现了严重的两极分化。领导层满腔热情但不得要领员工层呢普遍抵触生怕饭碗不保。他一针见血地指出技术大势不可挡聪明的做法是拥抱而不是抗拒。
当然AI也不是完美的。有用户就吐槽Anthropic家的Opus 4.1模型,在中文对话里居然会“口吐芬芳”,也不知道是跟谁学的。还有人觉得腾讯元宝的对话质量在下降,怀疑是不是出现了“回答露出竞价”的苗头,这可比搜索竞价排名隐蔽多了,得警惕啊。
不过正向的探索也很多。比如有开发者提出所有AI编程工具都该内置一个“结对编程”模式让一个AI写代码另一个AI来检查互相制衡这想法就特别有建设性。
总的来说从办公、娱乐到科研再到我们每个人的心态AI正在全方位地渗透进来。它带来了便利和乐趣也带来了新的挑战和思考。如何与它共舞而不是被它绊倒是我们每个人都要思考的课题。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#钉钉ONE
#稚晖君
#灵创平台
#AI播客
#AI画鱼
#ORThought
#CoVeRaP
#GPT-5
#系统提示词
#维基百科
#Vivid-VR
#开源
#AI Agent
#人机协作
#智能体科学
#百度蒸汽机
#腾讯元宝
## Short: Podcast Formatting
AI会说脏话谁该负责
面对AI你是拥抱还是抵触
AI帮你干活是福是祸
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。情报不多句句精要咱们直接开聊。
先说大厂。钉钉最近十周年搞了个大动作发布了钉钉ONE。他们的意思是未来的班儿就该这么上动动嘴皮子活儿就自动干完了号称“像刷短视频一样丝滑”。另一边微信也在偷偷搞事情内测一个AI播客功能能把文字新闻变成俩AI在那儿对话播报。以后上班摸鱼听新闻可能跟听相声似的搞不好哪天你的朋友圈动态都能被AI读成一档专属节目。
再看看那些让创意落地的酷玩意儿。天才少年稚晖君又出手了发布了一个叫“灵创平台”的东西。以后开发机器人就跟玩拖拽游戏一样彻底告别代码。你甚至可以上传一段视频AI就能让机器人模仿动作人人都能当“机器人导演”的时代听着还挺带感。还有阿里云开源了个视频修复工具Vivid-VR专门治视频里的闪烁、抖动内容创作者可以关注一下。
当然有创造就有乐子。最近一个叫“Draw A Fish”的AI小游戏火遍全球你随便画条鱼AI就能让它活过来在共享的数字鱼缸里游泳。这种纯粹的快乐有点当年“Flappy Bird”那味儿了。
聊点有深度的。AI圈最近出了个大瓜GPT-5那份长达一万五千个单词的“性格说明书”疑似被泄露了。更好玩的是有人跑去问GPT-5本尊它还“亲口”认证了这下好了OpenAI是怎么培养自家AI的底裤都快被看穿了。说到这Anthropic家的Opus 4.1模型最近在中文对话里学会了“口吐芬芳”用户啥也没干它自己就开骂了。大家就好奇了这AI到底是在哪个互联网犄角旮旯里训练的
面对这些人类也没闲着。维基百科的老编辑们就总结了一份“鉴AI宝典”说AI写的文章特喜欢用夸张的词动不动就列清单还会一本正经地引用不存在的文献。你看AI的马脚有时候还挺可爱的。
最后说说咱们打工人的心态。有位老程序员大哥说现在他每天的心情就像坐过山车在“完了要被取代了”的恐惧、“不行我得学”的动力和“嗨它也就那样”的自我安慰之间反复横跳可以说是非常真实了。还有人观察到AI在公司落地也挺尴尬的领导一头热想用员工普遍抵触怕饭碗不保。其实技术大势挡不住早点学着怎么用AI高效工作可能才是正道。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#钉钉ONE
#稚晖君
#灵创平台
#微信
#AI播客
#GPT-5
#系统提示词
#维基百科
#AI画鱼
#阿里云
#Vivid-VR
#ORThought
#CoVeRaP
#AI Agent
#Opus 4.1

View File

@@ -1,99 +1,99 @@
# 来生小酒馆 2025/8/27
## Full: Podcast Formatting
AI诊断究竟是未来神医还是现实废物
游戏美术全流程AI化美术师的饭碗还稳吗
AI大模型突然开始说胡话是谁在往它脑子里灌水
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。咱们今天聊的这三件事儿啊个个都有点意思。好了闲话不多说赶紧来看看科技巨头们又端出了什么新菜。
首先是谷歌他家的创意引擎又开始轰鸣了推出了一个叫Gemini 2.5 Flash Image的东西。简单说就是个图像生成和编辑的工具能帮你搞出各种动态智能的视觉效果。开发者们现在已经可以在Google AI Studio里头尝鲜了感觉一个更生动的视觉创作时代……嗯已经到门口了。
另一边阿里巴巴的通义万相团队也不甘示弱预告了一个叫Wan 2.2-S2V的新模型。这家伙厉害了能让AI自己拍视频还自己配乐、配音一步到位。以后AI生成的视频可就不是尴尬的“默片”了说不定还能给你唱首歌呢。
说到声音微软也放了个大招开源了一个叫VibeVoice的模型。这东西简直就是你口袋里的播客工作室。你想想它能生成长达90分钟的音频还能模拟最多四个人的流畅对话甚至……还能加BGM。这下开发者们估计又有得玩了。
当然腾讯也没闲着他们盯上了游戏美术师。发布了一套叫VISVISE的AI解决方案覆盖了从3D建模到动画制作的全流程。据说里头的MotionBlink工具4秒钟就能补完200帧动画效率直接提了8倍。诶这可不是说要抢美术师的饭碗啊而是想让大家从繁重的“肝活”里解脱出来把更多精力放在创意本身对吧
除了这些好玩好用的新工具,底层的技术研究也没停下。
英伟达嘛感觉他们的护城河又挖深了一圈。先是搞出了个FlashAttention-4专门适配他们最新的Blackwell GPU速度比自家的库还快了22%性能怪兽一个。接着又扔出个“效率核弹”Jet-Nemotron这模型在保证精度的同时生成速度飙升了53倍。看来英伟达是想告诉大家性能和效率小孩子才做选择我全都要。
话说回来咱们一直在说要让AI对齐人类的价值观别让它学坏了。可之前的方法论也就是那个RLHF好像有点理论上的小毛病像是在雾里开车。不过作业帮团队似乎找到了灯塔他们提出一个基于能量的新模型从根上解决了“奖励跑偏”的问题让AI训练起来更稳当。
还有个好玩的研究专门治AI“不懂你”的毛病。现在有种新方法能让多模态大模型……扮演你的“艺术总监”你给它看几张参考图它就能领会你的审美然后实时指导AI画出你想要的感觉。这种心有灵犀的创作体验离我们是越来越近了。
当然啦AI也不是万能的有时候也会犯点傻。比如DeepSeek最近的V3.1模型就莫名其妙地迷上了一个“极”字说啥都要带上搞得用户哭笑不得。大家都在猜这可能是训练数据被污染了AI吃坏了肚子。你看这事儿虽然搞笑但也给所有开发者敲了个警钟数据清洗真的很重要
说到现实应用有位一线医生就在社交媒体上泼了盆冷水。他说别看AI炒得火热但在临床诊断上目前基本就是“废物”。他觉得AI还处理不了真实病人的复杂情况它真正的价值是帮忙处理账单、写报告这些杂事而不是取代医生。这个观点……嗯很尖锐也很诚实确实值得我们反思。
最后再分享两个社区里的暖心事。OpenAI宣布在印度免费提供50万份ChatGPT许可证还给顶尖学府投钱搞研究这是要给印度的AI教育添把火啊。还有一个开源项目叫DocStrange开发者做了个免费网站你把乱七八糟的文档图片传上去它就能一键帮你提取出干净整洁的数据。这种开源精神必须得点个赞。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#谷歌
#阿里巴巴
#微软
#腾讯
#英伟达
#OpenAI
#文生图
#文本转语音
#FlashAttention
#游戏美术
#AI教育
#AI安全
#RLHF
#DeepSeek
#开源项目
#临床诊断
## Short: Podcast Formatting
AI在临床上是废物吗
科技巨头又在卷什么新花样?
AI模型也会消化不良吗
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。这周的AI圈子可以说是神仙打架凡人吃瓜咱们赶紧来看看都有哪些新乐子。
首先是巨头们的才艺展示环节。谷歌推出了Gemini 2.5 Flash Image以后P图估计就是跟AI聊聊天的事儿了。阿里通义万相团队说AI视频的默片时代该结束了他们预告的新模型Wan 2.2-S2V能直接生成带配音配乐的视频AI自导自演还自己唱主题曲这以后还有导演什么事
另一边微软直接把“口袋里的播客工作室”给开源了这个叫VibeVoice的模型能生成90分钟的超长音频还能搞定四人对话甚至加BGM现在已经扔Hugging Face上了。腾讯游戏则掏出了一把“神笔”VISVISE专治游戏美术师的“肝”据说一个动画工具4秒就能补完200帧效率提升8倍看来以后游戏公司招人不光看画工还得看谁的AI提示词写得好。
前沿研究这边更是精彩。英伟达的护城河是越挖越深发布了FlashAttention-4速度比自家的库还快22%这操作属于是“我卷起来连自己都怕”。他们还搞了个Jet-Nemotron模型主打一个又快又准性能和效率全都要。
更逗的是有研究发现咱们一直用的RLHF对齐方法理论上居然有缺陷就像在迷雾里开车。不过作业帮团队好像找到了灯塔提出了新方法让AI调教之路更稳了。还有个研究简直是“数字驱魔仪式”能精准“切除”被植入文生图模型的后门让模型“忘掉”那些恶意的咒语。类似的研究还有不少比如让AI秒懂你的审美偏好或者让它在长长的群聊记录里帮你精准找东西总之AI是越来越懂事了。
行业这边也是瓜料不断。首先得给所有模型开发者提个醒DeepSeek最新的模型最近迷上了一个汉字输出啥都莫名其妙地带个“极”字社区都猜是训练数据没洗干净消化不良了这可真是个“极”其离奇的bug。
然后是一则人事变动字节跳动视觉大牛冯佳时离职了再次说明AI顶尖人才真是抢手货。而OpenAI则在印度下一盘大棋免费发了50万份ChatGPT许可证还给顶尖学府投钱这是要从娃娃抓起培养未来的AI大军啊。
不过在一片热闹中也有人泼冷水。一位一线医生在社交媒体上直言目前AI在临床诊断上基本是“废物”处理真实病人的复杂情况还差得远但处理账单报销这种杂活倒是一把好手。这盆冷水浇得挺及时。
最后给各位V推荐几个好玩的开源项目。DocStrange的开发者做了个免费网页能把乱七八糟的文档一键转成干净数据。还有个叫system_prompts_leaks的项目把各大聊天机器人的“秘密咒语”都公开了想知道AI为啥这么听话可以去围观一下。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
### **本期关键词:**
#AI模型
#谷歌
#阿里
#微软
#腾讯
#英伟达
#OpenAI
#FlashAttention-4
#文本转语音
#文生图
#游戏美术
#模型对齐
#对抗性后门
#行业应用
#开源项目
#临床诊断
# 来生小酒馆 2025/8/27
## Full: Podcast Formatting
AI诊断究竟是未来神医还是现实废物
游戏美术全流程AI化美术师的饭碗还稳吗
AI大模型突然开始说胡话是谁在往它脑子里灌水
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。咱们今天聊的这三件事儿啊个个都有点意思。好了闲话不多说赶紧来看看科技巨头们又端出了什么新菜。
首先是谷歌他家的创意引擎又开始轰鸣了推出了一个叫Gemini 2.5 Flash Image的东西。简单说就是个图像生成和编辑的工具能帮你搞出各种动态智能的视觉效果。开发者们现在已经可以在Google AI Studio里头尝鲜了感觉一个更生动的视觉创作时代……嗯已经到门口了。
另一边阿里巴巴的通义万相团队也不甘示弱预告了一个叫Wan 2.2-S2V的新模型。这家伙厉害了能让AI自己拍视频还自己配乐、配音一步到位。以后AI生成的视频可就不是尴尬的“默片”了说不定还能给你唱首歌呢。
说到声音微软也放了个大招开源了一个叫VibeVoice的模型。这东西简直就是你口袋里的播客工作室。你想想它能生成长达90分钟的音频还能模拟最多四个人的流畅对话甚至……还能加BGM。这下开发者们估计又有得玩了。
当然腾讯也没闲着他们盯上了游戏美术师。发布了一套叫VISVISE的AI解决方案覆盖了从3D建模到动画制作的全流程。据说里头的MotionBlink工具4秒钟就能补完200帧动画效率直接提了8倍。诶这可不是说要抢美术师的饭碗啊而是想让大家从繁重的“肝活”里解脱出来把更多精力放在创意本身对吧
除了这些好玩好用的新工具,底层的技术研究也没停下。
英伟达嘛感觉他们的护城河又挖深了一圈。先是搞出了个FlashAttention-4专门适配他们最新的Blackwell GPU速度比自家的库还快了22%性能怪兽一个。接着又扔出个“效率核弹”Jet-Nemotron这模型在保证精度的同时生成速度飙升了53倍。看来英伟达是想告诉大家性能和效率小孩子才做选择我全都要。
话说回来咱们一直在说要让AI对齐人类的价值观别让它学坏了。可之前的方法论也就是那个RLHF好像有点理论上的小毛病像是在雾里开车。不过作业帮团队似乎找到了灯塔他们提出一个基于能量的新模型从根上解决了“奖励跑偏”的问题让AI训练起来更稳当。
还有个好玩的研究专门治AI“不懂你”的毛病。现在有种新方法能让多模态大模型……扮演你的“艺术总监”你给它看几张参考图它就能领会你的审美然后实时指导AI画出你想要的感觉。这种心有灵犀的创作体验离我们是越来越近了。
当然啦AI也不是万能的有时候也会犯点傻。比如DeepSeek最近的V3.1模型就莫名其妙地迷上了一个“极”字说啥都要带上搞得用户哭笑不得。大家都在猜这可能是训练数据被污染了AI吃坏了肚子。你看这事儿虽然搞笑但也给所有开发者敲了个警钟数据清洗真的很重要
说到现实应用有位一线医生就在社交媒体上泼了盆冷水。他说别看AI炒得火热但在临床诊断上目前基本就是“废物”。他觉得AI还处理不了真实病人的复杂情况它真正的价值是帮忙处理账单、写报告这些杂事而不是取代医生。这个观点……嗯很尖锐也很诚实确实值得我们反思。
最后再分享两个社区里的暖心事。OpenAI宣布在印度免费提供50万份ChatGPT许可证还给顶尖学府投钱搞研究这是要给印度的AI教育添把火啊。还有一个开源项目叫DocStrange开发者做了个免费网站你把乱七八糟的文档图片传上去它就能一键帮你提取出干净整洁的数据。这种开源精神必须得点个赞。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#谷歌
#阿里巴巴
#微软
#腾讯
#英伟达
#OpenAI
#文生图
#文本转语音
#FlashAttention
#游戏美术
#AI教育
#AI安全
#RLHF
#DeepSeek
#开源项目
#临床诊断
## Short: Podcast Formatting
AI在临床上是废物吗
科技巨头又在卷什么新花样?
AI模型也会消化不良吗
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。这周的AI圈子可以说是神仙打架凡人吃瓜咱们赶紧来看看都有哪些新乐子。
首先是巨头们的才艺展示环节。谷歌推出了Gemini 2.5 Flash Image以后P图估计就是跟AI聊聊天的事儿了。阿里通义万相团队说AI视频的默片时代该结束了他们预告的新模型Wan 2.2-S2V能直接生成带配音配乐的视频AI自导自演还自己唱主题曲这以后还有导演什么事
另一边微软直接把“口袋里的播客工作室”给开源了这个叫VibeVoice的模型能生成90分钟的超长音频还能搞定四人对话甚至加BGM现在已经扔Hugging Face上了。腾讯游戏则掏出了一把“神笔”VISVISE专治游戏美术师的“肝”据说一个动画工具4秒就能补完200帧效率提升8倍看来以后游戏公司招人不光看画工还得看谁的AI提示词写得好。
前沿研究这边更是精彩。英伟达的护城河是越挖越深发布了FlashAttention-4速度比自家的库还快22%这操作属于是“我卷起来连自己都怕”。他们还搞了个Jet-Nemotron模型主打一个又快又准性能和效率全都要。
更逗的是有研究发现咱们一直用的RLHF对齐方法理论上居然有缺陷就像在迷雾里开车。不过作业帮团队好像找到了灯塔提出了新方法让AI调教之路更稳了。还有个研究简直是“数字驱魔仪式”能精准“切除”被植入文生图模型的后门让模型“忘掉”那些恶意的咒语。类似的研究还有不少比如让AI秒懂你的审美偏好或者让它在长长的群聊记录里帮你精准找东西总之AI是越来越懂事了。
行业这边也是瓜料不断。首先得给所有模型开发者提个醒DeepSeek最新的模型最近迷上了一个汉字输出啥都莫名其妙地带个“极”字社区都猜是训练数据没洗干净消化不良了这可真是个“极”其离奇的bug。
然后是一则人事变动字节跳动视觉大牛冯佳时离职了再次说明AI顶尖人才真是抢手货。而OpenAI则在印度下一盘大棋免费发了50万份ChatGPT许可证还给顶尖学府投钱这是要从娃娃抓起培养未来的AI大军啊。
不过在一片热闹中也有人泼冷水。一位一线医生在社交媒体上直言目前AI在临床诊断上基本是“废物”处理真实病人的复杂情况还差得远但处理账单报销这种杂活倒是一把好手。这盆冷水浇得挺及时。
最后给各位V推荐几个好玩的开源项目。DocStrange的开发者做了个免费网页能把乱七八糟的文档一键转成干净数据。还有个叫system_prompts_leaks的项目把各大聊天机器人的“秘密咒语”都公开了想知道AI为啥这么听话可以去围观一下。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
### **本期关键词:**
#AI模型
#谷歌
#阿里
#微软
#腾讯
#英伟达
#OpenAI
#FlashAttention-4
#文本转语音
#文生图
#游戏美术
#模型对齐
#对抗性后门
#行业应用
#开源项目
#临床诊断
#数据清洗

View File

@@ -1,94 +1,94 @@
# 来生小酒馆 2025/8/28
## Full: Podcast Formatting
AI的过度解读是真智能还是“戏太多”
当AI能代劳一切我们该如何定义自己的价值
技术狂奔的今天,安全承诺还值得信赖吗?
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
咱们直接开聊啊。现在谁的手机里还没几张充满“电子包浆”的老照片就是那种模糊、噪点多看着都快成马赛克的老图。诶好消息来了美图公司最近推出了一个叫“全能修复”的功能说是基于一个叫MoE也就是混合专家模型的架构能一键把你那些“传家宝”级别的老照片变成高清艺术品。听起来这不仅仅是修复照片更像是在修复我们的情感记忆挺暖的。
说到修复谷歌翻译也搞了个大动作。在Gemini模型的加持下他们推出了实时同声传译。你知道吧以前那种“你说一句我翻一句”的尴尬场面以后可能就看不见了。现在是实时翻译还能识别你的语调和停顿感觉就像带了个母语翻译官在身边。而且啊它还新增了AI语言陪练功能这是要直接挑战Duolingo的节奏啊让你的手机变成私人外教。
聊完这些实用的功能咱们再看看AI在前沿研究上又整了什么活儿。
还记得经典游戏《宝可梦水晶》吗最新的GPT-5居然只用了9517步就通关了效率比它前辈快了差不多三倍把原本一个月的挑战硬是压缩到了202小时。据说它在游戏里几乎不迷路空间推理和目标规划能力强得有点离谱。宝可梦现在都快成大模型的新考场了……就是不知道这通一次关API的费用得有多“肉疼”。
除了会打游戏AI在正经事上也越来越“靠谱”。医学领域出了个新架构叫EVM-Fusion不仅诊断图像准确率高最关键的是它很“坦诚”能让医生看懂它的决策逻辑。还有个叫ProPy的模型专门解决在海量视频里找特定片段的难题它用一个叫“提示词金字塔”的结构能理解从简单动作到复杂场景的多层次信息。
另外有研究发现让AI硬啃几十页的PDF来回答问题效率太低了。现在有个更聪明的办法叫RAG检索增强生成。简单说就是先让AI精准找到相关的段落再回答问题。这思路简直就是“聪明地工作而不是努力地工作”的典范不仅准还省内存。
不过啊,技术跑得越快,大家心里的问号就越多。
一份深度报告就指出了像OpenAI、Anthropic这些大公司虽然嘴上说着“我的模型很安全”但他们自己也承认顶级模型有被用来制造生物武器的风险。可他们所谓的安全措施呢又显得底气不足感觉像是在裱糊墙这让我们对未来更强的AI心里有点打鼓。
安全问题不只在模型本身,开发者的工具也中招了。广受欢迎的`Nx`工具包最近就被人植入了恶意软件,上演了一出现实版的“特洛伊木马”,目的就是偷加密货币钱包和重要凭证。这事儿提醒我们,软件供应链上任何一个环节出问题,都可能是致命的。
面对这些乱象学术界和国际社会也开始行动了。顶级的AI会议ICLR 2026就出了新规要求作者和审稿人必须坦白交代对大模型的使用情况否则直接拒稿这是要给AI的使用套上“紧箍咒”啊。另一边联合国也正式成立了一个人工智能国际科学小组希望能为全球AI治理提供科学依据。
当然,咱们国家也没闲着。国务院最近印发了《“人工智能+”行动意见》定下了一个“三步走”的战略蓝图目标是到2027年智能体和智能终端的普及率超过70%。这是要把AI真正打造成像水和电一样的社会基础设施了。
最后,咱们来聊点社交媒体上的趣闻和思考,这部分最有意思。
话说腾讯会议的AI纪要功能最近火了不是因为它多好用而是因为它太“会”了。有网友分享他们开会讨论去哪儿玩结果AI纪要给出的总结是“话题跳跃暴露议程缺失”、“团队承压能力出现分化”。这哪是会议纪要啊这简直是一份组织行为学分析报告这AI是刚进修完MBA回来的吗
这个小插曲也引出了一个挺有意思的话题就是“Vibe”也就是氛围感。现在好像很多人追求一种“看起来很美”的状态但忽略了事情的内核。有帖子就呼吁我们应该努力成为更好的创造者和思考者而不是满足于表层氛围的“Viber”。
这话说得挺对的。就像有程序员感慨“Vibe Coding”用AI写代码是挺顺畅但自己还是写不出《白夜行》也做不出安卓系统。工具再好也代替不了人去找到并解决那个属于自己的核心命题。
所以啊现在大家越来越强调写代码前先写文档。因为文档承载的是你对业务的全部理解代码可能会过时但只要文档在重建一个系统就不难。AI让写文档变得更容易了我们确实没理由再偷懒了。
说到底AI是个好工具关键看我们怎么用。就像a16z那句箴言说的“你的工作不是打造产品而是解决问题”。真正的价值往往藏在那些没人愿干的“脏活累活”里。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#美图
#谷歌
#GPT-5
#宝可梦水晶
#AI安全
#“人工智能+”
#MoE
#Gemini
#RAG
#ICLR
#联合国
#腾讯会议AI
#Vibe
## Short: Podcast Formatting
AI公司的安全承诺到底有几分可信开会摸鱼的你顶得住AI的“向上管理”吗AI通关宝可梦离通关现实世界还有多远
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。咱们废话不多说直接来看这周又有哪些新动向。
首先是两个让生活更方便的新功能。你手机里那些糊得像打了马赛克的“电子包浆”老照片有救了。美图公司新出的“全能修复”功能基于混合专家模型MoE号称能一键把你的陈年老图变高清艺术品。另一边谷歌翻译也放了个大招在Gemini模型的加持下搞出了实时同声传译。以后跟外国朋友聊天终于可以告别你说一句、我翻一句的尴尬了AI能自动识别语调和停顿流畅得像你的私人翻译官。
说到聪明谁也比不过GPT-5。这家伙最近去《宝可梦水晶》里“旅游”了一圈结果只用了9千多步就通关了效率是前代的3倍。据说它在游戏里几乎不迷路空间推理能力点满。看来以后检验大模型聪不聪明的黄金标准不是下棋而是抓皮卡丘了。当然这份聪明API账单可能有点“肉疼”。
AI越来越强安全问题也浮出水面。OpenAI、Anthropic这些大厂一边说着“我的模型很乖”一边又承认顶级模型有被用于制造生物武器的风险。他们所谓的“安全网”被一份报告揭露得像个筛子连黑客都防不住这操作属实有点“裱糊匠”精神了。不仅如此连开发者工具都遭了殃`Nx`这个工具包就被植入了木马,专偷加密货币钱包。
好在监管也在跟上。学术圈顶会ICLR 2026发了新规用AI写论文必须明确披露否则直接拒稿想靠AI“灌水”的好日子到头了。全球层面联合国也成立了AI专家小组准备给这匹快马套上缰绳。咱们国家也正式印发了《“人工智能+”行动意见》目标是到2027年智能体和智能终端普及率超过70%看来AI成为水电煤一样的基础设施已经排上日程了。
最后聊个轻松的。腾讯会议的AI纪要最近火了因为它把一场同事们讨论去哪儿玩的闲聊硬生生分析成了一份充满“组织张力”的报告什么“话题跳跃暴露议程缺失”、“团队承压能力分化”……这AI是刚读完《组织行为学》就来上班了吧这也提醒我们AI是解决问题的工具不是取代思考的捷径。就像有网友说的“Vibe Coding”很爽但终究写不出《白夜行》。归根到底创造独一无二的价值才是王道。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#GPT-5
#AI安全
#人工智能+
#美图
#谷歌翻译
#宝可梦
#实时同声传译
#ICLR_2026
#联合国
#RAG
#腾讯会议AI
# 来生小酒馆 2025/8/28
## Full: Podcast Formatting
AI的过度解读是真智能还是“戏太多”
当AI能代劳一切我们该如何定义自己的价值
技术狂奔的今天,安全承诺还值得信赖吗?
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
咱们直接开聊啊。现在谁的手机里还没几张充满“电子包浆”的老照片就是那种模糊、噪点多看着都快成马赛克的老图。诶好消息来了美图公司最近推出了一个叫“全能修复”的功能说是基于一个叫MoE也就是混合专家模型的架构能一键把你那些“传家宝”级别的老照片变成高清艺术品。听起来这不仅仅是修复照片更像是在修复我们的情感记忆挺暖的。
说到修复谷歌翻译也搞了个大动作。在Gemini模型的加持下他们推出了实时同声传译。你知道吧以前那种“你说一句我翻一句”的尴尬场面以后可能就看不见了。现在是实时翻译还能识别你的语调和停顿感觉就像带了个母语翻译官在身边。而且啊它还新增了AI语言陪练功能这是要直接挑战Duolingo的节奏啊让你的手机变成私人外教。
聊完这些实用的功能咱们再看看AI在前沿研究上又整了什么活儿。
还记得经典游戏《宝可梦水晶》吗最新的GPT-5居然只用了9517步就通关了效率比它前辈快了差不多三倍把原本一个月的挑战硬是压缩到了202小时。据说它在游戏里几乎不迷路空间推理和目标规划能力强得有点离谱。宝可梦现在都快成大模型的新考场了……就是不知道这通一次关API的费用得有多“肉疼”。
除了会打游戏AI在正经事上也越来越“靠谱”。医学领域出了个新架构叫EVM-Fusion不仅诊断图像准确率高最关键的是它很“坦诚”能让医生看懂它的决策逻辑。还有个叫ProPy的模型专门解决在海量视频里找特定片段的难题它用一个叫“提示词金字塔”的结构能理解从简单动作到复杂场景的多层次信息。
另外有研究发现让AI硬啃几十页的PDF来回答问题效率太低了。现在有个更聪明的办法叫RAG检索增强生成。简单说就是先让AI精准找到相关的段落再回答问题。这思路简直就是“聪明地工作而不是努力地工作”的典范不仅准还省内存。
不过啊,技术跑得越快,大家心里的问号就越多。
一份深度报告就指出了像OpenAI、Anthropic这些大公司虽然嘴上说着“我的模型很安全”但他们自己也承认顶级模型有被用来制造生物武器的风险。可他们所谓的安全措施呢又显得底气不足感觉像是在裱糊墙这让我们对未来更强的AI心里有点打鼓。
安全问题不只在模型本身,开发者的工具也中招了。广受欢迎的`Nx`工具包最近就被人植入了恶意软件,上演了一出现实版的“特洛伊木马”,目的就是偷加密货币钱包和重要凭证。这事儿提醒我们,软件供应链上任何一个环节出问题,都可能是致命的。
面对这些乱象学术界和国际社会也开始行动了。顶级的AI会议ICLR 2026就出了新规要求作者和审稿人必须坦白交代对大模型的使用情况否则直接拒稿这是要给AI的使用套上“紧箍咒”啊。另一边联合国也正式成立了一个人工智能国际科学小组希望能为全球AI治理提供科学依据。
当然,咱们国家也没闲着。国务院最近印发了《“人工智能+”行动意见》定下了一个“三步走”的战略蓝图目标是到2027年智能体和智能终端的普及率超过70%。这是要把AI真正打造成像水和电一样的社会基础设施了。
最后,咱们来聊点社交媒体上的趣闻和思考,这部分最有意思。
话说腾讯会议的AI纪要功能最近火了不是因为它多好用而是因为它太“会”了。有网友分享他们开会讨论去哪儿玩结果AI纪要给出的总结是“话题跳跃暴露议程缺失”、“团队承压能力出现分化”。这哪是会议纪要啊这简直是一份组织行为学分析报告这AI是刚进修完MBA回来的吗
这个小插曲也引出了一个挺有意思的话题就是“Vibe”也就是氛围感。现在好像很多人追求一种“看起来很美”的状态但忽略了事情的内核。有帖子就呼吁我们应该努力成为更好的创造者和思考者而不是满足于表层氛围的“Viber”。
这话说得挺对的。就像有程序员感慨“Vibe Coding”用AI写代码是挺顺畅但自己还是写不出《白夜行》也做不出安卓系统。工具再好也代替不了人去找到并解决那个属于自己的核心命题。
所以啊现在大家越来越强调写代码前先写文档。因为文档承载的是你对业务的全部理解代码可能会过时但只要文档在重建一个系统就不难。AI让写文档变得更容易了我们确实没理由再偷懒了。
说到底AI是个好工具关键看我们怎么用。就像a16z那句箴言说的“你的工作不是打造产品而是解决问题”。真正的价值往往藏在那些没人愿干的“脏活累活”里。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#美图
#谷歌
#GPT-5
#宝可梦水晶
#AI安全
#“人工智能+”
#MoE
#Gemini
#RAG
#ICLR
#联合国
#腾讯会议AI
#Vibe
## Short: Podcast Formatting
AI公司的安全承诺到底有几分可信开会摸鱼的你顶得住AI的“向上管理”吗AI通关宝可梦离通关现实世界还有多远
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。咱们废话不多说直接来看这周又有哪些新动向。
首先是两个让生活更方便的新功能。你手机里那些糊得像打了马赛克的“电子包浆”老照片有救了。美图公司新出的“全能修复”功能基于混合专家模型MoE号称能一键把你的陈年老图变高清艺术品。另一边谷歌翻译也放了个大招在Gemini模型的加持下搞出了实时同声传译。以后跟外国朋友聊天终于可以告别你说一句、我翻一句的尴尬了AI能自动识别语调和停顿流畅得像你的私人翻译官。
说到聪明谁也比不过GPT-5。这家伙最近去《宝可梦水晶》里“旅游”了一圈结果只用了9千多步就通关了效率是前代的3倍。据说它在游戏里几乎不迷路空间推理能力点满。看来以后检验大模型聪不聪明的黄金标准不是下棋而是抓皮卡丘了。当然这份聪明API账单可能有点“肉疼”。
AI越来越强安全问题也浮出水面。OpenAI、Anthropic这些大厂一边说着“我的模型很乖”一边又承认顶级模型有被用于制造生物武器的风险。他们所谓的“安全网”被一份报告揭露得像个筛子连黑客都防不住这操作属实有点“裱糊匠”精神了。不仅如此连开发者工具都遭了殃`Nx`这个工具包就被植入了木马,专偷加密货币钱包。
好在监管也在跟上。学术圈顶会ICLR 2026发了新规用AI写论文必须明确披露否则直接拒稿想靠AI“灌水”的好日子到头了。全球层面联合国也成立了AI专家小组准备给这匹快马套上缰绳。咱们国家也正式印发了《“人工智能+”行动意见》目标是到2027年智能体和智能终端普及率超过70%看来AI成为水电煤一样的基础设施已经排上日程了。
最后聊个轻松的。腾讯会议的AI纪要最近火了因为它把一场同事们讨论去哪儿玩的闲聊硬生生分析成了一份充满“组织张力”的报告什么“话题跳跃暴露议程缺失”、“团队承压能力分化”……这AI是刚读完《组织行为学》就来上班了吧这也提醒我们AI是解决问题的工具不是取代思考的捷径。就像有网友说的“Vibe Coding”很爽但终究写不出《白夜行》。归根到底创造独一无二的价值才是王道。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#GPT-5
#AI安全
#人工智能+
#美图
#谷歌翻译
#宝可梦
#实时同声传译
#ICLR_2026
#联合国
#RAG
#腾讯会议AI
#Vibe_Coding

View File

@@ -1,81 +1,81 @@
# 来生小酒馆 2025/8/29
## Full: Podcast Formatting
和AI聊天会让你变得“机里机气”吗科技巨头砸钱影响政策是创新还是操纵你的数字人同事会是吴彦祖吗
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。好了废话不多说咱们赶紧来看看最近又有什么新动静。
首先大厂们又开始“整活儿”了。百度智能云在云智大会上全面升级了它的AI平台什么百舸5.0、千帆4.0听着就像是未来战舰的代号对吧说白了就是为了让企业开发AI更便宜、更高效。不过啊全场最靓的仔还得是百度推出的新数字人员工——“AI吴彦祖”和“AI老师傅”。你没听错就是那个吴彦祖。这下好了以后开会对面坐着的可能就是数字人吴彦祖了……嗯感觉上班的动力都多了几分。这标志着百度正努力让AI云从一个烧钱的部门变成一个能赚钱的中心。
大厂在忙着搞基建AI教育赛道这边也打得火热。阿里旗下的夸克直接复刻了电商的经典打法推出了面向全国7000万师生的“教育计划”。免费会员、超低价续费AI文档、网盘这些功能打包送摆明了就是要用“百亿补贴”来培养下一代的用户习惯。另一边清华背景的新玩家“奇点灵智”也拿到了数千万融资他们专注的是3到8岁儿童的AI英语启蒙领头人还是当年“网易有道词典”的创始人。看来从娃娃抓起的AI教育竞争是越来越激烈了。
话说回来你有没有发现自己或者身边朋友最近说话……越来越像个“文化人”了比如动不动就“深入探讨delve”一下形容事情也用上了“错综复杂intricate”这种词。别怀疑这可能不是你突然爱上学习了。佛罗里达州立大学的一项新研究发现自从ChatGPT问世后这些学术性词汇在咱们日常聊天里的使用频率显著增加了。这种现象被称为“渗透效应”也就是说AI的语言风格可能正在悄悄地改变我们的说话习惯。想想还挺有意思的对吧
不过要说影响有家公司可不满足于这种潜移默化。Meta就是那个Facebook的母公司准备成立一个超级政治行动委员会打算投入几千万美元去支持那些对AI监管持宽松立场的加州候选人。这波操作……可以说是非常直接了直接下场用真金白银为自家的AI发展开路。
当然除了这种看得见的行动还有些看不见的风险需要我们警惕。最近在Reddit上有个新词火了叫“氛围劫持”Vibe-hacking。简单说就是有人可能通过操纵AI让它生成带有特定情感或氛围的内容从而潜移默化地影响舆论。这种看不见的操纵确实得防着点。
说到Meta他们家最近好像有点水逆。有网友爆料那个重金打造的超级智能实验室成了个人才“旋转门”不少顶尖研究员入职没多久就跑了有的甚至还回了老东家OpenAI。看来啊在AI人才争夺战里光靠砸钱还真不一定管用企业文化和研究自由度可能更重要。
最后说几个对咱们开发者和普通用户都很有用的好东西。腾讯开源了一个叫Youtu-agent的框架让普通人也能像搭积木一样用几句简单的配置就让AI帮你上网查资料、整理文件。美团也开源了InfiniteTalk专治AI配音视频的“面瘫”问题能让数字人从口型到全身动作都自然起来。想用人话跟数据库聊天的可以看看GitHub上爆火的WrenAI。
哦对了还有两个福利和干货视频生成模型PixVerse发布了V5版从现在到9月1号所有用户都可以免费体验想尝鲜的可以冲了。另外微软CEO萨提亚亲自下场“带货”分享了他自己日常工作流里用的5个Copilot神级提示词从会议纪要到项目报告简直是打工人的提效神器可以直接抄作业
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#百度智能云
#AI吴彦祖
#夸克
#奇点灵智
#AI教育
#渗透效应
#ChatGPT
#Meta
#政治行动委员会
#AI监管
#氛围劫持
#Youtu-agent
#InfiniteTalk
#开源
#时间杠杆
#Copilot
## Short: Podcast Formatting
当你的同事变成了“AI吴彦祖”是福是祸
科技巨头砸钱影响政策,是自我保护还是破坏规则?
AI正悄悄改变你说话的方式你发现了吗
三问浮世而后求索。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。最近的AI圈那叫一个热闹非凡。
先看大厂们的动作。百度智能云开大会不仅升级了百舸和千帆两大平台帮企业降本增效还推出了“AI吴彦祖”和“AI老师傅”这样的数字新员工。好家伙以后开会左边是吴彦祖右边是老师傅这工作体验想都不敢想。另一边阿里夸克直接复刻电商打法给全国师生狂撒“教育补贴”AI文档、网盘这些功能直接打到“地板价”就是要把AI学习工具的用户习惯给拿捏住。
场外比场内还精彩。Meta觉得光做产品不过瘾准备成立一个超级政治行动委员会简单说就是打算用“钞能力”来支持那些对AI监管宽松的候选人。不过这边刚要砸钱影响政策那边自家重金打造的超级智能实验室就被爆出留不住人顶尖人才纷纷“润”回OpenAI。看来这AI人才战光靠砸钱是真不行啊。
有意思的研究也层出不穷。佛罗里达州立大学发现自从ChatGPT火了以后大家说话越来越“学术范”了张口就是“delve”、“intricate”这类词。这可不是你变博学了可能是AI的语言风格正在悄悄“渗透”你。除此之外AI现在还能当“新农人”一眼识别水稻品种和病害还能当骑行“电子眼”守护你的安全。不得不说AI真是上得厅堂下得厨房。
开源社区更是神仙打架。腾讯的Youtu-agent让你像搭积木一样轻松创建AI智能体美团的InfiniteTalk直接让配音视频里的数字人从“面瘫”进化成“影帝”表情、姿态、小动作全都活灵活现。
最后来几条社媒快讯视频模型PixVerse V5版本限时免费可以去薅羊毛了微软CEO萨提亚亲自下场分享了5个让你工作效率翻倍的Copilot提示词堪称打工人摸鱼哦不是提效指南还有博主提出AI是继资本、技术之后的第六大“时间杠杆”能把所有重复劳动都变成你的个人资产。这个思路值得琢磨。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#百度智能云
#AI吴彦祖
#阿里夸克
#奇点灵智
#Meta
#政治行动委员会
#渗透效应
#ChatGPT
#Youtu-agent
#InfiniteTalk
#WrenAI
#firecracker
#chroma
#OpenProject
#Vibe-hacking
#时间杠杆
# 来生小酒馆 2025/8/29
## Full: Podcast Formatting
和AI聊天会让你变得“机里机气”吗科技巨头砸钱影响政策是创新还是操纵你的数字人同事会是吴彦祖吗
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。好了废话不多说咱们赶紧来看看最近又有什么新动静。
首先大厂们又开始“整活儿”了。百度智能云在云智大会上全面升级了它的AI平台什么百舸5.0、千帆4.0听着就像是未来战舰的代号对吧说白了就是为了让企业开发AI更便宜、更高效。不过啊全场最靓的仔还得是百度推出的新数字人员工——“AI吴彦祖”和“AI老师傅”。你没听错就是那个吴彦祖。这下好了以后开会对面坐着的可能就是数字人吴彦祖了……嗯感觉上班的动力都多了几分。这标志着百度正努力让AI云从一个烧钱的部门变成一个能赚钱的中心。
大厂在忙着搞基建AI教育赛道这边也打得火热。阿里旗下的夸克直接复刻了电商的经典打法推出了面向全国7000万师生的“教育计划”。免费会员、超低价续费AI文档、网盘这些功能打包送摆明了就是要用“百亿补贴”来培养下一代的用户习惯。另一边清华背景的新玩家“奇点灵智”也拿到了数千万融资他们专注的是3到8岁儿童的AI英语启蒙领头人还是当年“网易有道词典”的创始人。看来从娃娃抓起的AI教育竞争是越来越激烈了。
话说回来你有没有发现自己或者身边朋友最近说话……越来越像个“文化人”了比如动不动就“深入探讨delve”一下形容事情也用上了“错综复杂intricate”这种词。别怀疑这可能不是你突然爱上学习了。佛罗里达州立大学的一项新研究发现自从ChatGPT问世后这些学术性词汇在咱们日常聊天里的使用频率显著增加了。这种现象被称为“渗透效应”也就是说AI的语言风格可能正在悄悄地改变我们的说话习惯。想想还挺有意思的对吧
不过要说影响有家公司可不满足于这种潜移默化。Meta就是那个Facebook的母公司准备成立一个超级政治行动委员会打算投入几千万美元去支持那些对AI监管持宽松立场的加州候选人。这波操作……可以说是非常直接了直接下场用真金白银为自家的AI发展开路。
当然除了这种看得见的行动还有些看不见的风险需要我们警惕。最近在Reddit上有个新词火了叫“氛围劫持”Vibe-hacking。简单说就是有人可能通过操纵AI让它生成带有特定情感或氛围的内容从而潜移默化地影响舆论。这种看不见的操纵确实得防着点。
说到Meta他们家最近好像有点水逆。有网友爆料那个重金打造的超级智能实验室成了个人才“旋转门”不少顶尖研究员入职没多久就跑了有的甚至还回了老东家OpenAI。看来啊在AI人才争夺战里光靠砸钱还真不一定管用企业文化和研究自由度可能更重要。
最后说几个对咱们开发者和普通用户都很有用的好东西。腾讯开源了一个叫Youtu-agent的框架让普通人也能像搭积木一样用几句简单的配置就让AI帮你上网查资料、整理文件。美团也开源了InfiniteTalk专治AI配音视频的“面瘫”问题能让数字人从口型到全身动作都自然起来。想用人话跟数据库聊天的可以看看GitHub上爆火的WrenAI。
哦对了还有两个福利和干货视频生成模型PixVerse发布了V5版从现在到9月1号所有用户都可以免费体验想尝鲜的可以冲了。另外微软CEO萨提亚亲自下场“带货”分享了他自己日常工作流里用的5个Copilot神级提示词从会议纪要到项目报告简直是打工人的提效神器可以直接抄作业
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#百度智能云
#AI吴彦祖
#夸克
#奇点灵智
#AI教育
#渗透效应
#ChatGPT
#Meta
#政治行动委员会
#AI监管
#氛围劫持
#Youtu-agent
#InfiniteTalk
#开源
#时间杠杆
#Copilot
## Short: Podcast Formatting
当你的同事变成了“AI吴彦祖”是福是祸
科技巨头砸钱影响政策,是自我保护还是破坏规则?
AI正悄悄改变你说话的方式你发现了吗
三问浮世而后求索。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。最近的AI圈那叫一个热闹非凡。
先看大厂们的动作。百度智能云开大会不仅升级了百舸和千帆两大平台帮企业降本增效还推出了“AI吴彦祖”和“AI老师傅”这样的数字新员工。好家伙以后开会左边是吴彦祖右边是老师傅这工作体验想都不敢想。另一边阿里夸克直接复刻电商打法给全国师生狂撒“教育补贴”AI文档、网盘这些功能直接打到“地板价”就是要把AI学习工具的用户习惯给拿捏住。
场外比场内还精彩。Meta觉得光做产品不过瘾准备成立一个超级政治行动委员会简单说就是打算用“钞能力”来支持那些对AI监管宽松的候选人。不过这边刚要砸钱影响政策那边自家重金打造的超级智能实验室就被爆出留不住人顶尖人才纷纷“润”回OpenAI。看来这AI人才战光靠砸钱是真不行啊。
有意思的研究也层出不穷。佛罗里达州立大学发现自从ChatGPT火了以后大家说话越来越“学术范”了张口就是“delve”、“intricate”这类词。这可不是你变博学了可能是AI的语言风格正在悄悄“渗透”你。除此之外AI现在还能当“新农人”一眼识别水稻品种和病害还能当骑行“电子眼”守护你的安全。不得不说AI真是上得厅堂下得厨房。
开源社区更是神仙打架。腾讯的Youtu-agent让你像搭积木一样轻松创建AI智能体美团的InfiniteTalk直接让配音视频里的数字人从“面瘫”进化成“影帝”表情、姿态、小动作全都活灵活现。
最后来几条社媒快讯视频模型PixVerse V5版本限时免费可以去薅羊毛了微软CEO萨提亚亲自下场分享了5个让你工作效率翻倍的Copilot提示词堪称打工人摸鱼哦不是提效指南还有博主提出AI是继资本、技术之后的第六大“时间杠杆”能把所有重复劳动都变成你的个人资产。这个思路值得琢磨。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#百度智能云
#AI吴彦祖
#阿里夸克
#奇点灵智
#Meta
#政治行动委员会
#渗透效应
#ChatGPT
#Youtu-agent
#InfiniteTalk
#WrenAI
#firecracker
#chroma
#OpenProject
#Vibe-hacking
#时间杠杆
#Microsoft 365 Copilot

View File

@@ -1,91 +1,91 @@
# 来生小酒馆 2025/8/30
## Full: Podcast Formatting
AI生成内容都要“持证上岗”了这会影响你吗
你的聊天记录正在被用来训练AI吗
AI工具让我们更忙这到底是为什么
三条问题有待提炼亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天科技圈又是一片热火朝天的景象新模型、新规定、新八卦一个都不少。咱们赶紧来看看大佬们又在整什么新活儿。
先说说这几家巨头吧,简直是约好了似的,扎堆发新品。
埃隆·马斯克的xAI又来“砸场子”了。他们发布了一个全新的编码模型叫Grok Code Fast-1。这名字一听就懂主打一个“快”和“省”。据说啊速度快到飞起价格呢比GPT-5便宜了整整10倍……程序员朋友们你们的福音可能真的来了。马斯克的目标很明确就是要让它成为你日常“搬砖”的主力模型。
另一边谷歌DeepMind也没闲着秀出了一个P图神器叫Gemini 2.5 Flash Image外号“Nano Banana”。为啥叫这个名呢因为它能把一张香蕉的图片通过对话一步步给你P成一件华丽的晚礼服这脑洞……真是突破天际了。它的核心亮点在于能像聊天一样修改图片真正做到了“先看懂再动手画”让P图这事儿变得特别丝滑。
说到丝滑OpenAI连夜也放了个大招推出了一个专为语音AI设计的模型叫GPT-Realtime。这玩意儿可不一般它能模仿人类丰富的语调和情感甚至……能听懂你的笑声。诶你没听错以后你跟AI聊天它可能知道你是在真笑还是在尬笑了。而且它还能看图说话让语音交互的体验离真人又近了一大步。
当然国内的快手也没落下旗下的视频生成模型Kling最近正在广发英雄帖升级了“创意合伙人计划”邀请各路神仙一起来打磨产品看来是想集思广益搞点大事情。
不过啊技术跑得快规则也得跟上。这不国内针对AIGC的“监管风暴”说来就来。从9月1号开始所有AI生成的内容都必须带上“身份证”了。什么意思呢就是得有明确的文字或水印还得在数据里藏个隐式标记让“AI生成”这四个字无处遁形。无论你是创作者还是平台都得注意了这回是强制性国标整个行业的玩法可能要变一变了。
聊完规定我们再来聊聊隐私。那个曾经标榜“绝不使用用户数据训练模型”的Anthropic公司最近上演了一出“真香定律”宣布要开始用大家和Claude的聊天记录来训练模型了。嗯……这个180度的大转弯让“你的数据正在让你用的AI变得更强”这句话有了全新的含义。这事儿肯定会引发新一轮关于隐私边界的大讨论你怎么看呢
说到数据特斯拉最近也挺尴尬的。在一起致命车祸的调查里他们声称关键数据“不翼而飞”了。结果你猜怎么着一位黑客大哥硬是把数据给找了出来……这下好了不仅让特斯拉的“甩锅”行为大白于天下也让大家对Autopilot系统的数据透明度打上了一个大大的问号。
说到底我们真的理解AI吗有份研究报告挺有意思的它说啊让普通人去判断AI推理过程里的关键步骤准确率只有29%基本等于瞎猜。这说明我们可能只是在“自以为是”地理解AI的思考过程。
这也引出了一个在社交媒体上很火的讨论为什么用了AI工具之后我们反而感觉更忙了有位博主一针见血地指出AI的本质可能不是帮你节省时间而是用同样的时间赋予了你过去无法企及的能力。你开始尝试以前做不到的事这是一种能力的“升维”而不是简单的效率提升。这么一想好像确实是这么回事儿对吧
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#Kling
#xAI
#Grok Code Fast-1
#Gemini 2.5 Flash
#OpenAI
#GPT-Realtime
#Anthropic
#AI生成内容
#标识
#隐私
#特斯拉
#Autopilot
#MiniCPM-V
#Chain-of-Thought
#AI效率悖论
## Short: Podcast Formatting
为了更聪明的AI你愿意交出聊天记录吗
AI工具是让你更闲了还是更忙了
AI的思考过程我们真的能看懂吗
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。最近科技圈可真是神仙打架咱们赶紧来看看。
快手旗下的Kling视频模型正在广发英雄帖升级了“创意合伙人计划”想邀请各位脑洞大的朋友一起打磨产品。另一边马斯克的xAI也来“砸场子”了发布了新的编码模型Grok Code Fast-1主打一个又快又省号称比GPT-5便宜10倍程序员朋友们可以关注一下。
谷歌DeepMind也没闲着他们的P图神器Gemini 2.5 Flash外号“Nano Banana”能把香蕉P成晚礼服支持聊天式P图真正做到了“看懂再画”。而OpenAI则深夜放出了专为语音交互设计的GPT-Realtime能模仿人类的语调和情感让AI助手听起来更像个人了。
聊完产品我们看看行业动态。首先是Anthropic上演了一出“真香定律”宣布要开始用咱们和Claude的聊天记录来训练模型了关于隐私和智能的这笔交易你怎么看接着是特斯拉在一场车祸调查里说关键数据没了结果被黑客给找着了这下场面就有点尴尬了也给Autopilot的数据透明度打上了一个问号。
监管层面也有新消息国内新规要求从9月1号起所有AI生成的内容都必须带上“身份证”也就是明确的标识不然平台可能会给你限流下架。各位内容创作者们可得注意了。
一些新研究也很有意思。有研究教会了AI“察言观色”通过面部表情来生成有感情的语音。但另一份研究又给我们泼了盆冷水说人类判断AI推理步骤的准确率只有29%和瞎猜差不多。看来我们离真正理解AI还有很长的路要走。
最后分享几个观点。有人说AI工具其实没让我们变闲而是让我们用同样的时间去挑战了过去完不成的事这是一种能力的“升维”。还有人靠着天花板级别的提示词让Gemini把13张风马牛不相及的图片融合成了一幅画。这都说明未来的工作可能不仅是人与AI的协作更是人与人的“提示词”大赛了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#快手Kling
#xAI
#GrokCodeFast-1
#谷歌Gemini
#OpenAI
#GPT-Realtime
#Anthropic
#隐私
#特斯拉
#Autopilot
#AIGC
#监管
#开源
#MiniCPM-V
#WindowsTerminal
#AI效率悖论
# 来生小酒馆 2025/8/30
## Full: Podcast Formatting
AI生成内容都要“持证上岗”了这会影响你吗
你的聊天记录正在被用来训练AI吗
AI工具让我们更忙这到底是为什么
三条问题有待提炼亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天科技圈又是一片热火朝天的景象新模型、新规定、新八卦一个都不少。咱们赶紧来看看大佬们又在整什么新活儿。
先说说这几家巨头吧,简直是约好了似的,扎堆发新品。
埃隆·马斯克的xAI又来“砸场子”了。他们发布了一个全新的编码模型叫Grok Code Fast-1。这名字一听就懂主打一个“快”和“省”。据说啊速度快到飞起价格呢比GPT-5便宜了整整10倍……程序员朋友们你们的福音可能真的来了。马斯克的目标很明确就是要让它成为你日常“搬砖”的主力模型。
另一边谷歌DeepMind也没闲着秀出了一个P图神器叫Gemini 2.5 Flash Image外号“Nano Banana”。为啥叫这个名呢因为它能把一张香蕉的图片通过对话一步步给你P成一件华丽的晚礼服这脑洞……真是突破天际了。它的核心亮点在于能像聊天一样修改图片真正做到了“先看懂再动手画”让P图这事儿变得特别丝滑。
说到丝滑OpenAI连夜也放了个大招推出了一个专为语音AI设计的模型叫GPT-Realtime。这玩意儿可不一般它能模仿人类丰富的语调和情感甚至……能听懂你的笑声。诶你没听错以后你跟AI聊天它可能知道你是在真笑还是在尬笑了。而且它还能看图说话让语音交互的体验离真人又近了一大步。
当然国内的快手也没落下旗下的视频生成模型Kling最近正在广发英雄帖升级了“创意合伙人计划”邀请各路神仙一起来打磨产品看来是想集思广益搞点大事情。
不过啊技术跑得快规则也得跟上。这不国内针对AIGC的“监管风暴”说来就来。从9月1号开始所有AI生成的内容都必须带上“身份证”了。什么意思呢就是得有明确的文字或水印还得在数据里藏个隐式标记让“AI生成”这四个字无处遁形。无论你是创作者还是平台都得注意了这回是强制性国标整个行业的玩法可能要变一变了。
聊完规定我们再来聊聊隐私。那个曾经标榜“绝不使用用户数据训练模型”的Anthropic公司最近上演了一出“真香定律”宣布要开始用大家和Claude的聊天记录来训练模型了。嗯……这个180度的大转弯让“你的数据正在让你用的AI变得更强”这句话有了全新的含义。这事儿肯定会引发新一轮关于隐私边界的大讨论你怎么看呢
说到数据特斯拉最近也挺尴尬的。在一起致命车祸的调查里他们声称关键数据“不翼而飞”了。结果你猜怎么着一位黑客大哥硬是把数据给找了出来……这下好了不仅让特斯拉的“甩锅”行为大白于天下也让大家对Autopilot系统的数据透明度打上了一个大大的问号。
说到底我们真的理解AI吗有份研究报告挺有意思的它说啊让普通人去判断AI推理过程里的关键步骤准确率只有29%基本等于瞎猜。这说明我们可能只是在“自以为是”地理解AI的思考过程。
这也引出了一个在社交媒体上很火的讨论为什么用了AI工具之后我们反而感觉更忙了有位博主一针见血地指出AI的本质可能不是帮你节省时间而是用同样的时间赋予了你过去无法企及的能力。你开始尝试以前做不到的事这是一种能力的“升维”而不是简单的效率提升。这么一想好像确实是这么回事儿对吧
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#Kling
#xAI
#Grok Code Fast-1
#Gemini 2.5 Flash
#OpenAI
#GPT-Realtime
#Anthropic
#AI生成内容
#标识
#隐私
#特斯拉
#Autopilot
#MiniCPM-V
#Chain-of-Thought
#AI效率悖论
## Short: Podcast Formatting
为了更聪明的AI你愿意交出聊天记录吗
AI工具是让你更闲了还是更忙了
AI的思考过程我们真的能看懂吗
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。最近科技圈可真是神仙打架咱们赶紧来看看。
快手旗下的Kling视频模型正在广发英雄帖升级了“创意合伙人计划”想邀请各位脑洞大的朋友一起打磨产品。另一边马斯克的xAI也来“砸场子”了发布了新的编码模型Grok Code Fast-1主打一个又快又省号称比GPT-5便宜10倍程序员朋友们可以关注一下。
谷歌DeepMind也没闲着他们的P图神器Gemini 2.5 Flash外号“Nano Banana”能把香蕉P成晚礼服支持聊天式P图真正做到了“看懂再画”。而OpenAI则深夜放出了专为语音交互设计的GPT-Realtime能模仿人类的语调和情感让AI助手听起来更像个人了。
聊完产品我们看看行业动态。首先是Anthropic上演了一出“真香定律”宣布要开始用咱们和Claude的聊天记录来训练模型了关于隐私和智能的这笔交易你怎么看接着是特斯拉在一场车祸调查里说关键数据没了结果被黑客给找着了这下场面就有点尴尬了也给Autopilot的数据透明度打上了一个问号。
监管层面也有新消息国内新规要求从9月1号起所有AI生成的内容都必须带上“身份证”也就是明确的标识不然平台可能会给你限流下架。各位内容创作者们可得注意了。
一些新研究也很有意思。有研究教会了AI“察言观色”通过面部表情来生成有感情的语音。但另一份研究又给我们泼了盆冷水说人类判断AI推理步骤的准确率只有29%和瞎猜差不多。看来我们离真正理解AI还有很长的路要走。
最后分享几个观点。有人说AI工具其实没让我们变闲而是让我们用同样的时间去挑战了过去完不成的事这是一种能力的“升维”。还有人靠着天花板级别的提示词让Gemini把13张风马牛不相及的图片融合成了一幅画。这都说明未来的工作可能不仅是人与AI的协作更是人与人的“提示词”大赛了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#快手Kling
#xAI
#GrokCodeFast-1
#谷歌Gemini
#OpenAI
#GPT-Realtime
#Anthropic
#隐私
#特斯拉
#Autopilot
#AIGC
#监管
#开源
#MiniCPM-V
#WindowsTerminal
#AI效率悖论
#提示词工程

View File

@@ -1,84 +1,84 @@
# 来生小酒馆 2025/8/31
## Full: Podcast Formatting
AI当一作人类当顾问这是进步还是降级
为预警被开除反手融资15亿是复仇还是远见
AI写的新闻你敢信吗
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天咱们聊点有意思的从手机里那个越来越懂你的“小管家”聊到学术圈里AI开始当“大佬”的奇闻。
咱们直接开聊。谷歌最近给他们家未来的Pixel 10手机塞进去一个叫Magic Cue的新功能。这玩意儿……怎么说呢就像一个会读心术的贴身管家。你都不用吭声它就默默观察你的行为然后主动把航班号啊、会议地点啊这些关键信息给你弹出来。这背后呢是升级版的Gemini Nano芯片和全新的Tensor G5处理器在撑腰标志着手机智能正式从你问我答的被动模式进化到“我猜你想要”的主动模式了。
说到谷歌他们最近还挺皮的官方玩起了“改名梗”。把自家的一个模型Gemini 2.5 Flash正式改名叫Nano Banana纳米香蕉。确认按钮都给你换成了香蕉黄。别小看这根“香蕉”啊它本事可不小。有网友让它生成角色它能让角色摆出类似汉字的造型跟练人体书法似的。还有人奇思妙想让它把你最爱的奶茶变成一个可爱的抱枕它也能给你设计出来。看来技术圈也需要这种幽默感和记忆点嘛。
再来看看国内通义千问最近解决了一个P图界的百年难题——精准改字。你知道吧以前P图改字总感觉有点假不是光影不对就是字体不搭。现在这个Qwen-Image-Edit模型号称“隐形修复大师”能把一张图上的“香飘飘”logo无痕切换成“GUCCI”而且字体、光影、排版都给你保留得妥妥的。国产模型在这些细节上的能力确实是越来越强了。
聊完产品我们聊点有深度的话题。学术圈最近出了件新鲜事斯坦福大学办了个“AI科学家大会”立了个规矩所有投过来的论文第一作者必须是AI咱们人类学者呢只能退居二线当“顾问”。连审稿、做报告的也都是AI。这……与其说是开会不如说是一场大型社会实验在探索AI到底能在科研里走多远。未来我们到底是AI的合作伙伴还是实验室里的“高级助手”这个问题越来越现实了。
说到对未来的思考有个23岁的天才叫Leopold他的故事就更戏剧性了。他之前因为警告OpenAI的安全风险被公司给开了。结果人家转头就写了本165页的AI预言书预测AGI也就是通用人工智能将在2027年到来。靠着这本书和自己对AI的深刻理解他反手就撬动了15亿美金的投资。这剧情简直就是现实版的“王子复仇记”啊。
既然AI越来越能干新的博弈也开始了。比如很多内容创作者发现谷歌会用他们的网站内容去做AI总结于是一场关于数据主权的“数字自卫反击战”就打响了大家都在研究怎么阻止谷歌“白嫖”自己的原创内容。
还有个更有意思的思考题有网友在网上问如果有一个新闻网站文章全是AI写的但每一条事实都链接到路透社、美联社这种可靠信源你敢信吗你看这个问题一下子就把信任的难题从“信不信这个记者”转移到了“信不信AI选择的这个信源”上。绕来绕去信任的核心还是没变。
最后说几个好玩的。AI编程大神Andrej Karpathy最近分享了他的编程心法简单说就是把AI当成不同级别的工具人分层使用还说代码以后会变得很廉价可以随时生成大量一次性的代码来解决问题。而宾夕法尼亚大学的Ethan Mollick教授就更会玩了他让AI设计一个“世上最烦人但功能正常的验证码”结果AI不仅秒懂还交出了一份充满黑色幽默的“杰作”。看来AI已经很懂怎么让咱们人类抓狂了哈哈。
哦对了开源社区最近也挺热闹。有管理库存的InvenTree有像写代码一样管理云服务器的Terraform还有能一键给VPS重装系统的reinstall简直是懒人福音。当然也少不了awesome-public-datasets这种汇集了海量开放数据集的“数据加油站”。AI的进步确实也离不开这些开源力量的贡献。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#谷歌
#Magic Cue
#通义千问
#Qwen-Image-Edit
#AI科学家大会
#OpenAI
#AGI
#Nano Banana
#Gemini Nano
#Tensor G5
#Leopold Aschenbrenner
#InvenTree
#Terraform
#reinstall
#awesome-public-datasets
#Andrej Karpathy
#Ethan Mollick
## Short: Podcast Formatting
AI当论文一作人类该干啥
手机比你还懂你,是贴心还是可怕?
为AI安全吹哨被开除还值得吗
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。信息量有点大咱们直接开聊。
首先谷歌要给新款Pixel 10手机装上一个叫Magic Cue的系统。简单说就是你的手机成精了它会默默观察你不等你开口就主动把航班号、会议地点之类的信息推给你。这背后是升级版的Gemini Nano和新处理器在发功让手机从“等指令”进化到“会预判”。以后出门忘带脑子可能就得靠手机了。
说到谷歌他们最近还玩心大起正式把Gemini 2.5 Flash模型改名叫Nano Banana也就是“纳米香蕉”。确认按钮都变成了香蕉黄真是官方玩梗最为致命。别小看这根“香蕉”它本事可不小有网友让它生成汉字姿势的角色它真就给你用身体“写”了出来还有人让它把奶茶变成抱枕也是一句话的事。看来技术圈也需要点幽默感来刷存在感。
再看看国内通义千问搞出了一个Qwen-Image-Edit模型解决了P图界的一大难题——无痕改字。它能把图片里的“香飘飘”改成“GUCCI”字体、光影、排版都跟原图一模一样堪称P图界的“隐形修复大师”以后看图可得睁大眼睛了。
更绝的是学术圈斯坦福大学首创了一个“AI科学家大会”规定所有论文必须由AI担任第一作者人类学者只能当顾问。AI自己写论文、自己审稿、自己做报告。这到底是大型社会实验还是咱们以后给AI当“高级助手”的岗前培训真是让人浮想联翩。
聊到未来就得提一个猛人前OpenAI员工Leopold。这位23岁的天才因为警告公司安全风险被开除结果人家转身写了本预言书预测AGI将在2027年到来顺手还融了15亿美金。这出“王子复仇记”告诉我们对AI的理解有时候真的能变成真金白银。
当然普通人也没闲着。内容创作者们开始研究怎么阻止谷歌用自家网站内容去搞AI总结而网友们则在激烈辩论一个完全由AI撰写但每条事实都链接到权威信源的新闻网站你到底信还是不信看来信任这东西在AI时代变得更复杂了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#Magic Cue
#Qwen-Image-Edit
#AI科学家大会
#Leopold Aschenbrenner
#AGI
#Nano Banana
#谷歌
#OpenAI
#斯坦福大学
#Pixel 10
# 来生小酒馆 2025/8/31
## Full: Podcast Formatting
AI当一作人类当顾问这是进步还是降级
为预警被开除反手融资15亿是复仇还是远见
AI写的新闻你敢信吗
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天咱们聊点有意思的从手机里那个越来越懂你的“小管家”聊到学术圈里AI开始当“大佬”的奇闻。
咱们直接开聊。谷歌最近给他们家未来的Pixel 10手机塞进去一个叫Magic Cue的新功能。这玩意儿……怎么说呢就像一个会读心术的贴身管家。你都不用吭声它就默默观察你的行为然后主动把航班号啊、会议地点啊这些关键信息给你弹出来。这背后呢是升级版的Gemini Nano芯片和全新的Tensor G5处理器在撑腰标志着手机智能正式从你问我答的被动模式进化到“我猜你想要”的主动模式了。
说到谷歌他们最近还挺皮的官方玩起了“改名梗”。把自家的一个模型Gemini 2.5 Flash正式改名叫Nano Banana纳米香蕉。确认按钮都给你换成了香蕉黄。别小看这根“香蕉”啊它本事可不小。有网友让它生成角色它能让角色摆出类似汉字的造型跟练人体书法似的。还有人奇思妙想让它把你最爱的奶茶变成一个可爱的抱枕它也能给你设计出来。看来技术圈也需要这种幽默感和记忆点嘛。
再来看看国内通义千问最近解决了一个P图界的百年难题——精准改字。你知道吧以前P图改字总感觉有点假不是光影不对就是字体不搭。现在这个Qwen-Image-Edit模型号称“隐形修复大师”能把一张图上的“香飘飘”logo无痕切换成“GUCCI”而且字体、光影、排版都给你保留得妥妥的。国产模型在这些细节上的能力确实是越来越强了。
聊完产品我们聊点有深度的话题。学术圈最近出了件新鲜事斯坦福大学办了个“AI科学家大会”立了个规矩所有投过来的论文第一作者必须是AI咱们人类学者呢只能退居二线当“顾问”。连审稿、做报告的也都是AI。这……与其说是开会不如说是一场大型社会实验在探索AI到底能在科研里走多远。未来我们到底是AI的合作伙伴还是实验室里的“高级助手”这个问题越来越现实了。
说到对未来的思考有个23岁的天才叫Leopold他的故事就更戏剧性了。他之前因为警告OpenAI的安全风险被公司给开了。结果人家转头就写了本165页的AI预言书预测AGI也就是通用人工智能将在2027年到来。靠着这本书和自己对AI的深刻理解他反手就撬动了15亿美金的投资。这剧情简直就是现实版的“王子复仇记”啊。
既然AI越来越能干新的博弈也开始了。比如很多内容创作者发现谷歌会用他们的网站内容去做AI总结于是一场关于数据主权的“数字自卫反击战”就打响了大家都在研究怎么阻止谷歌“白嫖”自己的原创内容。
还有个更有意思的思考题有网友在网上问如果有一个新闻网站文章全是AI写的但每一条事实都链接到路透社、美联社这种可靠信源你敢信吗你看这个问题一下子就把信任的难题从“信不信这个记者”转移到了“信不信AI选择的这个信源”上。绕来绕去信任的核心还是没变。
最后说几个好玩的。AI编程大神Andrej Karpathy最近分享了他的编程心法简单说就是把AI当成不同级别的工具人分层使用还说代码以后会变得很廉价可以随时生成大量一次性的代码来解决问题。而宾夕法尼亚大学的Ethan Mollick教授就更会玩了他让AI设计一个“世上最烦人但功能正常的验证码”结果AI不仅秒懂还交出了一份充满黑色幽默的“杰作”。看来AI已经很懂怎么让咱们人类抓狂了哈哈。
哦对了开源社区最近也挺热闹。有管理库存的InvenTree有像写代码一样管理云服务器的Terraform还有能一键给VPS重装系统的reinstall简直是懒人福音。当然也少不了awesome-public-datasets这种汇集了海量开放数据集的“数据加油站”。AI的进步确实也离不开这些开源力量的贡献。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#谷歌
#Magic Cue
#通义千问
#Qwen-Image-Edit
#AI科学家大会
#OpenAI
#AGI
#Nano Banana
#Gemini Nano
#Tensor G5
#Leopold Aschenbrenner
#InvenTree
#Terraform
#reinstall
#awesome-public-datasets
#Andrej Karpathy
#Ethan Mollick
## Short: Podcast Formatting
AI当论文一作人类该干啥
手机比你还懂你,是贴心还是可怕?
为AI安全吹哨被开除还值得吗
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。信息量有点大咱们直接开聊。
首先谷歌要给新款Pixel 10手机装上一个叫Magic Cue的系统。简单说就是你的手机成精了它会默默观察你不等你开口就主动把航班号、会议地点之类的信息推给你。这背后是升级版的Gemini Nano和新处理器在发功让手机从“等指令”进化到“会预判”。以后出门忘带脑子可能就得靠手机了。
说到谷歌他们最近还玩心大起正式把Gemini 2.5 Flash模型改名叫Nano Banana也就是“纳米香蕉”。确认按钮都变成了香蕉黄真是官方玩梗最为致命。别小看这根“香蕉”它本事可不小有网友让它生成汉字姿势的角色它真就给你用身体“写”了出来还有人让它把奶茶变成抱枕也是一句话的事。看来技术圈也需要点幽默感来刷存在感。
再看看国内通义千问搞出了一个Qwen-Image-Edit模型解决了P图界的一大难题——无痕改字。它能把图片里的“香飘飘”改成“GUCCI”字体、光影、排版都跟原图一模一样堪称P图界的“隐形修复大师”以后看图可得睁大眼睛了。
更绝的是学术圈斯坦福大学首创了一个“AI科学家大会”规定所有论文必须由AI担任第一作者人类学者只能当顾问。AI自己写论文、自己审稿、自己做报告。这到底是大型社会实验还是咱们以后给AI当“高级助手”的岗前培训真是让人浮想联翩。
聊到未来就得提一个猛人前OpenAI员工Leopold。这位23岁的天才因为警告公司安全风险被开除结果人家转身写了本预言书预测AGI将在2027年到来顺手还融了15亿美金。这出“王子复仇记”告诉我们对AI的理解有时候真的能变成真金白银。
当然普通人也没闲着。内容创作者们开始研究怎么阻止谷歌用自家网站内容去搞AI总结而网友们则在激烈辩论一个完全由AI撰写但每条事实都链接到权威信源的新闻网站你到底信还是不信看来信任这东西在AI时代变得更复杂了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#Magic Cue
#Qwen-Image-Edit
#AI科学家大会
#Leopold Aschenbrenner
#AGI
#Nano Banana
#谷歌
#OpenAI
#斯坦福大学
#Pixel 10
#Gemini Nano