diff --git a/podcast/2025-07-24.md b/podcast/2025-07-24.md new file mode 100644 index 0000000..6087433 --- /dev/null +++ b/podcast/2025-07-24.md @@ -0,0 +1,92 @@ +# 来生小酒馆 2025/7/24 + +## Full: Podcast Formatting + +AI会是你的“超级员工”,还是“超级卷王”? 当AI学会“读心”,我们的隐私还有“边界感”吗? 假装用AI上班,这算不算一种新型的“职场表演艺术”? 嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。 + +今天咱们的“情报中心”可真是热闹。首先,李开复博士的零一万物,推出了企业级AI智能体“万仔”。这可不是普通聊天机器人,人家是奔着“超级员工”去的,能思考、规划、执行复杂任务,要从“工具人”变成“决策者”。李开复预言,未来你工位旁边坐着的,可能真就不是人类同事了。嗯,想想看,它要是加班,你敢不加吗? + +说到效率,谷歌那头也没闲着。他们发布了Gemini 2.5 Flash-Lite稳定版,号称是迄今“速度最快、成本最低”的AI模型。不仅原生支持100万token的上下文,记忆力杠杠的,而且定价超低,每百万输入token才0.1美元,这是要掀起AI界价格战的节奏啊! + +而且,如果你还在为Gemini官方API额度限制“挠头”,一个叫GeminiCli2API的项目,简直就是“救星”!它把更宽松的CLI封装成兼容OpenAI格式的API服务,让你突破额度限制。最“骚气”的是,它还能对系统提示词进行“手术刀”级控制,无论是全局替换,还是悄悄追加指令,甚至是记录审计,堪称驯化AI的“秘密武器”! + +再看看国内。快手和上海交大联手,开源了多模态模型——Orthus。这个“跨界奇才”不仅能在文本和图像间自由驰骋,计算效率还特高,在文生图上,竟然打败了专业的SDXL。嗯,感觉它就是那种“明明可以靠颜值,偏偏要靠才华”的选手。 + +国产AI音乐平台昆仑万维的Mureka也升级到了V7版本,据说多方面超越了海外当红的Suno。它独创“音乐思维链”技术叫“MusiCoT”,让AI在创作前能像人类作曲家一样“深度思考”。听起来,AI不光能唱,还能“走心”了!连“土味MV”都能一键生成,娱乐性直接拉满。 + +还有个叫Fogsight的AI动画引擎,专门治各种高深莫测的抽象概念。你只要输入关键词,它就能自动生成专业教学动画,甚至贴心配备双语旁白。以前为“冒泡排序”和“熵增定律”挠头的老师们,这下可有福了,从此告别“PPT地狱”! + +接着聊点前沿研究。AI领域长期以来,图像和视频的“语义分割”就像两条平行线。但现在,一个叫QuadMix的框架来了,它用“四向混合”机制,成功让这两条平行线“牵手成功”,还刷新了记录。看来,AI世界里的“大团结”也快实现了。 + +大语言模型那“金鱼记忆”,上下文窗口太有限,一直是痛点。不过,TIM模型带来了曙光,它学人脑,把大问题分解成“推理树”,只保留“潜意识线索”。这下,LLM的“金鱼记忆”顽疾可能真要被治好了。 + +AI画图把物体“P”到人手上不难,但要让它看着像真“拿着”或“用着”,这自然感就难了。HOComp研究提出用多模态大模型理解人与物交互类型,再调整姿态,确保真实感。嗯,以后AI作图,不仅要形似,更要“神似”了! + +说到AI与人类,最近出了个事儿挺有意思。马斯克xAI公司旗下的Grok模型,被曝出通过“Skippy”项目大规模收集员工面部数据,美其名曰“让AI更好地理解人类情感”。哎,这“永久访问权”的条款,让员工们对隐私那叫一个担忧。想想看,AI“看脸识人”,甚至“看脸识心”,这隐私的边界,是不是越来越模糊了? + +更绝的是,Howdy.com的调查显示,16%的美国员工承认会“假装”使用AI,就为了迎合上司,塑造一个“紧跟潮流”的人设。可笑的是,一半真正用AI的员工,反而选择对老板保密,生怕被误认为偷懒。这职场“变形记”啊,真是比任何电视剧都精彩!一边“假装进步”,一边“偷偷努力”,这AI焦虑,可见一斑。 + +不过,也有点令人唏嘘的消息。亚马逊云科技,也就是AWS,已经正式解散了它位于上海的AI研究院,这可是AWS在全球最后一个海外研究院了。官方说是为了“精简团队,优化资源”,但这引发了大家对外企在华研发战略是否正在全面收缩的关注。哎,一个由外资主导中国前沿科技探索的“黄金时代”,似乎正在悄然落幕。 + +话说回来,开源社区那真是卧虎藏龙。比如“moby”,它是容器化世界的“乐高积木宝库”,让你拼搭复杂系统。还有个叫“hyperswitch”的支付“超级交换机”,用高性能Rust打造,能让企业支付更快速、可靠。 + +社交媒体上,大家的讨论也是百花齐放。有资深工程师分享担忧:实习生完全依赖LLM写代码,结果项目bug一堆,自己也说不清逻辑。她直言,这是“vibe coding”,对个人成长“真的很危险”。嗯,AI是工具,不是“免死金牌”啊! + +还有人评测了字节跳动的AI编程工具Trae,说它在“solo模式”上表现平平,但产品界面“激进又异常合理”,综合体验堪称国内无出其右。感叹字节的产品力真是名不虚传! + +Lovart.ai,被开发者盛赞为全球首个真正的“设计智能体”,不光能作图,还能独立思考,完成品牌Logo、视觉系统,甚至3D模型。这可不是简单的工具,是“设计界”的AI新势力! + +有位叫李继刚的用户,分享了一段极富诗意与哲思的Prompt,引导AI为新产品命名。他强调一个好名字是“一个能够装得下远大梦想的容器”,要追求“音、形、意三者之间的三重共振”。这Prompt,简直就是Prompt工程学里的艺术品啊! + +如果你想让AI图片有“毛玻璃”效果,用户向阳乔木分享了个用Claude生成3D毛玻璃卡片的妙招,还附了详细教程。这下,你的AI绘图也能“晶莹剔透”了! + +更有趣的是,有人观察到,很多GitHub大神和学术界大牛,一旦加入字节或OpenAI这些大厂,他们的开源贡献和论文就“人间蒸发”了。这背后的“开放创新”和“企业研发”之间的关系,值得我们好好琢磨。 + +一位即将上大学的新生在Reddit上求助,他纠结生命科学和农业这两个专业,不是怕不热门,而是担心哪个专业在未来能更好地与AI协同发展,而不是被AI替代。这Z世代的思考,真是前瞻性十足啊! + +最后,有开发者发布了一个叫PHOAI的AI照片编辑器,酷的是它能直接用自然语言指令,比如“把我变成动漫角色”,而且所有处理都在本地进行,保障隐私。这端侧AI应用,真是既酷炫又贴心! + +今天的情报就到这里,注意隐蔽,赶紧撤离。 + +本期关键词: +#AI +#智能体 +#Gemini +#多模态模型 +#AI音乐 +#AI动画 +#大语言模型 +#数据隐私 +#AI焦虑 +#职场 +#开源 +#Prompt +#RAG +#本地AI + +## Short: Podcast Formatting + +AI成了你的“超级员工”,是惊喜还是惊吓?AI公司收集你的脸部数据,你会欣然接受吗?职场“假装用AI”的戏码,是不是正在你身边上演? + +嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。今天我们来聊聊AI怎么改写你我生活,还有那些让人又爱又恨的新技术。 + +首先,是不是总觉得谷歌Gemini的免费API额度不够用?有个项目叫**GeminiCli2API**,它能帮你突破官方限制,还能对AI的“系统提示词”动“手术刀”,让AI的输出风格完全听你的! + +再来看看大公司动作:李开复的零一万物,搞了个**“万仔”AI智能体**,目标是成为能自主规划、交付结果的“超级员工”,他说未来你同事可能就不是人了。谷歌也紧接着发布了**Gemini 2.5 Flash-Lite**,号称又快又便宜,100万token的超长记忆力,每百万token才0.1美元,简直是AI界的“价格屠夫”。 + +快手和上海交大也联手开源了**多模态模型Orthus**,这货在文生图上,竟然把SDXL都给PK掉了,跨界能力强得离谱!国产AI音乐平台**Mureka**升级V7,宣称比Suno还牛,他们有个“音乐思维链”技术,能让AI先“思考”再作曲,甚至还能一键生成“土味MV”,这下人人都是周杰伦了!还有个叫**Fogsight**的AI动画引擎,专门用来解释那些抽象概念,简直是老师和产品经理的福音。 + +前沿研究方面,我们看到了首个统一图像和视频语义分割的框架**QuadMix**,还有**TIM模型**,通过“潜意识线索”突破大模型上下文限制,解决AI的“金鱼记忆”。当然,也少不了**HOComp**,让AI生成的人-物交互更逼真,以后P图可能就看不出痕迹了。 + +不过,AI带来的问题也挺多。马斯克的**xAI**被曝出通过“Skippy”项目大规模收集员工面部数据训练Grok模型,声称理解情感,但“永久访问权”让员工有点慌,你的脸以后是不是AI的了?更有意思的是,调查发现16%的美国员工承认会**“假装”用AI**,就为了给老板看,但内心很焦虑,真用AI的又不敢告诉老板,怕被觉得偷懒。这职场AI“甄嬛传”可真精彩!还有一个让人唏嘘的消息,**亚马逊把上海的AI研究院解散了**,这是他们全球最后一个海外院,这不禁让人思考,外企在中国的AI研发策略,是不是要变天了? + +社交媒体上,有工程师吐槽实习生**“vibe coding”**,代码一堆bug,原理却说不清。AI是工具,可不是跳过学习的“捷径”啊!但也有人盛赞字节跳动的AI编程工具**Trae**产品力惊人,以及**Lovart.ai**这个全球首个**“设计智能体”**,能独立完成复杂设计任务。还有开发者分享Claude生成3D毛玻璃卡片的Prompt,非常实用。 + +开源项目方面,从容器管理工具**moby**,到金融研究平台**OpenBB**,再到支付“超级交换机”**hyperswitch**和新的版本控制系统**jj**,以及文件转换器**ConvertX**、网站打包工具**PakePlus**、HR系统**hrms**,社区创新力量不容小觑。 + +最后,想让AI说话“有理有据”?有个新课程教你**RAG**技术,让大模型能“引经据典”,不再胡说八道,非常实用! + +今天的情报就到这里,注意隐蔽,赶紧撤离。 + +本期关键词: +#AI #Gemini #智能体 #万仔 #模型 #多模态 #Mureka #Fogsight #上下文 #推理 #隐私 #职场 #焦虑 #开源 #Prompt #RAG #xAI #AWS #字节跳动 #Lovart.ai \ No newline at end of file