From ba53f54631f0a1cfdddec2a3bc072ab76803bd60 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E4=BD=95=E5=A4=952077?= Date: Sat, 13 Sep 2025 23:30:05 +0800 Subject: [PATCH] Create podcast script file for 2025-09-14 --- podcast/2025-09-14.md | 82 +++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 82 insertions(+) create mode 100644 podcast/2025-09-14.md diff --git a/podcast/2025-09-14.md b/podcast/2025-09-14.md new file mode 100644 index 0000000..520f355 --- /dev/null +++ b/podcast/2025-09-14.md @@ -0,0 +1,82 @@ +# 来生小酒馆 2025/9/14 + +## Full: Podcast Formatting + +AI工具,贵的就是好的吗? +AI写的论文,该往哪儿发? +国产大模型,真的站起来了? + +三问炼心,嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。行了,闲话少说,咱们直接进入今天的情报速递。 + +先说说产品这边啊,快手,对,就是那个短视频巨头快手,旗下的视频生成工具Kling最近搞了个新活儿,发布了一个叫Avatar的功能。简单说,就是把之前的口型同步技术给全面升级了,能搞出更逼真的数字人。不过呢,这功能刚开始只给少数用户体验……嗯,老套路了,又在吊大家胃口。 + +然后,一个叫“豆包爱学”的产品,推出了个AI家教,这个有点意思。我看有用户分享啊,效果相当不错。你家孩子有难题,你拿手机拍下来,AI老师就能通过语音加画图,一步步引导孩子把题解出来,讲得那叫一个明明白白。说真的,这可比咱们小时候请的家教耐心多了,还不会发脾气,你说气不气人。 + +辅导孩子写作业是头疼,那要是AI自己开始写论文了,谁来审呢?诶,这不,西湖大学就上演了一出“用魔法打败魔法”的好戏。他们搞了个AiraXiv平台和DeepReview审稿系统。前者呢,就给AI生成的论文一个专属的归档地儿;后者更厉害,能模仿人类专家的思考方式,几分钟就给出一份高质量的审稿意见。据说性能比GPT-o1还强,这相当于给学术界请了个既懂行又高效的AI保安,专门检查AI自己人写的文章,挺有意思的。 + +看完地球上的学术圈,咱们再抬头看看宇宙。谷歌的DeepMind这次又出手了,帮人类去听宇宙的“心跳”——引力波。他们开发了一个叫Deep Loop Shaping的技术,简单说,就是用AI给那个探测引力波的LIGO设备降噪。效果怎么样呢?直接把低频段的噪声强度降低到了原来的三十分之一。这意味着LIGO能观测到的宇宙体积,一下子暴增了70%……以后什么黑洞合并之类的宇宙大瓜,咱们就能更早地捕捉到蛛丝马迹了,不错不错。 + +当然啦,AI也不是完美的。咱们总觉得它有时候会偷懒,喜欢“走捷径”而不是真正去理解问题。为了解决这个,有项新研究叫CogGuide,它就像一个“认知教练”,引导模型按照“理解-计划-选择”的流程去思考,有效抑制了模型的投机取巧。最关键的是,这方法还不用去微调模型,通用性很强,就像给AI请了个随身军师,时刻提醒它“三思而后行”,挺巧妙的。 + +AI的进步,还得靠“吃饭”,也就是数据。高质量的数据又贵又少,怎么办?有研究就想了个办法,用现在很火的文生图模型,凭空创造新的训练样本,搞起了“语义数据增强”。说白了,就是让AI自己画图给自己当教材,让自己变得更“见多识广”。还有啊,你有没有觉得AI画的图,总缺点儿质感?最新的分析说了,这是因为模型在压缩图像时,丢掉了高频信息。所以研究者就搞了个FA-VAE框架,像是给AI配上了一副“高频助听器”,让它能更好地重建图像细节,画出来的图自然就更真实了。 + +技术在进步,咱们打工人的讨论也越来越具体了。最近网上有个话题很火:AI编程助手,一个月20美元的和200美元的,到底有啥区别?讨论了一圈,答案其实挺扎心的——区别不在工具,在于用的人。对于高手来说,贵的工具是神兵利器;对于新手,可能就是个性能过剩的大家伙。所以啊,别老想着换把好枪就能成神枪手,可能问题出在……瞄准的那个人身上,对吧。这股关于AI编码的讨论热潮,甚至在Hacker News上升到了哲学层面,一边是狂热拥抱,另一边是审慎观望,本身就挺有那味儿了。 + +最后,快速看看开源社区。最让人有点小意外的,是百度最新开源的ERNIE模型,居然空降Hugging Face全球趋势榜第一。这是一款轻量级的MoE模型,有128K的长上下文,被说是Agent产品的“刚需”。连Hugging Face的CEO都亲自下场转发了,这波确实给国产大模型挣了脸。 + +除此之外呢,PowerShell这个系统管理员的“瑞士军刀”,现在已经是全平台通吃,老当益壮。还有像codebuff这种让你在终端里直接生成代码的小工具,以及simdjson这种处理JSON的“性能怪兽”,和flash-linear-attention这种给大模型“节能减负”的加速器,都在社区里非常活跃。有兴趣的朋友可以自己去GitHub上瞅瞅。 + +今天的情报就到这里,注意隐蔽,赶紧撤离。 + +--- +本期关键词: +#快手Kling +#Avatar +#豆包爱学 +#AI家教 +#AiraXiv +#DeepReview +#谷歌DeepMind +#LIGO +#百度ERNIE +#HuggingFace +#AI编码 +#MoE +#语义数据增强 +#高频信息 +#PowerShell + +## Short: Podcast Formatting + +AI写的论文,该如何审查? +AI家教,是帮手还是“绑架”? +AI工具的价值,取决于工具还是人? + +嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。咱们今天的情报有点意思,既有AI在装神弄鬼,也有AI在干正经事。 + +先说产品圈,快手旗下的Kling发布了Avatar新功能,简单说就是让数字人说话的口型和表情更逼真了,以后刷短视频,可能真分不清对面是真人还是数字人了。另一边,字节的“豆包爱学”推出的AI家教,也让不少家长眼前一亮。你把难题拍照上传,AI老师就能一步步语音带画图地给你家娃讲明白,这辅导作业的耐心,可能比亲爹亲妈强多了。 + +学术界这边更是上演了一出“用魔法打败魔法”的好戏。AI写论文不是泛滥了嘛?西湖大学直接搞了个AiraXiv平台,给AI写的论文一个专属“收容所”,还配了个叫DeepReview的AI审稿系统。据说这AI审稿员比GPT-o1还厉害,几分钟就能给出高质量意见。这是要建立学术界新秩序啊。 + +同时,谷歌DeepMind也没闲着,他们帮人类更好地“偷听”宇宙了。他们用AI技术把LIGO引力波探测器的噪音降低到了原来的三十分之一,这意味着什么?意味着我们的“顺风耳”能探测的宇宙体积,一下子暴增了70%,发现黑洞合并这种宇宙大事件的概率也更高了。 + +当然,让AI更聪明的努力从未停止。有研究给AI请了个“认知教练”CogGuide,教它别总想着走捷径;有研究让AI自己“画饼充饥”,用文生图技术创造新数据来训练自己;还有研究给AI配了个“高频助听器”,专门修复图像里丢失的细节。 + +说到AI对我们工作的影响,最近关于AI编程工具价格的讨论很有趣。一个月20美元和200美元的工具有啥区别?结论是:对高手来说,贵的是神器;对新手嘛,可能就是个方向盘焊死的性能猛兽,瓶颈还是在人。这不,百度开源的ERNIE模型,一个轻量级的MoE模型,突然就登顶了Hugging Face全球榜单,被誉为Agent产品的“刚需”,连Hugging Face的CEO都亲自转发。你看,好工具自己会说话。 + +最后快速过一下几个热门开源项目:跨平台的脚本神器PowerShell,让你在终端里就能唤出代码的codebuff,处理JSON快如闪电的simdjson,还有给大模型“节能降耗”的flash-linear-attention。有需要的程序员朋友可以自己去瞅瞅。 + +今天的情报就到这里,注意隐蔽,赶紧撤离。 + +本期关键词: +#Kling +#数字人 +#AI家教 +#AiraXiv +#DeepReview +#LIGO +#ERNIE +#AI编码 +#MoE +#HuggingFace +#PowerShell \ No newline at end of file