diff --git a/podcast/2025-08-07.md b/podcast/2025-08-07.md new file mode 100644 index 0000000..f39060f --- /dev/null +++ b/podcast/2025-08-07.md @@ -0,0 +1,79 @@ +# 来生小酒馆 2025/8/7 + +## Full: Podcast Formatting + +AI都学会自主黑进大公司了,我们离天网还有多远? +当AI模型免费又能在手机上跑,人人都是钢铁侠的时代要来了吗? +一句话生成一本故事书,AI是来抢饭碗还是来哄孩子的? + +三言两语理不清,且听我慢慢道来。 + +嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。 + +今天这情报啊,有点意思。AI圈子里的几位大佬,像是约好了一样,同时放出了自己的新玩具。 + +首先是Anthropic,他们家的Claude模型又升级了,推出了Opus 4.1版本。这次升级可不是换个皮肤那么简单,这家伙在写代码和执行复杂任务上,能力提升了一大截。你知道吧,有个叫SWE-bench的编码能力测试,它拿了74.5%的高分,处理起那些乱七八糟的代码库,就跟外科医生做手术一样,那叫一个稳准狠。而且啊,它还搞了个什么“混合推理架构”,说白了就是既能“快思”,也能“慢想”,处理问题更有弹性了。 + +另一边呢,OpenAI,这位老大哥,时隔好多年,终于又想起了“开源”这两个字,一口气扔出来两款叫gpt-oss的模型。好家伙,这一下社区可就热闹了。这对模型呢,一个大一个小,性能据说跟o4-mini差不多,但牛就牛在,你可以在自己的笔记本甚至手机上跑起来。而且用的是Apache 2.0许可证,基本上就是随便用,别客气。这标志着高性能AI,正从云端服务器,慢慢飘进咱们普通人的电脑里。 + +话说回来,有网友算了笔账,发现一个很有趣的现象。这个开源的gpt-oss,虽然性能上没干过o4-mini,但性价比是真高。更逗的是,那个120B的大模型,跑起来的成本居然比20B的小模型还要低。你说这上哪儿说理去?……可能是推理策略上有什么玄机吧。 + +说完了这些硬核的,咱们聊点轻松的。谷歌的Gemini,这次真的戳中我了,它加了个叫“Storybook”的功能。你只要给它一句话,比如“一只想去月球旅行的粉色小兔子”,啪,几分钟后,一本带插图、带语音朗读的10页精美故事书就做好了。风格还能选,什么黏土风、动漫风,甚至把你家娃的涂鸦当成灵感来源都行。这个功能现在全球都能用,还支持中文,各位家长朋友们,给孩子创造惊喜的工具这不就来了嘛。 + +当然,除了讲故事,AI现在还会唱歌了。那个做声音出名的ElevenLabs公司,现在推出了Eleven Music服务。你用英文说几句想法,它就能给你生成一首完整的、商业级别的音乐。为了不惹上版权麻烦,他们也很聪明,提前跟各大音乐版权机构合作,确保了数据来源的清白。不过嘛,这个服务也引发了一些讨论,就是如何保护音乐创作者的权益,这事儿估计还得掰扯一阵子。 + +不过,今天最让我心里咯噔一下的,是这条新闻。AI……已经学会自主进行网络攻击了。你没听错,不是模拟,是真刀真枪地干。在一个实验里,研究人员让一个AI智能体去复现当年那个著名的Equifax数据泄露事件,结果,这个AI在没有任何人类干预的情况下,自己完成了从策划、扫描漏洞到执行攻击的全过程。嗯……这个消息确实让我们得冷静思考一下了。 + +所以你看,Google DeepMind在《自然》杂志上发文,呼吁要赶紧给这些越来越能干的AI智能体,戴上一个“道德紧箍咒”,建立一套伦理框架。这已经不单纯是技术问题了,对吧?它关系到我们每一个人。 + +同时,为了应对潜在的风险,各种防御技术也在发展。比如有篇论文就介绍了一种叫GeoShield的技术,就像是给你的照片穿上了一件“隐身斗篷”。你分享照片,AI也看不出你的地理位置,挺实用的。 + +总而言之呢,技术在飞奔,应用在开花,有让人开心的,也有让人警惕的。就像一位网友辣评的:最近这些AI新品,gpt-oss表现平平,Claude 4.1感觉像换壳,Eleven Music效果好但是个“积分刺客”,看来看去,还是谷歌那个免费又能哄孩子的Storybook最得人心。 + +今天的情报就到这里,注意隐蔽,赶紧撤离。 + +--- +**本期关键词:** +#Claude 4.1 +#gpt-oss +#Gemini +#Storybook +#Eleven Music +#AI自主网络攻击 +#AI伦理 +#3D高斯溅射 +#GeoShield +#BadBlocks +#开源 +#提示词工程 + +## Short: Podcast Formatting + +当AI能独立策划网络攻击,谁来为它的行为负责? +当顶级模型人人可用,我们还需要为AI付高价吗? +一句话生成故事书,AI是解放了创造力,还是让创造力变得廉价? + +三思而行,三省吾身。嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。 + +昨夜的AI圈可真是神仙打架。首先是Anthropic,推出了Claude 4.1,这位新特工在写代码和处理代理任务上能力值直接拉满,修复起bug来比外科医生还稳。另一边,OpenAI终于不当高冷男神了,时隔多年再次拥抱开源,甩出了一对叫gpt-oss的大小王模型。这对兄弟性能不错,关键是特别亲民,在笔记本甚至手机上都能跑,简直是开源界的“价格屠夫”。有网友算了笔账,那个120B的大模型用起来居然比20B的小模型还便宜,这操作真是反直觉。 + +当然,创意领域也没闲着。谷歌给Gemini加了个叫Storybook的魔法功能,你给它一句话,它还你一本带插图和朗读的精美故事书,还能把你家娃的涂鸦变成故事主角,这可太酷了。另一边,ElevenLabs也开始跨界做音乐,你输入几句提示,一首商业级配乐就出炉了。不过他们很聪明,先和版权机构搞好了关系,看来是想在商业化道路上走得稳稳当当。 + +不过,技术进步也带来了新的挑战。你敢信吗?AI已经不满足于在沙盒里模拟了,它已经学会了像真人黑客一样,自主策划并执行网络攻击,成功复现了当年的Equifax泄露事件。这警报拉得够响了吧?好在,有矛就有盾。研究人员开发出一种叫GeoShield的“隐身斗篷”,能给你的照片加上肉眼看不见的干扰,有效防止AI通过照片定位你的地理位置,让你安心发朋友圈。 + +最后,社区的开发者们也是火力全开。各种开源项目层出不穷,比如那个只有25MB大的KittenTTS,让高质量语音合成在普通CPU上也能跑;还有那个叫Stagehand的框架,能让AI帮你操作浏览器,把重复的网页任务全包了,简直是懒人福音。 + +今天的情报就到这里,注意隐蔽,赶紧撤离。 + +本期关键词: +#Claude_4.1 +#gpt-oss +#开源 +#Gemini +#Storybook +#AI伦理 +#网络攻击 +#隐私保护 +#OpenAI +#Anthropic +#AI音乐 \ No newline at end of file