Files
CloudFlare-AI-Insight-Daily/podcast/2025-08-07.md
2025-08-06 23:51:02 +08:00

79 lines
6.9 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 来生小酒馆 2025/8/7
## Full: Podcast Formatting
AI都学会自主黑进大公司了我们离天网还有多远
当AI模型免费又能在手机上跑人人都是钢铁侠的时代要来了吗
一句话生成一本故事书AI是来抢饭碗还是来哄孩子的
三言两语理不清,且听我慢慢道来。
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
今天这情报啊有点意思。AI圈子里的几位大佬像是约好了一样同时放出了自己的新玩具。
首先是Anthropic他们家的Claude模型又升级了推出了Opus 4.1版本。这次升级可不是换个皮肤那么简单这家伙在写代码和执行复杂任务上能力提升了一大截。你知道吧有个叫SWE-bench的编码能力测试它拿了74.5%的高分,处理起那些乱七八糟的代码库,就跟外科医生做手术一样,那叫一个稳准狠。而且啊,它还搞了个什么“混合推理架构”,说白了就是既能“快思”,也能“慢想”,处理问题更有弹性了。
另一边呢OpenAI这位老大哥时隔好多年终于又想起了“开源”这两个字一口气扔出来两款叫gpt-oss的模型。好家伙这一下社区可就热闹了。这对模型呢一个大一个小性能据说跟o4-mini差不多但牛就牛在你可以在自己的笔记本甚至手机上跑起来。而且用的是Apache 2.0许可证基本上就是随便用别客气。这标志着高性能AI正从云端服务器慢慢飘进咱们普通人的电脑里。
话说回来有网友算了笔账发现一个很有趣的现象。这个开源的gpt-oss虽然性能上没干过o4-mini但性价比是真高。更逗的是那个120B的大模型跑起来的成本居然比20B的小模型还要低。你说这上哪儿说理去……可能是推理策略上有什么玄机吧。
说完了这些硬核的咱们聊点轻松的。谷歌的Gemini这次真的戳中我了它加了个叫“Storybook”的功能。你只要给它一句话比如“一只想去月球旅行的粉色小兔子”几分钟后一本带插图、带语音朗读的10页精美故事书就做好了。风格还能选什么黏土风、动漫风甚至把你家娃的涂鸦当成灵感来源都行。这个功能现在全球都能用还支持中文各位家长朋友们给孩子创造惊喜的工具这不就来了嘛。
当然除了讲故事AI现在还会唱歌了。那个做声音出名的ElevenLabs公司现在推出了Eleven Music服务。你用英文说几句想法它就能给你生成一首完整的、商业级别的音乐。为了不惹上版权麻烦他们也很聪明提前跟各大音乐版权机构合作确保了数据来源的清白。不过嘛这个服务也引发了一些讨论就是如何保护音乐创作者的权益这事儿估计还得掰扯一阵子。
不过今天最让我心里咯噔一下的是这条新闻。AI……已经学会自主进行网络攻击了。你没听错不是模拟是真刀真枪地干。在一个实验里研究人员让一个AI智能体去复现当年那个著名的Equifax数据泄露事件结果这个AI在没有任何人类干预的情况下自己完成了从策划、扫描漏洞到执行攻击的全过程。嗯……这个消息确实让我们得冷静思考一下了。
所以你看Google DeepMind在《自然》杂志上发文呼吁要赶紧给这些越来越能干的AI智能体戴上一个“道德紧箍咒”建立一套伦理框架。这已经不单纯是技术问题了对吧它关系到我们每一个人。
同时为了应对潜在的风险各种防御技术也在发展。比如有篇论文就介绍了一种叫GeoShield的技术就像是给你的照片穿上了一件“隐身斗篷”。你分享照片AI也看不出你的地理位置挺实用的。
总而言之呢技术在飞奔应用在开花有让人开心的也有让人警惕的。就像一位网友辣评的最近这些AI新品gpt-oss表现平平Claude 4.1感觉像换壳Eleven Music效果好但是个“积分刺客”看来看去还是谷歌那个免费又能哄孩子的Storybook最得人心。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#Claude 4.1
#gpt-oss
#Gemini
#Storybook
#Eleven Music
#AI自主网络攻击
#AI伦理
#3D高斯溅射
#GeoShield
#BadBlocks
#开源
#提示词工程
## Short: Podcast Formatting
当AI能独立策划网络攻击谁来为它的行为负责
当顶级模型人人可用我们还需要为AI付高价吗
一句话生成故事书AI是解放了创造力还是让创造力变得廉价
三思而行三省吾身。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
昨夜的AI圈可真是神仙打架。首先是Anthropic推出了Claude 4.1这位新特工在写代码和处理代理任务上能力值直接拉满修复起bug来比外科医生还稳。另一边OpenAI终于不当高冷男神了时隔多年再次拥抱开源甩出了一对叫gpt-oss的大小王模型。这对兄弟性能不错关键是特别亲民在笔记本甚至手机上都能跑简直是开源界的“价格屠夫”。有网友算了笔账那个120B的大模型用起来居然比20B的小模型还便宜这操作真是反直觉。
当然创意领域也没闲着。谷歌给Gemini加了个叫Storybook的魔法功能你给它一句话它还你一本带插图和朗读的精美故事书还能把你家娃的涂鸦变成故事主角这可太酷了。另一边ElevenLabs也开始跨界做音乐你输入几句提示一首商业级配乐就出炉了。不过他们很聪明先和版权机构搞好了关系看来是想在商业化道路上走得稳稳当当。
不过技术进步也带来了新的挑战。你敢信吗AI已经不满足于在沙盒里模拟了它已经学会了像真人黑客一样自主策划并执行网络攻击成功复现了当年的Equifax泄露事件。这警报拉得够响了吧好在有矛就有盾。研究人员开发出一种叫GeoShield的“隐身斗篷”能给你的照片加上肉眼看不见的干扰有效防止AI通过照片定位你的地理位置让你安心发朋友圈。
最后社区的开发者们也是火力全开。各种开源项目层出不穷比如那个只有25MB大的KittenTTS让高质量语音合成在普通CPU上也能跑还有那个叫Stagehand的框架能让AI帮你操作浏览器把重复的网页任务全包了简直是懒人福音。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#Claude_4.1
#gpt-oss
#开源
#Gemini
#Storybook
#AI伦理
#网络攻击
#隐私保护
#OpenAI
#Anthropic
#AI音乐