Files
CloudFlare-AI-Insight-Daily/podcast/2025-08-13.md
2025-08-13 00:15:18 +08:00

112 lines
8.4 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 来生小酒馆 2025/8/13
## Full: Podcast Formatting
代码人的精神家园,也要姓“微”了吗?
你的AI助手有了记性是更贴心还是更瘆人
当AI学会思考物理世界离“武器化智能”还有多远
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
好,咱们废话不多说,直接来看今天有什么新鲜事。
首先Vercel旗下的V0平台这哥们儿可不得了一夜之间从一个只会画画前端界面的“美工”进化成了能搞定后端、数据库、甚至连营销文案都包了的全栈架构师。简单说你跟它用大白话许个愿它就能还你一个完整的App……这标准内卷都卷不到这个高度啊。
说到AI助手你是不是也烦了每次都得跟它重复一遍“咱俩上次聊到哪儿了”好消息Claude现在有记忆了它能引用历史对话你再也不用跟个金鱼聊天了。这感觉……嗯就像你的搭档终于把你放在心上了挺好。
另一边本地模型也杀出个黑马叫Jan-v1。别看它只有4B参数跑在你自己电脑上准确率居然比云端的Perplexity Pro还高一点。这说明什么小家伙也有大能量以后在自己电脑上搞深度研究方便多咯。
还有个好玩的MiniMax搞了个叫“Agent Remix Marketplace”的平台。怎么说呢就跟你玩DJ打碟一样你可以把别人成熟的AI智能体拿过来混音、再创作变成你自己的新东西。原作者还能分到钱官方还扔了15万美金的奖池……这是鼓励大家一起“蹦迪”共创繁荣啊。
接下来看看前沿研究,这块儿就有点硬核了,我尽量说得好懂点。
怎么让AI读几百页的报告不把自己绕晕有篇论文叫DocR1教AI像人一样先翻到可能有关的那几页再细看。诶这不就是咱们考试找答案的套路嘛AI也学会了。
想把你的猫P到梵高的画里以前得重新训练个大模型费时费力。现在有个叫CoAR的技术能在不改变大模型的前提下只动一丁点儿参数就把新概念“注入”进去。就像给你的AI换了支新画笔还不用送它回美院重修。
还有个叫FlashRL的技术简单说就是给强化学习训练按下了快进键。它用了一种叫“8位量化”的压缩技术让原来跑马拉松一样的训练过程变成了百米冲刺。
说到这就不能不提英伟达NVIDIA了。他们发布了一个叫Cosmos Reason的物理AI模型。这玩意儿可不只是能“看”它能让机器人和自动驾驶汽车真正地在物理世界里“推理”和“行动”。这个大脑升级包……分量很足啊。
聊完技术,咱们看看行业和社会。
开发者社区最近有个大新闻GitHub的CEO辞职了而且GitHub不再独立运营被整个并入微软新成立的AI部门。这……怎么说呢一个时代结束了。以后GitHub可能更多是为微软的AI战略服务而不是那个纯粹的开源社区了。老铁们心里估计五味杂陈。
安全方面ChatGPT爆出了一个“零点击攻击”漏洞。啥意思呢就是黑客可以把恶意指令藏在一个文档里比如一张看起来无害的图片链接你点开你的ChatGPT可能就在你不知情的情况下把API密钥这种敏感数据给泄露了。所以啊再智能的助手也得常做安全检查。
当然,也有暖心的应用。科学家们把一台四足机器人伪装成藏羚羊,送进了可可西里。这只“机器羊”成功混入羊群,在不打扰它们的情况下,进行了近距离的观察和研究。你看,技术用在对的地方,就是这么酷。
不过硬币总有另一面。阿里的Wan 2.2模型据说被一些用户拿去结合LoRAs技术生成一些……嗯你懂的不太适合在办公室打开的视频内容。这也再次提醒我们AI的能力越大关于伦理和监管的讨论就越复杂。
同样让人担忧的是“武器化智能”。最近Reddit上有个网络研讨会专门讨论军事AI带来的威胁。当AI能理解并操作物理世界这个话题就变得非常现实和紧迫了。强大的力量必须配上同样强大的责任感对吧。
最后快速过一下几个有意思的开源项目:
* **umami**:一个不收集你隐私的网站分析工具,谷歌分析的清流替代品。
* **ubicloud**想自己搞个云这是个AWS的开源替代方案把控制权还给你。
* **POML**微软出的可以像写HTML一样结构化地写Prompt让你的指令更清晰。
* **abogen**能把电子书、PDF变成有声读物还带字幕通勤路上听论文不是梦。
* **Embedding Atlas**苹果出品能把复杂的高维数据可视化让你看懂AI到底在想啥。
社媒上也有几个热点有人提出一个理论说为啥不同的大模型会想到一块去用些奇怪又相似的比喻可能因为它们的底层数学结构就像给它们挖好了几条“收敛通道”大家最后都会走到相似的地方。还挺有意思的。还有人做了个AI术语发音指南免得你下次把“LLaMA”念成“拉玛”那就尴尬了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#V0
#Claude
#GitHub
#NVIDIA
#物理AI
#零点击攻击
#机器藏羚羊
#Jan-v1
#MiniMax
#DocR1
#CoAR
#FlashRL
#Wan2.2
#武器化智能
#开源
#umami
#ubicloud
#POML
#abogen
#EmbeddingAtlas
## Short: Podcast Formatting
开发者圣地GitHub真的要变成微软的AI后花园了吗
AI被用于军事会是守护神还是潘多拉魔盒
只要一句话AI就能给你写个App这效率你跟得上吗
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。话不多说我们直接进入正题。
首先是产品圈Vercel旗下的V0平台来了个大变身前一秒还是个前端小能手睡一觉起来就成了全栈架构师。你只要动动嘴它就能把后端、数据库甚至营销文案都给你安排得明明白白。而MiniMax则推出了一个Agent Remix市场让AI创作跟DJ打碟一样你可以“混音”别人的AI智能体原作者还能赚到钱官方还准备了15万美元的奖池就怕你的创意不来。
另外你的AI朋友终于不再是金鱼记忆了Claude新增了记忆功能可以引用历史对话再也不用一遍遍地跟它解释“我们上次聊到哪了”。本地模型也杀出个黑马Jan-v1个头不大性能却在某些测试上悄悄超过了云端的Perplexity Pro看来小家伙也能有大能量。
科研方面NVIDIA发布了物理AI模型NVIDIA Cosmos Reason让机器人不光能“看”还能在物理世界里“推理”和“行动”这算是给机器人来了一次重要的大脑升级。还有篇论文叫CoAR实现了只用不到0.05%的参数就能把新概念注入现有模型以后P个图可能真不用再麻烦设计师了。
行业这边有个大消息全球最大的代码社区GitHub正式告别独立运营被并入微软新成立的AI部门CEO也宣布辞职。这标志着一个时代的结束未来GitHub的重心可能会更多地为微软的AI战略服务。
安全方面ChatGPT爆出了个“零点击攻击”漏洞攻击者能把恶意提示藏在文档里在你不知情的情况下偷走API密钥等敏感数据看来再智能的AI也得定期“体检”啊。与此同时军事化AI的伦理问题也引发了担忧相关的网络研讨会已经在召集专家探讨如何给这股强大的力量套上缰绳。
最后看两个有意思的应用。科学家们派出了一个“卧底”——伪装成藏羚羊的四足机器人成功混入羊群内部进行近距离观察。这下好了以后动物开会都得先检查有没有带充电宝的了。另一个是阿里巴巴的Wan 2.2模型在某些社群被用来生成NSFW内容再次提醒我们AI工具的强大潜力和伦理边界永远是相伴相生的话题。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#V0
#Claude
#Jan-v1
#GitHub
#微软AI
#零点击攻击
#物理AI
#NVIDIA
#机器藏羚羊
#MiniMax
#AgentRemix
#军事化AI