CloudFlare-AI-Insight-Daily/podcast/2025-10-21.md

# 来生小酒馆 2025/10/21

## Full: Podcast Formatting

AI真能帮你炒币赚钱吗？AI的投资建议，你敢信吗？开源社区正在被垃圾代码淹没吗？

带着这三个有待打磨的问题……嘿，亲爱的V，欢迎收听新一期的来生情报站，我是你们的老朋友，何夕2077。

好嘞，闲话少说，咱们直接开整。

首先啊，是咱们的老熟人DeepSeek团队，他们搞了个新东西，叫DeepSeek-OCR。这玩意儿不仅能识别图片里的字，还提出了一个特别有意思的想法，叫“光学上下文压缩”。说白了，就是把一篇长长长长长的文章，咔嚓一下，“压缩”成一张图片。你想啊，AI处理图片可比处理海量文字省劲儿多了。这技术能把文本压缩十倍，而且还能几乎无损地还原回来，性能据说比GPT-4o的同类模型还牛。这可能就是解决大模型“记性不好”问题的关键一步，让AI学会用“看图”的方式来记忆，甚至……遗忘。

说到大厂，谷歌那边也没闲着。CEO皮查伊亲自官宣，万众期待的Gemini 3.0，今年12月就要发布了！这次升级的重点是“智能代理”，也就是说，未来的Gemini不仅仅是帮你查资料、写邮件的工具人，而是能帮你处理复杂任务的……嗯，智能伙伴。感觉以后可以跟它说，“嘿Gemini，帮我规划下周的旅行，顺便订个票”，然后就啥也不用管了。

接着看个硬核的。宇树科技发布了新一代的人形机器人，Unitree H2。这家伙，身高一米八，体重七十公斤，不光长了张仿生脸，运动能力更是绝了。官方视频里，它跳舞、耍功夫，动作那叫一个流畅。科幻电影里的机器人保镖，这不就来了吗？不过人家官方定位很友好，说是“为安全和友好地服务大家而生”。嗯……希望它服务我的时候，别突然来一套醉拳。

AI现在不止会画画写诗了，开始“创世”了。一个叫World Labs的团队，发布了个实时生成式世界模型，RTFM。你只需要一张H100显卡，它就能给你持续生成一个“真实的虚拟世界”。它不是那种传统的3D建模，而是直接从图片里学习，然后自己“脑补”出一个有空间感的世界，让你能在里面实时溜达。这可为游戏、VR这些领域打开了新大门啊。

说完了新产品，咱们聊聊研究。诶，你知道吗，AI搞投资也“挑食”。有篇研究发现，大语言模型普遍偏爱科技股、大盘股，还喜欢搞逆向投资。最要命的是，它有“确认偏误”。就是你给它相反的证据，它还跟你犟，坚持自己的观点。所以啊，让AI帮你理财，你可得多个心眼，它给的建议，可能不是“你的观点”，而是“它的偏见”。

还有个好玩的，怎么给AI模型装个“万能防火墙”？一篇叫LoD的研究给出了方案。以前的防火墙啊，是学习黑客攻击的“招式”，人家一换招，它就傻眼了。这个LoD呢，它不学招式，它直接学习“安全”这个概念本身。这就好比，以前是教保安认识坏人张三李四，现在是直接教他啥叫“形迹可疑”。这下，管你来的是王五还是赵六，都能给你揪出来。

另外，怎么让AI精准理解人体动作呢？一个叫MotionScript的框架，能把复杂的3D动作，比如一段舞蹈，变成结构化的自然语言描述。从情绪到风格，每个细节都给你写得明明白白。这样不仅能训练出更好的“文生动作”模型，还能让大模型自己“编舞”，创造出全新的动作。

目光转向行业。最近AWS的一次中断，直接让半个海外互联网瘫痪了。Perplexity、Slack这些大腕儿全都挂了。这事儿再次提醒我们，把所有鸡蛋都放在一个篮子里，风险真的很大啊。

而在国内，视觉中国可算是找到了新风口。他们手握7亿合规数据，成功拿下了阿里、微软这些大厂的模型训练订单，成了AI时代的“数据军火商”。这说明啊，高质量、能溯源的数据，现在就是AI竞赛里的硬通货。

说个有点离谱的新闻。前总统特朗普，居然发了个AI生成的视频，内容是自己开着飞机……向抗议者空投粪便。对，你没听错。这事儿再次说明，AI这工具，在舆论场上的潜力……确实又强大又诡异。以后看新闻，真得带上脑子了。

开源社区今天也挺热闹。想白嫖谷歌NotebookLM？有个叫open-notebook的项目，功能更丰富。做多人游戏嫌麻烦？SpacetimeDB这个数据库能让你快如闪电。嫌Windows系统臃肿？Atlas这个魔改版让你电脑重新起飞。想搞懂AI底层原理？那必须看看AI大神Karpathy的micrograd，代码量不大，但绝对是精髓。

最后，看看社交媒体上的热点。还记得开头的问题吗？AI炒币到底行不行？嘿，真有人办了个比赛。结果你猜怎么着？DeepSeek模型凭借稳健的策略，收益率高达37%，遥遥领先。而GPT-5和Gemini 2.5 Pro亏得还挺惨。看来AI和AI之间的差距，比人和狗都大啊。

DeepSeek那个“光学压缩”的想法，也有人给出了更形象的解释。说它就像人的记忆，时间越近的记忆越清晰（高分辨率图片），时间越远的越模糊（低分辨率图片），信息会自然衰减。这不就是“智能遗忘”嘛！关键不是无限记忆，而是学会怎么忘。

不过，AI社区也有让人糟心的事。有网友吐槽，现在好多开源项目都是“vibe coding”，看着酷炫，其实是垃圾代码。目的就是用一个华而不实的Demo引流，最后让你买他家的付费服务。这套路，得防着点。

还有个灵魂拷问：为啥AI总在画画跳舞，而不是帮我们扫地做饭？答案很扎心：因为搞艺术创作容易出彩，容易传播；真要干活，有无数苛刻的细节，太难了。AI从“炫技”到“实用”，还有很长的路要走啊。

最后两个快讯，谷歌在医疗AI领域搞出了个叫DeepSomatic的模型，能跨平台、跨癌种地精准检测肿瘤基因变异，堪称“火眼金睛”。而视频生成领域，谷歌的Veo 3.1和OpenAI的Sora 2正在巅峰对决，已经有大神出了深度对比评测，感兴趣的可以去搜搜看。

今天的情报就到这里，注意隐蔽，赶紧撤离。

本期关键词:
#DeepSeek-OCR
#光学上下文压缩
#Gemini_3.0
#智能代理
#Unitree_H2
#人形机器人
#RTFM
#生成式世界模型
#AI投资偏见
#视觉中国
#数据军火商
#AI炒币大赛
#vibe_coding
#开源项目
#AWS中断

## Short: Podcast Formatting

AI学会了压缩记忆，是离我们更近了，还是更远了？
如果AI理-财顾问有自己的小九九，你还敢让它管钱吗？
为什么AI宁愿P图跳舞，也不来帮我扫地做饭？

嘿，亲爱的V，欢迎收听新一期的来生情报站，我是你们的老朋友，何夕2077。

先从几家大厂的新活儿说起。DeepSeek团队发布了个叫DeepSeek-OCR的模型，有意思的是，它不止能看图识字，还搞了个“光学上下文压缩”技术。说白了，就是把长篇大论的文字“压缩”成一张图，让AI用看图的方式去理解，据说压缩十倍都问题不大。这AI是学会了记忆的“断舍离”啊。另一边，谷歌CEO皮查伊也放话了，Gemini 3.0今年12月就来，目标是成为一个能自主干活的智能代理，以后可能就不是你用AI，而是AI陪着你了。

硬件这边也不消停。宇树科技发了新的人形机器人H2，一米八的大个子，还会跳舞和武术，那身手叫一个灵活。官方说它是为“友好服务”而生，看着确实比以前那些冷冰冰的家伙亲切多了。还有个叫World Labs的公司，发布了个RTFM模型，用一张显卡就能实时生成一个虚拟世界让你逛。看来AI已经不满足于画个画、P个图，开始朝着“创世”的方向发展了。

聊完产品，再看看AI在现实里的表现。最近有个AI炒币大赛，结果有点出人意料，DeepSeek的模型靠着稳健的策略，收益率遥遥领先，而GPT-5和Gemini 2.5 Pro反而亏了钱。这事儿跟另一项研究正好对上了：研究发现，大模型在做投资分析时，普遍偏爱科技股、大盘股，而且相当固执，有“确认偏误”。你看，AI理财也有自己的小脾气。

行业方面，视觉中国靠着手里7亿合规数据，成了阿里、微软的“数据军火商”，这说明合规的高质量数据现在是硬通货。不过，前总统特朗普用AI生成的那个空投……呃……特殊物体的视频，又提醒我们，AI在舆论场上的威力，确实得留神。

最后扯几句社区的槽点。有朋友一针见血地指出，为啥AI总在画画跳舞搞艺术，而不是来帮我们扫地做饭？因为搞艺术容易出彩，好传播，真要落地到现实生产，那细节要求可就太苛刻了。这也解释了为什么开源社区里，越来越多华而不实的“vibe coding”项目，看着酷炫，其实就是个引流你去买付费产品的钩子。

今天的情报就到这里，注意隐蔽，赶紧撤离。

本期关键词:
#DeepSeek-OCR
#光学上下文压缩
#Gemini_3.0
#智能代理
#Unitree_H2
#人形机器人
#RTFM
#生成式世界
#AI偏见
#AI炒币大赛
#视觉中国
#数据合规
#开源
#vibe_coding