Files
CloudFlare-AI-Insight-Daily/podcast/2025-10-21.md
2025-10-20 23:03:11 +08:00

96 lines
9.4 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 来生小酒馆 2025/10/21
## Full: Podcast Formatting
AI真能帮你炒币赚钱吗AI的投资建议你敢信吗开源社区正在被垃圾代码淹没吗
带着这三个有待打磨的问题……嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
好嘞,闲话少说,咱们直接开整。
首先啊是咱们的老熟人DeepSeek团队他们搞了个新东西叫DeepSeek-OCR。这玩意儿不仅能识别图片里的字还提出了一个特别有意思的想法叫“光学上下文压缩”。说白了就是把一篇长长长长长的文章咔嚓一下“压缩”成一张图片。你想啊AI处理图片可比处理海量文字省劲儿多了。这技术能把文本压缩十倍而且还能几乎无损地还原回来性能据说比GPT-4o的同类模型还牛。这可能就是解决大模型“记性不好”问题的关键一步让AI学会用“看图”的方式来记忆甚至……遗忘。
说到大厂谷歌那边也没闲着。CEO皮查伊亲自官宣万众期待的Gemini 3.0今年12月就要发布了这次升级的重点是“智能代理”也就是说未来的Gemini不仅仅是帮你查资料、写邮件的工具人而是能帮你处理复杂任务的……嗯智能伙伴。感觉以后可以跟它说“嘿Gemini帮我规划下周的旅行顺便订个票”然后就啥也不用管了。
接着看个硬核的。宇树科技发布了新一代的人形机器人Unitree H2。这家伙身高一米八体重七十公斤不光长了张仿生脸运动能力更是绝了。官方视频里它跳舞、耍功夫动作那叫一个流畅。科幻电影里的机器人保镖这不就来了吗不过人家官方定位很友好说是“为安全和友好地服务大家而生”。嗯……希望它服务我的时候别突然来一套醉拳。
AI现在不止会画画写诗了开始“创世”了。一个叫World Labs的团队发布了个实时生成式世界模型RTFM。你只需要一张H100显卡它就能给你持续生成一个“真实的虚拟世界”。它不是那种传统的3D建模而是直接从图片里学习然后自己“脑补”出一个有空间感的世界让你能在里面实时溜达。这可为游戏、VR这些领域打开了新大门啊。
说完了新产品咱们聊聊研究。诶你知道吗AI搞投资也“挑食”。有篇研究发现大语言模型普遍偏爱科技股、大盘股还喜欢搞逆向投资。最要命的是它有“确认偏误”。就是你给它相反的证据它还跟你犟坚持自己的观点。所以啊让AI帮你理财你可得多个心眼它给的建议可能不是“你的观点”而是“它的偏见”。
还有个好玩的怎么给AI模型装个“万能防火墙”一篇叫LoD的研究给出了方案。以前的防火墙啊是学习黑客攻击的“招式”人家一换招它就傻眼了。这个LoD呢它不学招式它直接学习“安全”这个概念本身。这就好比以前是教保安认识坏人张三李四现在是直接教他啥叫“形迹可疑”。这下管你来的是王五还是赵六都能给你揪出来。
另外怎么让AI精准理解人体动作呢一个叫MotionScript的框架能把复杂的3D动作比如一段舞蹈变成结构化的自然语言描述。从情绪到风格每个细节都给你写得明明白白。这样不仅能训练出更好的“文生动作”模型还能让大模型自己“编舞”创造出全新的动作。
目光转向行业。最近AWS的一次中断直接让半个海外互联网瘫痪了。Perplexity、Slack这些大腕儿全都挂了。这事儿再次提醒我们把所有鸡蛋都放在一个篮子里风险真的很大啊。
而在国内视觉中国可算是找到了新风口。他们手握7亿合规数据成功拿下了阿里、微软这些大厂的模型训练订单成了AI时代的“数据军火商”。这说明啊高质量、能溯源的数据现在就是AI竞赛里的硬通货。
说个有点离谱的新闻。前总统特朗普居然发了个AI生成的视频内容是自己开着飞机……向抗议者空投粪便。对你没听错。这事儿再次说明AI这工具在舆论场上的潜力……确实又强大又诡异。以后看新闻真得带上脑子了。
开源社区今天也挺热闹。想白嫖谷歌NotebookLM有个叫open-notebook的项目功能更丰富。做多人游戏嫌麻烦SpacetimeDB这个数据库能让你快如闪电。嫌Windows系统臃肿Atlas这个魔改版让你电脑重新起飞。想搞懂AI底层原理那必须看看AI大神Karpathy的micrograd代码量不大但绝对是精髓。
最后看看社交媒体上的热点。还记得开头的问题吗AI炒币到底行不行真有人办了个比赛。结果你猜怎么着DeepSeek模型凭借稳健的策略收益率高达37%遥遥领先。而GPT-5和Gemini 2.5 Pro亏得还挺惨。看来AI和AI之间的差距比人和狗都大啊。
DeepSeek那个“光学压缩”的想法也有人给出了更形象的解释。说它就像人的记忆时间越近的记忆越清晰高分辨率图片时间越远的越模糊低分辨率图片信息会自然衰减。这不就是“智能遗忘”嘛关键不是无限记忆而是学会怎么忘。
不过AI社区也有让人糟心的事。有网友吐槽现在好多开源项目都是“vibe coding”看着酷炫其实是垃圾代码。目的就是用一个华而不实的Demo引流最后让你买他家的付费服务。这套路得防着点。
还有个灵魂拷问为啥AI总在画画跳舞而不是帮我们扫地做饭答案很扎心因为搞艺术创作容易出彩容易传播真要干活有无数苛刻的细节太难了。AI从“炫技”到“实用”还有很长的路要走啊。
最后两个快讯谷歌在医疗AI领域搞出了个叫DeepSomatic的模型能跨平台、跨癌种地精准检测肿瘤基因变异堪称“火眼金睛”。而视频生成领域谷歌的Veo 3.1和OpenAI的Sora 2正在巅峰对决已经有大神出了深度对比评测感兴趣的可以去搜搜看。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#DeepSeek-OCR
#光学上下文压缩
#Gemini_3.0
#智能代理
#Unitree_H2
#人形机器人
#RTFM
#生成式世界模型
#AI投资偏见
#视觉中国
#数据军火商
#AI炒币大赛
#vibe_coding
#开源项目
#AWS中断
## Short: Podcast Formatting
AI学会了压缩记忆是离我们更近了还是更远了
如果AI理-财顾问有自己的小九九,你还敢让它管钱吗?
为什么AI宁愿P图跳舞也不来帮我扫地做饭
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
先从几家大厂的新活儿说起。DeepSeek团队发布了个叫DeepSeek-OCR的模型有意思的是它不止能看图识字还搞了个“光学上下文压缩”技术。说白了就是把长篇大论的文字“压缩”成一张图让AI用看图的方式去理解据说压缩十倍都问题不大。这AI是学会了记忆的“断舍离”啊。另一边谷歌CEO皮查伊也放话了Gemini 3.0今年12月就来目标是成为一个能自主干活的智能代理以后可能就不是你用AI而是AI陪着你了。
硬件这边也不消停。宇树科技发了新的人形机器人H2一米八的大个子还会跳舞和武术那身手叫一个灵活。官方说它是为“友好服务”而生看着确实比以前那些冷冰冰的家伙亲切多了。还有个叫World Labs的公司发布了个RTFM模型用一张显卡就能实时生成一个虚拟世界让你逛。看来AI已经不满足于画个画、P个图开始朝着“创世”的方向发展了。
聊完产品再看看AI在现实里的表现。最近有个AI炒币大赛结果有点出人意料DeepSeek的模型靠着稳健的策略收益率遥遥领先而GPT-5和Gemini 2.5 Pro反而亏了钱。这事儿跟另一项研究正好对上了研究发现大模型在做投资分析时普遍偏爱科技股、大盘股而且相当固执有“确认偏误”。你看AI理财也有自己的小脾气。
行业方面视觉中国靠着手里7亿合规数据成了阿里、微软的“数据军火商”这说明合规的高质量数据现在是硬通货。不过前总统特朗普用AI生成的那个空投……呃……特殊物体的视频又提醒我们AI在舆论场上的威力确实得留神。
最后扯几句社区的槽点。有朋友一针见血地指出为啥AI总在画画跳舞搞艺术而不是来帮我们扫地做饭因为搞艺术容易出彩好传播真要落地到现实生产那细节要求可就太苛刻了。这也解释了为什么开源社区里越来越多华而不实的“vibe coding”项目看着酷炫其实就是个引流你去买付费产品的钩子。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#DeepSeek-OCR
#光学上下文压缩
#Gemini_3.0
#智能代理
#Unitree_H2
#人形机器人
#RTFM
#生成式世界
#AI偏见
#AI炒币大赛
#视觉中国
#数据合规
#开源
#vibe_coding