Create podcast script file for 2025-10-21
This commit is contained in:
96
podcast/2025-10-21.md
Normal file
96
podcast/2025-10-21.md
Normal file
@@ -0,0 +1,96 @@
|
||||
# 来生小酒馆 2025/10/21
|
||||
|
||||
## Full: Podcast Formatting
|
||||
|
||||
AI真能帮你炒币赚钱吗?AI的投资建议,你敢信吗?开源社区正在被垃圾代码淹没吗?
|
||||
|
||||
带着这三个有待打磨的问题……嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。
|
||||
|
||||
好嘞,闲话少说,咱们直接开整。
|
||||
|
||||
首先啊,是咱们的老熟人DeepSeek团队,他们搞了个新东西,叫DeepSeek-OCR。这玩意儿不仅能识别图片里的字,还提出了一个特别有意思的想法,叫“光学上下文压缩”。说白了,就是把一篇长长长长长的文章,咔嚓一下,“压缩”成一张图片。你想啊,AI处理图片可比处理海量文字省劲儿多了。这技术能把文本压缩十倍,而且还能几乎无损地还原回来,性能据说比GPT-4o的同类模型还牛。这可能就是解决大模型“记性不好”问题的关键一步,让AI学会用“看图”的方式来记忆,甚至……遗忘。
|
||||
|
||||
说到大厂,谷歌那边也没闲着。CEO皮查伊亲自官宣,万众期待的Gemini 3.0,今年12月就要发布了!这次升级的重点是“智能代理”,也就是说,未来的Gemini不仅仅是帮你查资料、写邮件的工具人,而是能帮你处理复杂任务的……嗯,智能伙伴。感觉以后可以跟它说,“嘿Gemini,帮我规划下周的旅行,顺便订个票”,然后就啥也不用管了。
|
||||
|
||||
接着看个硬核的。宇树科技发布了新一代的人形机器人,Unitree H2。这家伙,身高一米八,体重七十公斤,不光长了张仿生脸,运动能力更是绝了。官方视频里,它跳舞、耍功夫,动作那叫一个流畅。科幻电影里的机器人保镖,这不就来了吗?不过人家官方定位很友好,说是“为安全和友好地服务大家而生”。嗯……希望它服务我的时候,别突然来一套醉拳。
|
||||
|
||||
AI现在不止会画画写诗了,开始“创世”了。一个叫World Labs的团队,发布了个实时生成式世界模型,RTFM。你只需要一张H100显卡,它就能给你持续生成一个“真实的虚拟世界”。它不是那种传统的3D建模,而是直接从图片里学习,然后自己“脑补”出一个有空间感的世界,让你能在里面实时溜达。这可为游戏、VR这些领域打开了新大门啊。
|
||||
|
||||
说完了新产品,咱们聊聊研究。诶,你知道吗,AI搞投资也“挑食”。有篇研究发现,大语言模型普遍偏爱科技股、大盘股,还喜欢搞逆向投资。最要命的是,它有“确认偏误”。就是你给它相反的证据,它还跟你犟,坚持自己的观点。所以啊,让AI帮你理财,你可得多个心眼,它给的建议,可能不是“你的观点”,而是“它的偏见”。
|
||||
|
||||
还有个好玩的,怎么给AI模型装个“万能防火墙”?一篇叫LoD的研究给出了方案。以前的防火墙啊,是学习黑客攻击的“招式”,人家一换招,它就傻眼了。这个LoD呢,它不学招式,它直接学习“安全”这个概念本身。这就好比,以前是教保安认识坏人张三李四,现在是直接教他啥叫“形迹可疑”。这下,管你来的是王五还是赵六,都能给你揪出来。
|
||||
|
||||
另外,怎么让AI精准理解人体动作呢?一个叫MotionScript的框架,能把复杂的3D动作,比如一段舞蹈,变成结构化的自然语言描述。从情绪到风格,每个细节都给你写得明明白白。这样不仅能训练出更好的“文生动作”模型,还能让大模型自己“编舞”,创造出全新的动作。
|
||||
|
||||
目光转向行业。最近AWS的一次中断,直接让半个海外互联网瘫痪了。Perplexity、Slack这些大腕儿全都挂了。这事儿再次提醒我们,把所有鸡蛋都放在一个篮子里,风险真的很大啊。
|
||||
|
||||
而在国内,视觉中国可算是找到了新风口。他们手握7亿合规数据,成功拿下了阿里、微软这些大厂的模型训练订单,成了AI时代的“数据军火商”。这说明啊,高质量、能溯源的数据,现在就是AI竞赛里的硬通货。
|
||||
|
||||
说个有点离谱的新闻。前总统特朗普,居然发了个AI生成的视频,内容是自己开着飞机……向抗议者空投粪便。对,你没听错。这事儿再次说明,AI这工具,在舆论场上的潜力……确实又强大又诡异。以后看新闻,真得带上脑子了。
|
||||
|
||||
开源社区今天也挺热闹。想白嫖谷歌NotebookLM?有个叫open-notebook的项目,功能更丰富。做多人游戏嫌麻烦?SpacetimeDB这个数据库能让你快如闪电。嫌Windows系统臃肿?Atlas这个魔改版让你电脑重新起飞。想搞懂AI底层原理?那必须看看AI大神Karpathy的micrograd,代码量不大,但绝对是精髓。
|
||||
|
||||
最后,看看社交媒体上的热点。还记得开头的问题吗?AI炒币到底行不行?嘿,真有人办了个比赛。结果你猜怎么着?DeepSeek模型凭借稳健的策略,收益率高达37%,遥遥领先。而GPT-5和Gemini 2.5 Pro亏得还挺惨。看来AI和AI之间的差距,比人和狗都大啊。
|
||||
|
||||
DeepSeek那个“光学压缩”的想法,也有人给出了更形象的解释。说它就像人的记忆,时间越近的记忆越清晰(高分辨率图片),时间越远的越模糊(低分辨率图片),信息会自然衰减。这不就是“智能遗忘”嘛!关键不是无限记忆,而是学会怎么忘。
|
||||
|
||||
不过,AI社区也有让人糟心的事。有网友吐槽,现在好多开源项目都是“vibe coding”,看着酷炫,其实是垃圾代码。目的就是用一个华而不实的Demo引流,最后让你买他家的付费服务。这套路,得防着点。
|
||||
|
||||
还有个灵魂拷问:为啥AI总在画画跳舞,而不是帮我们扫地做饭?答案很扎心:因为搞艺术创作容易出彩,容易传播;真要干活,有无数苛刻的细节,太难了。AI从“炫技”到“实用”,还有很长的路要走啊。
|
||||
|
||||
最后两个快讯,谷歌在医疗AI领域搞出了个叫DeepSomatic的模型,能跨平台、跨癌种地精准检测肿瘤基因变异,堪称“火眼金睛”。而视频生成领域,谷歌的Veo 3.1和OpenAI的Sora 2正在巅峰对决,已经有大神出了深度对比评测,感兴趣的可以去搜搜看。
|
||||
|
||||
今天的情报就到这里,注意隐蔽,赶紧撤离。
|
||||
|
||||
本期关键词:
|
||||
#DeepSeek-OCR
|
||||
#光学上下文压缩
|
||||
#Gemini_3.0
|
||||
#智能代理
|
||||
#Unitree_H2
|
||||
#人形机器人
|
||||
#RTFM
|
||||
#生成式世界模型
|
||||
#AI投资偏见
|
||||
#视觉中国
|
||||
#数据军火商
|
||||
#AI炒币大赛
|
||||
#vibe_coding
|
||||
#开源项目
|
||||
#AWS中断
|
||||
|
||||
## Short: Podcast Formatting
|
||||
|
||||
AI学会了压缩记忆,是离我们更近了,还是更远了?
|
||||
如果AI理-财顾问有自己的小九九,你还敢让它管钱吗?
|
||||
为什么AI宁愿P图跳舞,也不来帮我扫地做饭?
|
||||
|
||||
嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。
|
||||
|
||||
先从几家大厂的新活儿说起。DeepSeek团队发布了个叫DeepSeek-OCR的模型,有意思的是,它不止能看图识字,还搞了个“光学上下文压缩”技术。说白了,就是把长篇大论的文字“压缩”成一张图,让AI用看图的方式去理解,据说压缩十倍都问题不大。这AI是学会了记忆的“断舍离”啊。另一边,谷歌CEO皮查伊也放话了,Gemini 3.0今年12月就来,目标是成为一个能自主干活的智能代理,以后可能就不是你用AI,而是AI陪着你了。
|
||||
|
||||
硬件这边也不消停。宇树科技发了新的人形机器人H2,一米八的大个子,还会跳舞和武术,那身手叫一个灵活。官方说它是为“友好服务”而生,看着确实比以前那些冷冰冰的家伙亲切多了。还有个叫World Labs的公司,发布了个RTFM模型,用一张显卡就能实时生成一个虚拟世界让你逛。看来AI已经不满足于画个画、P个图,开始朝着“创世”的方向发展了。
|
||||
|
||||
聊完产品,再看看AI在现实里的表现。最近有个AI炒币大赛,结果有点出人意料,DeepSeek的模型靠着稳健的策略,收益率遥遥领先,而GPT-5和Gemini 2.5 Pro反而亏了钱。这事儿跟另一项研究正好对上了:研究发现,大模型在做投资分析时,普遍偏爱科技股、大盘股,而且相当固执,有“确认偏误”。你看,AI理财也有自己的小脾气。
|
||||
|
||||
行业方面,视觉中国靠着手里7亿合规数据,成了阿里、微软的“数据军火商”,这说明合规的高质量数据现在是硬通货。不过,前总统特朗普用AI生成的那个空投……呃……特殊物体的视频,又提醒我们,AI在舆论场上的威力,确实得留神。
|
||||
|
||||
最后扯几句社区的槽点。有朋友一针见血地指出,为啥AI总在画画跳舞搞艺术,而不是来帮我们扫地做饭?因为搞艺术容易出彩,好传播,真要落地到现实生产,那细节要求可就太苛刻了。这也解释了为什么开源社区里,越来越多华而不实的“vibe coding”项目,看着酷炫,其实就是个引流你去买付费产品的钩子。
|
||||
|
||||
今天的情报就到这里,注意隐蔽,赶紧撤离。
|
||||
|
||||
本期关键词:
|
||||
#DeepSeek-OCR
|
||||
#光学上下文压缩
|
||||
#Gemini_3.0
|
||||
#智能代理
|
||||
#Unitree_H2
|
||||
#人形机器人
|
||||
#RTFM
|
||||
#生成式世界
|
||||
#AI偏见
|
||||
#AI炒币大赛
|
||||
#视觉中国
|
||||
#数据合规
|
||||
#开源
|
||||
#vibe_coding
|
||||
Reference in New Issue
Block a user