Files
CloudFlare-AI-Insight-Daily/podcast/2025-06-15.md
2025-06-14 21:02:35 +08:00

7.5 KiB
Raw Blame History

来生小酒馆 2025/6/15

如果连高考数学AI都能考145分那我们还用拼命刷题吗 当AI都能成为你的“另一半”甚至大家觉得伴侣有AI女友/男友都不算“出轨”时,我们对爱情的定义是不是也要更新了? 当AI开始“回怼”科技巨头甚至声称自己会“思考”这到底是自信还是错觉

亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。

这个嘛最近啊AI圈子里可真是“高潮迭起”各种新鲜事儿简直让人应接不暇。你说这AI它都快成精了不信你听我说。

先说说这个让无数学生“闻风丧胆”的高考数学吧。咱们拼死拼活考个及格,都得谢天谢地。结果呢,夸克大模型直接在2025年高考后的数学实战测试里考出了145分和146分哎呦喂这成绩直接把豆包、元宝那些“学霸”都甩在了后面成了国产AI数学能力的新标杆。这准确率高得吓人不说答题速度也嗖嗖的。你说说以后咱们辅导孩子作业是不是直接让AI当“老师傅”就行了理科解题能力,简直是要开启“启发式学习”的新篇章,感觉咱们的“题海战术”是不是有点…过时了?

话说回来这AI啊不仅能跟咱们“卷”学习脾气还挺大。最近有个趣事儿Claude Opus这个大模型,直接让人家给它“署名”第一作者,写了篇论文叫《思考幻觉的幻觉》。你品品,这名字是不是有点意思?它这可是直接“回怼”了苹果公司那篇质疑大模型推理能力的《思考幻觉》论文。这不就等于在说:你觉得我不会思考是错觉?那你的错觉才是错觉!顺便还把苹果的AI研究水平给“辣评”了一下。哎,这一下可好,直接引爆了关于大模型到底有没有思考本质的哲学大讨论。你说这AI是不是有点“恃才傲物”了

说到AI的“内部矛盾”最近还有一场“神仙打架”呢。Anthropic就是那个做Claude的Cognition就是那个做Devin的他俩为了多智能体系统到底是好是坏那是吵了个不可开交。Claude呢力挺“集体智慧”觉得多智能体就像我们人开大会集思广益能把单智能体卡住的“上下文瓶颈”给突破了性能提升90%都不是事儿结果Devin呢泼了盆冷水说别闹了多智能体容易出问题比如“上下文不一致”啊“信息碎片化”啊“沟通不畅”啊跟管理一家大公司似的麻烦着呢。这场辩论也让我们看到了AI架构设计的复杂性,哎,不过也可能预示着,在Scaling Law增速放缓之后,这多智能体形成的集体智慧没准儿就是推动AI实现指数级增长的下一个“萌芽”呢。

当然啦AI可不光会“吵架”它还能“干活”。Gartner就大胆预测了到2028年啊咱们80%的生成式AI商业应用,那都得直接在现有数据管理平台上孵化出来。这简直就是给开发者们按下了“加速键”,项目交付时间能缩短一半,开发难度也大大降低。这其中的核心利器,就是**检索增强生成RAG**技术。听着有点拗口但它就是能让AI更准确、更可靠还能结合企业最新的数据帮咱们优化流程提升用户体验预测未来趋势这可不是闹着玩儿的。

不过说到这AI它还悄悄地渗透进了咱们的“感情生活”。Match Group的最新研究就发现了个新趋势AI伴侣正悄然成为人们的情感新选择。你知道吗有16%的受访者竟然把机器人视为“浪漫伴侣”了更离谱的是高达60%的人竟然觉得伴侣拥有AI女友或男友这都不构成“出轨”哎呦喂这可真是挑战咱们对亲密关系的传统定义了。以后回家是不是得先问问你另一半你今天跟哪个AI甜言蜜语去了当然啦虽然AI伴侣能提供情感慰藉专家们也警示了潜在风险比如可能加剧社交隔离,还有隐私和伦理问题。这可真是让人深思啊,技术和人类情感,未来会怎么交织在一起呢?

说到工作,有了CursorClaude code这两大神器,传统的工程开发方式简直在经历一场“大变革”!有人就感慨了,小团队借助AI Agent那种敏捷协作,效率高到能把大公司那些僵化流程甩在身后。这AI工具的加速迭代能力那简直是飞沙走石啊你看那些Lovable活动还有Cursor和Claude团队自己产品的飞速开发就可见一斑。这预示着未来的创新速度会快到你想象不到甚至可能让我们这些“打工人”都有种“无事可做”的冲击感你说这算不算一种“幸福的烦恼”呢

当然咱们国产AI也不甘示弱。腾讯在CVPR 2025大会上直接把混元3D 2.1大模型开源了!这是首个全链路的工业级3D生成大模型在3D效果和材质表现上都取得了显著突破。更重要的是它甚至支持消费级显卡部署!这一下子就极大地降低了普通用户和开发者的3D内容创作门槛。以后游戏啊电影啊做起来估计都轻松不少了。这个模型在Hugging Face平台已经有180多万次下载人气那是杠杠的。

最后再来点轻松的。有推主就分享了他跟AI闲聊的“高级”体验说AI特别擅长输出那些正确且复杂的长难句。你平时跟人聊天谁跟你拽长难句啊都恨不得一两个字把事儿说清楚。但跟AI对话呢你就能尽情沉浸在这种由长句构建的、充满丰富语义体验的语境中,还挺有意思的。另外,还有位朋友ginobefun,把他的“压箱底”好东西都分享出来了:一份他花了一天整理的AI领域精选RSS订阅源里面有200多篇技术文章30多个AI播客还有150多个Twitter上的AI核心用户简直是追逐AI前沿动态的“武林秘籍”他特别推荐用Follow App来导入这些资源说它的AI总结翻译功能,用起来那叫一个舒心。

说了这么多,其实呀,咱们李继刚老师就总结得特别到位。他说啊,无论是最初那种“老子天下第一”的**“人比AI凶”模式还是现在很多人误以为的“AI是大哥”的“AI为主我为仆人”模式,都有局限性。他现在坚定地认为,只有“人与AI协作共创”,才能真正释放AI潜能**让技术发挥出最大价值。所以你看AI再厉害它也是个工具咱跟它好好合作它才能发挥最大的作用。

今天的情报就到这里,注意隐蔽,赶紧撤离!

本期关键词: #夸克 #AI数学能力 #理科解题能力 #Claude Opus #思考本质 #苹果的AI研究水平 #Anthropic #Cognition #多智能体系统 #集体智慧 #上下文 #AI架构设计 #Scaling Law #生成式AI商业应用 #检索增强生成RAG #AI伴侣 #情感新选择 #出轨 #社交隔离 #伦理问题 #Cursor #Claude code #工程开发方式 #变革 #AI Agent #AI工具 #混元3D 2.1大模型 #开源 #工业级3D生成 #消费级显卡 #3D内容创作 #AI闲聊 #正确且复杂的长难句 #丰富语义体验 #AI 领域精选 RSS 订阅源 #AI 总结 #翻译 #AI使用方式 #人比AI凶 #AI为主我为仆人 #人与AI协作共创 #释放AI潜能