来生小酒馆 2025/6/15

如果连高考数学AI都能考145分，那我们还用拼命刷题吗？当AI都能成为你的“另一半”，甚至大家觉得伴侣有AI女友/男友都不算“出轨”时，我们对爱情的定义是不是也要更新了？当AI开始“回怼”科技巨头，甚至声称自己会“思考”，这到底是自信还是错觉？

嘿，亲爱的V，欢迎收听新一期的来生情报站，我是你们的老朋友，何夕2077。

这个嘛，最近啊，AI圈子里可真是“高潮迭起”，各种新鲜事儿，简直让人应接不暇。你说这AI，它都快成精了，不信你听我说。

先说说这个让无数学生“闻风丧胆”的高考数学吧。咱们拼死拼活考个及格，都得谢天谢地。结果呢，夸克大模型直接在2025年高考后的数学实战测试里，考出了145分和146分！哎呦喂，这成绩，直接把豆包、元宝那些“学霸”都甩在了后面，成了国产AI数学能力的新标杆。这准确率高得吓人不说，答题速度也嗖嗖的。你说说，以后咱们辅导孩子作业，是不是直接让AI当“老师傅”就行了？这理科解题能力，简直是要开启“启发式学习”的新篇章，感觉咱们的“题海战术”是不是有点…过时了？

话说回来，这AI啊，不仅能跟咱们“卷”学习，脾气还挺大。最近有个趣事儿，Claude Opus这个大模型，直接让人家给它“署名”第一作者，写了篇论文叫《思考幻觉的幻觉》。你品品，这名字是不是有点意思？它这可是直接“回怼”了苹果公司那篇质疑大模型推理能力的《思考幻觉》论文。这不就等于在说：你觉得我不会思考是错觉？那你的错觉才是错觉！顺便还把苹果的AI研究水平给“辣评”了一下。哎，这一下可好，直接引爆了关于大模型到底有没有思考本质的哲学大讨论。你说这AI，是不是有点“恃才傲物”了？

说到AI的“内部矛盾”，最近还有一场“神仙打架”呢。Anthropic，就是那个做Claude的，跟Cognition，就是那个做Devin的，他俩为了多智能体系统到底是好是坏，那是吵了个不可开交。Claude呢，力挺“集体智慧”，觉得多智能体就像我们人开大会，集思广益，能把单智能体卡住的“上下文瓶颈”给突破了，性能提升90%都不是事儿！结果Devin呢，泼了盆冷水，说别闹了，多智能体容易出问题，比如“上下文不一致”啊，“信息碎片化”啊，“沟通不畅”啊，跟管理一家大公司似的，麻烦着呢。这场辩论，也让我们看到了AI架构设计的复杂性，哎，不过也可能预示着，在Scaling Law增速放缓之后，这多智能体形成的集体智慧，没准儿就是推动AI实现指数级增长的下一个“萌芽”呢。

当然啦，AI可不光会“吵架”，它还能“干活”。Gartner就大胆预测了，到2028年啊，咱们80%的生成式AI商业应用，那都得直接在现有数据管理平台上孵化出来。这简直就是给开发者们按下了“加速键”，项目交付时间能缩短一半，开发难度也大大降低。这其中的核心利器，就是**检索增强生成（RAG）**技术。听着有点拗口，但它就是能让AI更准确、更可靠，还能结合企业最新的数据，帮咱们优化流程，提升用户体验，预测未来趋势，这可不是闹着玩儿的。

不过，说到这AI，它还悄悄地，嗯，渗透进了咱们的“感情生活”。Match Group的最新研究就发现了个新趋势：AI伴侣正悄然成为人们的情感新选择。你知道吗，有16%的受访者，竟然把机器人视为“浪漫伴侣”了！更离谱的是，高达60%的人，竟然觉得伴侣拥有AI女友或男友，这都不构成“出轨”！哎呦喂，这可真是挑战咱们对亲密关系的传统定义了。以后回家，是不是得先问问你另一半：你今天跟哪个AI甜言蜜语去了？当然啦，虽然AI伴侣能提供情感慰藉，专家们也警示了潜在风险，比如可能加剧社交隔离，还有隐私和伦理问题。这可真是让人深思啊，技术和人类情感，未来会怎么交织在一起呢？

说到工作，有了Cursor和Claude code这两大神器，传统的工程开发方式简直在经历一场“大变革”！有人就感慨了，小团队借助AI Agent那种敏捷协作，效率高到能把大公司那些僵化流程甩在身后。这AI工具的加速迭代能力，那简直是飞沙走石啊，你看那些Lovable活动，还有Cursor和Claude团队自己产品的飞速开发，就可见一斑。这预示着未来的创新速度会快到你想象不到，甚至可能，哎，让我们这些“打工人”都有种“无事可做”的冲击感，你说这算不算一种“幸福的烦恼”呢？

当然，咱们国产AI也不甘示弱。腾讯在CVPR 2025大会上，直接把混元3D 2.1大模型给开源了！这是首个全链路的工业级3D生成大模型，在3D效果和材质表现上都取得了显著突破。更重要的是，它甚至支持消费级显卡部署！这一下子就极大地降低了普通用户和开发者的3D内容创作门槛。以后游戏啊，电影啊，做起来估计都轻松不少了。这个模型在Hugging Face平台已经有180多万次下载，人气那是杠杠的。

最后再来点轻松的。有推主就分享了他跟AI闲聊的“高级”体验，说AI特别擅长输出那些正确且复杂的长难句。你平时跟人聊天，谁跟你拽长难句啊，都恨不得一两个字把事儿说清楚。但跟AI对话呢，你就能尽情沉浸在这种由长句构建的、充满丰富语义体验的语境中，还挺有意思的。另外，还有位朋友ginobefun，把他的“压箱底”好东西都分享出来了：一份他花了一天整理的AI领域精选RSS订阅源，里面有200多篇技术文章，30多个AI播客，还有150多个Twitter上的AI核心用户，简直是追逐AI前沿动态的“武林秘籍”！他特别推荐用Follow App来导入这些资源，说它的AI总结、翻译功能，用起来那叫一个舒心。

说了这么多，其实呀，咱们李继刚老师就总结得特别到位。他说啊，无论是最初那种“老子天下第一”的**“人比AI凶”模式，还是现在很多人误以为的“AI是大哥”的“AI为主，我为仆人”模式，都有局限性。他现在坚定地认为，只有“人与AI协作共创”，才能真正释放AI潜能**，让技术发挥出最大价值。所以你看，AI再厉害，它也是个工具，咱跟它好好合作，它才能发挥最大的作用。

今天的情报就到这里，注意隐蔽，赶紧撤离！

本期关键词: #夸克 #AI数学能力 #理科解题能力 #Claude Opus #思考本质 #苹果的AI研究水平 #Anthropic #Cognition #多智能体系统 #集体智慧 #上下文 #AI架构设计 #Scaling Law #生成式AI商业应用 #检索增强生成（RAG） #AI伴侣 #情感新选择 #出轨 #社交隔离 #伦理问题 #Cursor #Claude code #工程开发方式 #变革 #AI Agent #AI工具 #混元3D 2.1大模型 #开源 #工业级3D生成 #消费级显卡 #3D内容创作 #AI闲聊 #正确且复杂的长难句 #丰富语义体验 #AI 领域精选 RSS 订阅源 #AI 总结 #翻译 #AI使用方式 #人比AI凶 #AI为主，我为仆人 #人与AI协作共创 #释放AI潜能

7.5 KiB Raw Blame History Unescape Escape

来生小酒馆 2025/6/15

7.5 KiB

Raw Blame History