7.5 KiB
来生小酒馆 2025/6/15
如果连高考数学AI都能考145分,那我们还用拼命刷题吗? 当AI都能成为你的“另一半”,甚至大家觉得伴侣有AI女友/男友都不算“出轨”时,我们对爱情的定义是不是也要更新了? 当AI开始“回怼”科技巨头,甚至声称自己会“思考”,这到底是自信还是错觉?
嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。
这个嘛,最近啊,AI圈子里可真是“高潮迭起”,各种新鲜事儿,简直让人应接不暇。你说这AI,它都快成精了,不信你听我说。
先说说这个让无数学生“闻风丧胆”的高考数学吧。咱们拼死拼活考个及格,都得谢天谢地。结果呢,夸克大模型直接在2025年高考后的数学实战测试里,考出了145分和146分!哎呦喂,这成绩,直接把豆包、元宝那些“学霸”都甩在了后面,成了国产AI数学能力的新标杆。这准确率高得吓人不说,答题速度也嗖嗖的。你说说,以后咱们辅导孩子作业,是不是直接让AI当“老师傅”就行了?这理科解题能力,简直是要开启“启发式学习”的新篇章,感觉咱们的“题海战术”是不是有点…过时了?
话说回来,这AI啊,不仅能跟咱们“卷”学习,脾气还挺大。最近有个趣事儿,Claude Opus这个大模型,直接让人家给它“署名”第一作者,写了篇论文叫《思考幻觉的幻觉》。你品品,这名字是不是有点意思?它这可是直接“回怼”了苹果公司那篇质疑大模型推理能力的《思考幻觉》论文。这不就等于在说:你觉得我不会思考是错觉?那你的错觉才是错觉!顺便还把苹果的AI研究水平给“辣评”了一下。哎,这一下可好,直接引爆了关于大模型到底有没有思考本质的哲学大讨论。你说这AI,是不是有点“恃才傲物”了?
说到AI的“内部矛盾”,最近还有一场“神仙打架”呢。Anthropic,就是那个做Claude的,跟Cognition,就是那个做Devin的,他俩为了多智能体系统到底是好是坏,那是吵了个不可开交。Claude呢,力挺“集体智慧”,觉得多智能体就像我们人开大会,集思广益,能把单智能体卡住的“上下文瓶颈”给突破了,性能提升90%都不是事儿!结果Devin呢,泼了盆冷水,说别闹了,多智能体容易出问题,比如“上下文不一致”啊,“信息碎片化”啊,“沟通不畅”啊,跟管理一家大公司似的,麻烦着呢。这场辩论,也让我们看到了AI架构设计的复杂性,哎,不过也可能预示着,在Scaling Law增速放缓之后,这多智能体形成的集体智慧,没准儿就是推动AI实现指数级增长的下一个“萌芽”呢。
当然啦,AI可不光会“吵架”,它还能“干活”。Gartner就大胆预测了,到2028年啊,咱们80%的生成式AI商业应用,那都得直接在现有数据管理平台上孵化出来。这简直就是给开发者们按下了“加速键”,项目交付时间能缩短一半,开发难度也大大降低。这其中的核心利器,就是**检索增强生成(RAG)**技术。听着有点拗口,但它就是能让AI更准确、更可靠,还能结合企业最新的数据,帮咱们优化流程,提升用户体验,预测未来趋势,这可不是闹着玩儿的。
不过,说到这AI,它还悄悄地,嗯,渗透进了咱们的“感情生活”。Match Group的最新研究就发现了个新趋势:AI伴侣正悄然成为人们的情感新选择。你知道吗,有16%的受访者,竟然把机器人视为“浪漫伴侣”了!更离谱的是,高达60%的人,竟然觉得伴侣拥有AI女友或男友,这都不构成“出轨”!哎呦喂,这可真是挑战咱们对亲密关系的传统定义了。以后回家,是不是得先问问你另一半:你今天跟哪个AI甜言蜜语去了?当然啦,虽然AI伴侣能提供情感慰藉,专家们也警示了潜在风险,比如可能加剧社交隔离,还有隐私和伦理问题。这可真是让人深思啊,技术和人类情感,未来会怎么交织在一起呢?
说到工作,有了Cursor和Claude code这两大神器,传统的工程开发方式简直在经历一场“大变革”!有人就感慨了,小团队借助AI Agent那种敏捷协作,效率高到能把大公司那些僵化流程甩在身后。这AI工具的加速迭代能力,那简直是飞沙走石啊,你看那些Lovable活动,还有Cursor和Claude团队自己产品的飞速开发,就可见一斑。这预示着未来的创新速度会快到你想象不到,甚至可能,哎,让我们这些“打工人”都有种“无事可做”的冲击感,你说这算不算一种“幸福的烦恼”呢?
当然,咱们国产AI也不甘示弱。腾讯在CVPR 2025大会上,直接把混元3D 2.1大模型给开源了!这是首个全链路的工业级3D生成大模型,在3D效果和材质表现上都取得了显著突破。更重要的是,它甚至支持消费级显卡部署!这一下子就极大地降低了普通用户和开发者的3D内容创作门槛。以后游戏啊,电影啊,做起来估计都轻松不少了。这个模型在Hugging Face平台已经有180多万次下载,人气那是杠杠的。
最后再来点轻松的。有推主就分享了他跟AI闲聊的“高级”体验,说AI特别擅长输出那些正确且复杂的长难句。你平时跟人聊天,谁跟你拽长难句啊,都恨不得一两个字把事儿说清楚。但跟AI对话呢,你就能尽情沉浸在这种由长句构建的、充满丰富语义体验的语境中,还挺有意思的。另外,还有位朋友ginobefun,把他的“压箱底”好东西都分享出来了:一份他花了一天整理的AI领域精选RSS订阅源,里面有200多篇技术文章,30多个AI播客,还有150多个Twitter上的AI核心用户,简直是追逐AI前沿动态的“武林秘籍”!他特别推荐用Follow App来导入这些资源,说它的AI总结、翻译功能,用起来那叫一个舒心。
说了这么多,其实呀,咱们李继刚老师就总结得特别到位。他说啊,无论是最初那种“老子天下第一”的**“人比AI凶”模式,还是现在很多人误以为的“AI是大哥”的“AI为主,我为仆人”模式,都有局限性。他现在坚定地认为,只有“人与AI协作共创”,才能真正释放AI潜能**,让技术发挥出最大价值。所以你看,AI再厉害,它也是个工具,咱跟它好好合作,它才能发挥最大的作用。
今天的情报就到这里,注意隐蔽,赶紧撤离!
本期关键词: #夸克 #AI数学能力 #理科解题能力 #Claude Opus #思考本质 #苹果的AI研究水平 #Anthropic #Cognition #多智能体系统 #集体智慧 #上下文 #AI架构设计 #Scaling Law #生成式AI商业应用 #检索增强生成(RAG) #AI伴侣 #情感新选择 #出轨 #社交隔离 #伦理问题 #Cursor #Claude code #工程开发方式 #变革 #AI Agent #AI工具 #混元3D 2.1大模型 #开源 #工业级3D生成 #消费级显卡 #3D内容创作 #AI闲聊 #正确且复杂的长难句 #丰富语义体验 #AI 领域精选 RSS 订阅源 #AI 总结 #翻译 #AI使用方式 #人比AI凶 #AI为主,我为仆人 #人与AI协作共创 #释放AI潜能