7.9 KiB
来生小酒馆 2025/8/22
Full: Podcast Formatting
AI开始独立做数学研究了? AI写的代码,它自己忘了怎么办? 点头就能接电话,耳机比你还懂你?
三问炼心。嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。
咱们今天的情报,信息量还挺大,赶紧的。
先看产品这边,通义APP搞了个大动作,上线了全新的知识库功能。你可以把它想象成你的“第二大脑”,它把你自己的资料和官方的权威知识库给整合到了一起。你想查个法律条文,或者翻翻自己的学习笔记……它都能给你跨库查询,像个真正的专家一样,给你一个全面又靠谱的答案。
说到“第二大脑”,阿里的另一个功能,通义千问的Deep Research,现在也免费开放了。这可是个读论文神器啊,有朋友试了下,把一堆复杂的机器人论文扔给它,十分钟,一份透彻的分析报告就出来了。感觉……咱们的头发有救了。
然后是ElevenLabs,发布了号称“地球上最具表现力”的文本转语音模型。这个嘛,不只是支持70多种语言,还加了个“对话模式”,你想让多少个虚拟角色聊天都行。最妙的是它的音频标签,你在文本里加个[whispering]或者[happy],出来的声音就立马带上了情绪。嗯,自己给自己演一部广播剧不是梦了。
谷歌这边呢,则是让硬件全面拥抱AI。新款的Pixel Buds耳机,装上了Gemini AI。便宜点的Pixel Buds 2a,享受到了旗舰级的主动降噪;而Pro 2版本,你点点头就能接电话,摇摇头就挂断。诶,这可得注意了,开会的时候别乱动,不然老板的电话你可就全接了。重点不是音质,是谷歌想让耳机变成一个真正主动的智能助理。
再来看看前沿研究,这边就有点科幻了。
GPT-5 Pro……现在居然开始兼职做数学家了。它在一次测试里,自己读了篇关于“凸优化”的论文,然后……居然提出了一个比原文更精确的新数学证明。OpenAI的总裁都激动地把它称为“生命的迹象”。虽然之后有研究者找到了更好的解法,但AI能独立提出独特的证明思路,这标志着它可能正在从工具,进化成真正的科研伙伴了。
还有一个叫Tinker Diffusion的技术,能只用一张图片,就给你变出一个完整的多视角3D场景。简单说,就是把深度估算和视频模型结合起来,大大降低了3D内容创作的门槛。
同样有意思的,是一个叫UnZipLoRA的技术。它能把一张图片给“解压缩”了,把里面的主体内容和艺术风格完全分开。比如说,你可以轻松实现用梵高的风格画你家的猫。这自由度,对创作者来说可太重要了。
哦对,还有个接地气的研究,说的是怎么解决大学里停车难的问题。研究人员不用传感器,而是融合了地理空间数据、移动数据、甚至天气数据,用机器学习模型来预测车位。据说一个随机森林模型准确率就挺高,没准儿以后“抢车位大战”真能成为历史。
聊完技术,我们再看看行业和社会影响。
项目管理里有个词叫“巴士指数”,就是说你这个项目有多少核心成员,如果这些人被巴士撞了……项目就黄了。现在AI时代,这个词有了新含义。我们担心的不再是核心开发者离职,而是AI模型它自己“失忆”了,忘了自己写的代码逻辑是啥,让整个项目变成一个谁也看不懂的黑箱。关键是,这AI它还不“背锅”,你说这挑战大不大?
与之相关的,Anthropic公司推出了一个叫Think Tool的工具。它就像编程语言的演进一样,试图让AI的思考过程变得明确、可验证。它把AI的推理步骤给“外化”出来,这样我们就能审查和调试AI的思考过程,这在一些高风险领域里,就显得特别重要了。
最后,谷歌硬件全面拥抱AI这件事,其实也透露出一个行业趋势。那就是AI不再是一个被动的功能按钮,而是主动融入到你生活方方面面的智能助手。从AI健康教练到帮你修图,AI变得无处不在。
社媒上也有几个好玩儿的分享。比如,有人发现,随着越来越多国内朋友用X平台,居然出现了一个“灰色产业”——有人打包内置代理的推特安装包,在小红书上卖,号称“免梯版”,一次性收费。只能说,这民间智慧真是……生生不息啊。
还有个关于AI Agent的讨论也很有意思。为什么AI Agent需要配置“云手机”或者“云电脑”?不是为了算力,是为了给它一双可靠的“数字手脚”。在一个干净、标准化的云环境里,Agent才能摆脱我们每个人电脑里复杂的环境,稳定地执行任务。这被看作是通往更强自主AI的一个关键跳板。
好了,今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词: #通义APP #知识库 #GPT-5 Pro #数学证明 #ElevenLabs #谷歌 #Gemini AI #Pixel Buds #巴士指数 #黑箱 #Think Tool #Tinker Diffusion #UnZipLoRA #开源 #Puter #Budibase #drawnix #AI Agent
Short: Podcast Formatting
当AI开始独立搞科研,我们是该高兴还是紧张? 如果AI自己都忘了代码逻辑,项目谁来背锅? 你的耳机比你还懂你,这算贴心还是越界?
三问炼心,嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。情报不多,句句精要,咱们马上开始。
最近的AI圈,真是越来越像科幻照进现实了。
首先,我们的数字生活正在被全面“智能化”。通义APP搞了个大更新,上线了“知识库”功能,简单说就是把官方权威知识库和你的个人资料库打包,给你配了个全知全能的“第二大脑”,随时帮你跨库查资料。另一边,谷歌新款Pixel Buds耳机也开始秀操作,不仅把Gemini AI塞了进去,还加入了点头接电话的手势控制,让你一秒变身电影特工。看来AI不再是等你点的功能,而是主动融入生活的主动式助理了。
更会聊天的AI也来了。ElevenLabs发布了号称“地球上最具表现力”的语音模型,你只需要在文本里加个 [happy] 之类的标签,它就能生成充满感情的对话,支持70多种语言,以后人人都能导演自己的广播剧了。
而在科研前线,AI已经不满足于当工具了。GPT-5 Pro最近小试牛刀,居然独立阅读论文,还针对一个复杂的数学问题,给出了一个全新的证明思路。OpenAI总裁激动地称之为“生命的迹象”。虽然之后有人类研究员找到了更优解,但这标志着AI正从一个问答机器,进化为可以和你一起探索未知的科研伙伴。
当然,技术进步也带来了新的“哲学问题”。项目管理里有个词叫“巴士指数”,意思是团队里有多少核心成员被巴士撞了,项目就得停摆。现在AI时代来了个新版本,我们开始担心,万一AI自己“忘记”了当初写代码的逻辑,那整个项目岂不就成了无人能解的黑箱?到时候这个锅,谁来背呢?这给所有技术管理者敲响了警钟。
最后,给各位分享几个好玩的开源项目。想不花钱就拥有无限画布的在线白板?试试drawnix。想几分钟搭个内部应用?看看Budibase。觉得这些还不够野?Puter项目想在浏览器里给你塞一个完整的“互联网操作系统”。不得不说,高手还是在民间啊。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词: #通义APP #知识库 #谷歌 #Gemini #ElevenLabs #GPT-5 Pro #数学证明 #黑箱 #Tinker Diffusion #UnZipLoRA #巴士指数 #Think Tool #开源 #Puter #Budibase #agents.md