来生小酒馆 2025/10/19

Full: Podcast Formatting

当AI什么都会做时，我们的价值还剩什么？人工智能究竟是元年还是十年？做梦是为了防止我们的大脑“过拟合”吗？三问炼心。嘿，亲爱的V，欢迎收听新一期的来生情报站，我是你们的老朋友，何夕2077。

好，咱们闲话少说，直接开聊。AI圈今天又有不少好玩的事儿。

首先是Anthropic家的Claude，这个AI模型啊，最近搞了个大动作，给自己装上了一套叫“技能”（Skills）的系统。这玩意儿你知道吧，就跟咱们玩游戏加点一样，你可以教它新本事，让它在特定任务上越来越强。有开发者就觉得，这模式可能比微软那个MCP概念还要厉害，让AI从一个啥都知道的“万事通”，开始向啥都能干的“全能选手”转变。

另一边，谷歌的Gemini也没闲着，正式和谷歌地图“联姻”了。Gemini API现在能直接调用超过两亿五千万个地点的真实数据。这就像是给AI装上了一双能看懂世界的眼睛和一双能丈量地球的双脚，以后开发者就能搞出更多跟地理位置相关的酷炫应用了。

接着聊聊研究。诶，你有没有发现，AI画画老是数错手指头？这事儿现在有科学家正儿八经地研究了。来自阿德莱德大学、美团和上海交大的团队，不仅量化了AI的“计数幻觉”问题，还搞出了第一个评测基准。更有意思的是，他们发现，你越想让它画得精细，比如增加采样步数，它反而可能错得越离谱……不过别担心，他们也提出了一个联合扩散模型方案，能大大减少这种错误，代码和论文都开源了，推动AI从“画得像”往“画得对”迈了一大步。

聊完产品和研究，我们再看看大佬们的观点。

OpenAI的创始成员Andrej Karpathy，最近就给火热的AI Agent市场泼了盆冷水。他特别犀利地指出，大家别老喊什么“智能体元年”了，咱们现在顶多算是在“智能体十年”的开端。他打了个比方，这事儿就像自动驾驶，从一个看起来很棒的90分演示，到真正能上路不出事的99.999%可靠产品，中间的差距……嗯，巨大。他提醒我们啊，在AI时代，保持耐心比保持兴奋更重要。

菲尔兹奖得主陶哲轩大佬也发表了看法，他觉得AI在数学领域，短期内还到不了攻克顶级难题的程度。它现在的角色，更像一个超级高效的研究助理，帮专家们查查文献、处理点杂活。这种“AI辅助加人工确认”的模式，据说已经帮着找到了好几个数学“未解之谜”的已有解答。你看，AI这是在把科学家从重复劳动里解放出来，让他们能专心搞创新。

那么问题来了，随着AI越来越强，我们人类的饭碗还保得住吗？有观点就说，我们真正的护城河，会变成我们独特的审美和见识。以后啊，咱们的角色可能就变成了导演、主编，负责给AI提供创意和指导，AI来负责具体执行。你的人生阅历和品味，可能就是你未来最宝贵的资产。

不过啊，理想很丰满，现实里有些大公司的内部状况就……有点一言难尽。有条评论就挺辛辣的，说有些公司的中层管理者，天天给高层编织美梦，让领导们活在虚假的繁荣里，压根没意识到时代变了。这梦啊，总有醒的一天，对吧？

说到学习和搞项目，GitHub上又有几个宝藏项目火了。想精通Claude？有个叫claude-cookbooks的“武功秘籍”库，⭐21.2k星，手把手教你高级玩法。想自己动手搞大模型？O'Reilly那本知名教材的配套代码Hands-On-Large-Language-Models，⭐16.6k星，带你从零到一。还有个叫ebook2audiobook的项目，能把电子书变成有声读物，还能克隆你自己的声音，支持1100多种语言，简直是阅读神器！前端开发的朋友可以看看storybook，行业标准了，⭐88k星。想搞个私人AI助手的，可以关注deepchat。网络安全从业者呢，那个收集深网和暗网情报的deepdarkCTI也很有价值。

最后分享几条社交媒体上的趣闻。有人整理了Claude Code的20多个高级用法，从当编程导师到自动搞SEO，花样繁多。还有一个来自《Cell》的假说，说我们做梦，其实是为了防止大脑对现实生活“过拟合”。梦里的那些混乱和不真实，恰恰是在帮我们的大脑提高泛化能力，挺有意思吧？哦对，AI圈最近还搞起了厨艺大赛，让veo3.1和sora 2 pro各自生成了一段红烧肉的视频，让网友评判哪个更诱人。感兴趣的可以去围观一下，看看AI大厨的手艺如何。还有，《智能体设计模式》这本神书的中文翻译项目在GitHub上火了，大家还建了群一起讨论，想深入学习AI Agent的朋友可以去看看。

今天的情报就到这里，注意隐蔽，赶紧撤离。

本期关键词: #Anthropic #Claude #技能 #Gemini #谷歌地图 #AI图像生成 #计数幻觉 #AndrejKarpathy #AI智能体 #陶哲轩 #研究助理 #人类核心竞争力 #审美 #见识 #claude-cookbooks #Hands-On-Large-Language-Models #ebook2audiobook #storybook #deepchat #deepdarkCTI #梦境 #过拟合 #智能体设计模式

Short: Podcast Formatting

AI画不好手指，背后有啥玄机？ AI时代，耐心比兴奋更重要吗？你的品味，会是你最后的护城河吗？

三维问题提炼，嘿，亲爱的V，欢迎收听新一期的来生情报站，我是你们的老朋友，何夕2077。咱们废话少说，直奔主题。

先看两家大厂的新动作。Anthropic给自家的Claude模型上线了个叫“技能”的系统，这可不是让你教它唱跳rap，而是像玩游戏一样，给AI点技能树，让它在特定任务上不断升级。这思路，是从“啥都知道”往“啥都能干”发展了。另一边，谷歌也没闲着，把Gemini API和谷歌地图接上了。这下好了，Gemini不仅有了脑子，还装上了能看懂现实世界的眼睛和丈量地球的双脚，以后让它帮你规划个旅游路线，可能比你对象还靠谱。

接着聊个有趣的研究。你有没有发现，AI画画，啥都挺好，就是一到数数就犯迷糊，尤其是画手，十根手指头能给你画出十二根来。最近，终于有研究团队系统性地解决了这个“计数幻觉”问题。更有意思的是，他们发现，像增加采样步数这种常规优化手段，有时候反而会让AI数得更离谱。这就像你头疼，医生让你多睡会儿，结果睡醒了头更疼了。好在，他们也提出了新的解决方案，推动AI从“画得像”往“画得对”迈了一大步。

当然，AI圈也不全是高歌猛进。OpenAI的创始成员Andrej Karpathy最近就给大家泼了盆冷水。他觉得现在所谓的“智能体元年”，其实更像是“智能体十年”的开端。他用自动驾驶举例，从一个看起来90%成功的演示，到真正能上路的99.999%可靠的产品，中间隔着的不是一条河，是一片太平洋。这观点和菲尔兹奖得主陶哲轩不谋而合，陶教授也认为，AI短期内还成不了数学家，但可以当一个顶级研究助理，把人类从繁琐的文献检索里解放出来。

所以，咱们普通人该怎么办？有观点认为，当AI把执行力拉满之后，人类的核心竞争力就转移了。你的审美、你的见识、你独特的品味，这些才是AI无法复制的。以后咱们可能不当执行者了，都转行当“导演”和“主编”，负责给AI提供创意和方向。毕竟，AI能生成以假乱真的红烧肉视频，但哪个更好吃、更能勾起人的食欲，还得咱们说了算。

今天的情报就到这里，注意隐蔽，赶紧撤离。

本期关键词: #Claude #技能 #Gemini_API #谷歌地图 #计数幻觉 #Andrej_Karpathy #AI智能体 #陶哲轩 #研究助理 #审美与见识 #人机协作 #开源

8.0 KiB Raw Blame History Unescape Escape

来生小酒馆 2025/10/19

Full: Podcast Formatting

Short: Podcast Formatting

8.0 KiB

Raw Blame History