Files
CloudFlare-AI-Insight-Daily/podcast/2025-10-19.md
2025-10-18 23:13:09 +08:00

8.0 KiB
Raw Blame History

来生小酒馆 2025/10/19

Full: Podcast Formatting

当AI什么都会做时我们的价值还剩什么 人工智能究竟是元年还是十年? 做梦是为了防止我们的大脑“过拟合”吗? 三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。

咱们闲话少说直接开聊。AI圈今天又有不少好玩的事儿。

首先是Anthropic家的Claude这个AI模型啊最近搞了个大动作给自己装上了一套叫“技能”Skills的系统。这玩意儿你知道吧就跟咱们玩游戏加点一样你可以教它新本事让它在特定任务上越来越强。有开发者就觉得这模式可能比微软那个MCP概念还要厉害让AI从一个啥都知道的“万事通”开始向啥都能干的“全能选手”转变。

另一边谷歌的Gemini也没闲着正式和谷歌地图“联姻”了。Gemini API现在能直接调用超过两亿五千万个地点的真实数据。这就像是给AI装上了一双能看懂世界的眼睛和一双能丈量地球的双脚以后开发者就能搞出更多跟地理位置相关的酷炫应用了。

接着聊聊研究。诶你有没有发现AI画画老是数错手指头这事儿现在有科学家正儿八经地研究了。来自阿德莱德大学、美团和上海交大的团队不仅量化了AI的“计数幻觉”问题还搞出了第一个评测基准。更有意思的是他们发现你越想让它画得精细比如增加采样步数它反而可能错得越离谱……不过别担心他们也提出了一个联合扩散模型方案能大大减少这种错误代码和论文都开源了推动AI从“画得像”往“画得对”迈了一大步。

聊完产品和研究,我们再看看大佬们的观点。

OpenAI的创始成员Andrej Karpathy最近就给火热的AI Agent市场泼了盆冷水。他特别犀利地指出大家别老喊什么“智能体元年”了咱们现在顶多算是在“智能体十年”的开端。他打了个比方这事儿就像自动驾驶从一个看起来很棒的90分演示到真正能上路不出事的99.999%可靠产品中间的差距……嗯巨大。他提醒我们啊在AI时代保持耐心比保持兴奋更重要。

菲尔兹奖得主陶哲轩大佬也发表了看法他觉得AI在数学领域短期内还到不了攻克顶级难题的程度。它现在的角色更像一个超级高效的研究助理帮专家们查查文献、处理点杂活。这种“AI辅助加人工确认”的模式据说已经帮着找到了好几个数学“未解之谜”的已有解答。你看AI这是在把科学家从重复劳动里解放出来让他们能专心搞创新。

那么问题来了随着AI越来越强我们人类的饭碗还保得住吗有观点就说我们真正的护城河会变成我们独特的审美和见识。以后啊咱们的角色可能就变成了导演、主编负责给AI提供创意和指导AI来负责具体执行。你的人生阅历和品味可能就是你未来最宝贵的资产。

不过啊,理想很丰满,现实里有些大公司的内部状况就……有点一言难尽。有条评论就挺辛辣的,说有些公司的中层管理者,天天给高层编织美梦,让领导们活在虚假的繁荣里,压根没意识到时代变了。这梦啊,总有醒的一天,对吧?

说到学习和搞项目GitHub上又有几个宝藏项目火了。 想精通Claude有个叫claude-cookbooks的“武功秘籍”库,21.2k星,手把手教你高级玩法。 想自己动手搞大模型O'Reilly那本知名教材的配套代码Hands-On-Large-Language-Models16.6k星,带你从零到一。 还有个叫ebook2audiobook的项目能把电子书变成有声读物还能克隆你自己的声音支持1100多种语言简直是阅读神器 前端开发的朋友可以看看storybook,行业标准了,88k星。 想搞个私人AI助手的可以关注deepchat。 网络安全从业者呢,那个收集深网和暗网情报的deepdarkCTI也很有价值。

最后分享几条社交媒体上的趣闻。 有人整理了Claude Code的20多个高级用法从当编程导师到自动搞SEO花样繁多。 还有一个来自《Cell》的假说说我们做梦其实是为了防止大脑对现实生活“过拟合”。梦里的那些混乱和不真实恰恰是在帮我们的大脑提高泛化能力挺有意思吧 哦对AI圈最近还搞起了厨艺大赛让veo3.1和sora 2 pro各自生成了一段红烧肉的视频让网友评判哪个更诱人。感兴趣的可以去围观一下看看AI大厨的手艺如何。 还有《智能体设计模式》这本神书的中文翻译项目在GitHub上火了大家还建了群一起讨论想深入学习AI Agent的朋友可以去看看。

今天的情报就到这里,注意隐蔽,赶紧撤离。


本期关键词: #Anthropic #Claude #技能 #Gemini #谷歌地图 #AI图像生成 #计数幻觉 #AndrejKarpathy #AI智能体 #陶哲轩 #研究助理 #人类核心竞争力 #审美 #见识 #claude-cookbooks #Hands-On-Large-Language-Models #ebook2audiobook #storybook #deepchat #deepdarkCTI #梦境 #过拟合 #智能体设计模式

Short: Podcast Formatting

AI画不好手指背后有啥玄机 AI时代耐心比兴奋更重要吗 你的品味,会是你最后的护城河吗?

三维问题提炼亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。咱们废话少说直奔主题。

先看两家大厂的新动作。Anthropic给自家的Claude模型上线了个叫“技能”的系统这可不是让你教它唱跳rap而是像玩游戏一样给AI点技能树让它在特定任务上不断升级。这思路是从“啥都知道”往“啥都能干”发展了。另一边谷歌也没闲着把Gemini API和谷歌地图接上了。这下好了Gemini不仅有了脑子还装上了能看懂现实世界的眼睛和丈量地球的双脚以后让它帮你规划个旅游路线可能比你对象还靠谱。

接着聊个有趣的研究。你有没有发现AI画画啥都挺好就是一到数数就犯迷糊尤其是画手十根手指头能给你画出十二根来。最近终于有研究团队系统性地解决了这个“计数幻觉”问题。更有意思的是他们发现像增加采样步数这种常规优化手段有时候反而会让AI数得更离谱。这就像你头疼医生让你多睡会儿结果睡醒了头更疼了。好在他们也提出了新的解决方案推动AI从“画得像”往“画得对”迈了一大步。

当然AI圈也不全是高歌猛进。OpenAI的创始成员Andrej Karpathy最近就给大家泼了盆冷水。他觉得现在所谓的“智能体元年”其实更像是“智能体十年”的开端。他用自动驾驶举例从一个看起来90%成功的演示到真正能上路的99.999%可靠的产品中间隔着的不是一条河是一片太平洋。这观点和菲尔兹奖得主陶哲轩不谋而合陶教授也认为AI短期内还成不了数学家但可以当一个顶级研究助理把人类从繁琐的文献检索里解放出来。

所以咱们普通人该怎么办有观点认为当AI把执行力拉满之后人类的核心竞争力就转移了。你的审美、你的见识、你独特的品味这些才是AI无法复制的。以后咱们可能不当执行者了都转行当“导演”和“主编”负责给AI提供创意和方向。毕竟AI能生成以假乱真的红烧肉视频但哪个更好吃、更能勾起人的食欲还得咱们说了算。

今天的情报就到这里,注意隐蔽,赶紧撤离。


本期关键词: #Claude #技能 #Gemini_API #谷歌地图 #计数幻觉 #Andrej_Karpathy #AI智能体 #陶哲轩 #研究助理 #审美与见识 #人机协作 #开源