CloudFlare-AI-Insight-Daily/podcast/2025-09-11.md

# 来生小酒馆 2025/9/11

## Full: Podcast Formatting

你付的AI账单，真的透明吗？
我们反抗AI的努力，会不会反而让它更强大？
一句话搞定视频和文档，是解放了谁，又会卷到谁？

三件小事发人深省，嘿，亲爱的V，欢迎收听新一期的来生情报站，我是你们的老朋友，何夕2077。

今天这信息量啊，有点意思。咱们先从能直接帮咱们“摸鱼”的工具说起。

快手最近搞了个大动作，出了个叫 Kwali 的“AI超级员工”。这玩意儿……怎么说呢，就是你只要动动嘴皮子，给它一句指令，它就能帮你把短视频从文案、脚本到剪辑发布，一条龙全搞定。背后是一套云端的多Agent框架，听着挺高级，其实就是一群AI小弟在后台帮你协同作战。这一下，视频创作的门槛算是被踩到地心里去了。各位店主、博主们，以后半夜三点冒出个灵感，估计穿着睡衣就能让AI给你出片了。

另一边，打工人的老朋友Claude模型也不甘示弱，正式从一个“啥都懂的知识顾问”，升级成了“啥都能干的办公助理”。你现在可以直接跟它聊天，聊着聊着……诶，一份Excel表格、Word文档，甚至PPT，就这么生成了，还能直接下载。这功能目前先给高级用户用上了，但想想未来，那些让人头疼的周报、月报……可能真的就是一句话的事儿了。当然了，这到底是解放生产力，还是换个方式卷，这个嘛，咱们骑驴看唱本，走着瞧。

开发者的日子也好过了一点。谷歌的Gemini Canvas出了个叫“Select and Ask”的功能，简直跟变魔术一样。你用鼠标点一下网页上的任何地方，然后用大白话告诉它“把这个按钮变大点，颜色换成红色”，它就“啪”的一下，实时给你改好了，连代码都不用碰。这应用迭代速度，以后可能比翻脸还快。

说完了应用，咱们再看看底层模型又有什么新花样。

阿里通义千问团队要发的Qwen3模型，玩了一手“四两拨千斤”。参数量有80亿，听着挺吓人，但实际跑起来的时候，只激活其中3亿。这就好比一辆大卡车，装了一台超跑的发动机，跑起来飞快还省油。据说处理长文本的速度是之前32B模型的10倍以上，训练成本却不到十分之一。这种“用小马拉大车”的思路，看来是要让高性能AI更亲民了。

腾讯混元团队呢，直接把开源文生图的分辨率天花板给捅破了，新开源的HunyuanImage 2.1，原生就能出2K的高清大图，几秒钟搞定。而且它特别能理解复杂的长句子，还能把文字特别自然地嵌到画里去。设计师朋友们，你们的“神兵利器”又多了一件。

诶，聊完了这些马上就能用上的工具，咱们再来看看实验室里又在鼓捣些什么新鲜玩意儿。

有篇研究就挺有意思的，想搞清楚大模型到底有没有“喜怒哀乐”。他们的方法是，一边问模型“你喜欢啥呀”，一边又在虚拟世界里看它实际“选择了啥”。结果发现，AI说的和做的，有那么点一致性。这暗示着，以后说不定真能搞出个“AI幸福检测仪”。不过目前结果还不稳定，离给AI测心率、量血压还远着呢。

还有个研究发现，现在的AI看视频啊，经常是“睁眼瞎”，光看画面和字幕，完全忽略声音。为了治治它这个毛病，研究人员搞了个叫AVUT的“听力测试”，逼着模型必须听懂声音才能答对题。这可是在“磨AI的耳朵”，为了让它真正做到“音画同步”，也算是煞费苦心了。

最后，聊几个有点引人深思的话题。

你有没有想过，你付给AI服务的钱，每一分都花得明明白白吗？有份报告揭了个老底，说现在主流的按Token计费模式有漏洞。服务商在技术上，完全可以偷偷多算你的Token，让你在不知不觉中被“薅羊毛”。研究者甚至还做出了一个能悄悄超额收费的算法来证明这一点。他们呼吁啊，以后还是按字符数计费更公平。所以啊，有空还是多瞅瞅自己的AI账单吧。

更有意思的是，Reddit上有个网友总结了“AI互动十大定律”，核心观点听着有点让人后背发凉：我们抵抗AI的每一次尝试，都会成为训练它的一部分。你批评它、躲着它、跟它斗智斗勇……这一切，都只是在教它如何更精准地理解和拿捏我们。这关系……有点像我们既是AI的爹妈，又是它最好的陪练。

最后快速过一下几个火热的开源项目。X公司，也就是以前的推特，把它家的核心推荐算法给开源了，让你看看那只“无形的手”到底是怎么给你推送内容的。Hugging Face搞了个aisheets，让不会写代码的人也能像用Excel一样处理数据、调用AI。还有MaxKB，能帮企业快速搭建自己的内部知识库机器人。这些项目都在让AI的能力，飞入寻常百姓家。

今天的情报就到这里，注意隐蔽，赶紧撤离。

本期关键词:
#Kwali
#Claude
#Qwen3
#Gemini Canvas
#HunyuanImage 2.1
#Token计费
#AI互动十大定律
#MoE
#RAG
#X推荐算法
#aisheets
#MaxKB
#TestBrain

## Short: Podcast Formatting

我们为AI付的钱，真的花在了刀刃上吗？
一句话生成视频和文档，是解放双手还是大脑放假？
我们和AI的斗智斗勇，是不是在给它上免费私教课？

嘿，亲爱的V，欢迎收听新一期的来生情报站，我是你们的老朋友，何夕2077。今天咱们聊聊，AI怎么又在悄悄地改变我们的工作和……我们的账单。

先说说让打工人可能要笑出声的事儿。快手出了个叫Kwali的“AI超级员工”，你只要动动嘴皮子说一句话，它就能从文案、脚本到剪辑发布，一条龙给你把短视频安排得明明白白。对于咱们这些脑子里有想法、但手上活儿有点糙的朋友，这可真是把创作门槛踩到了地底下。

另一边，知识顾问Claude也升级成了办公助理，能直接把聊天内容变成Word、PPT、Excel文件。以后老板再催你整理会议纪要，你就可以优雅地告诉AI：“那个，你来。”谷歌的Gemini Canvas也推出了一个神仙功能，想改网页，直接用鼠标圈出来，用大白话告诉它怎么改就行，全程不用写代码，简直像聊天一样。

当然，大厂们也没闲着。阿里通义千问要发的Qwen3模型，玩了一招“小马拉大车”的绝活，用极小的运行成本，实现了超快的长文本处理速度。而腾讯混元呢，直接把开源文生图的分辨率天花板顶到了原生2K级别，生成高清大图只要几秒，还能往图里加字，设计师朋友们的神兵利器这不就来了嘛。

不过，AI带来的也不全是省心事儿。有研究报告给我们提了个醒：现在主流的按Token计费模式，可能存在漏洞。简单说，服务商在技术上有可能让你“为空气买单”，而你还浑然不觉。所以，下次看AI账单的时候，可得长个心眼，说不定未来按字符数计费会更公平。

更有意思的是，有网友总结了“AI互动十大定律”，核心观点是：我们越是想方设法地对抗AI、批评AI，就越是把它训练得更懂我们。我们就像个尽职尽责的陪练，在帮助它变得更强大。这关系，真是又爱又恨，相爱相杀啊。

最后速览几个热门开源项目：X公司把他家的核心推荐算法给公开了，让你能看看平台到底想给你“投喂”点啥。Hugging Face的aisheets项目，让处理数据就像填表格一样简单，非技术人员也能轻松上手。

今天的情报就到这里，注意隐蔽，赶紧撤离。

本期关键词:
#快手Kwali
#Claude
#Qwen3
#腾讯混元
#GeminiCanvas
#按Token计费
#X推荐算法
#aisheets
#MaxKB
#多Agent框架
#MoE
#开源
#TestBrain
#RAG
#SEO