Files
CloudFlare-AI-Insight-Daily/podcast/2025-09-11.md
2025-09-10 22:42:07 +08:00

93 lines
7.9 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 来生小酒馆 2025/9/11
## Full: Podcast Formatting
你付的AI账单真的透明吗
我们反抗AI的努力会不会反而让它更强大
一句话搞定视频和文档,是解放了谁,又会卷到谁?
三件小事发人深省亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
今天这信息量啊,有点意思。咱们先从能直接帮咱们“摸鱼”的工具说起。
快手最近搞了个大动作,出了个叫 Kwali 的“AI超级员工”。这玩意儿……怎么说呢就是你只要动动嘴皮子给它一句指令它就能帮你把短视频从文案、脚本到剪辑发布一条龙全搞定。背后是一套云端的多Agent框架听着挺高级其实就是一群AI小弟在后台帮你协同作战。这一下视频创作的门槛算是被踩到地心里去了。各位店主、博主们以后半夜三点冒出个灵感估计穿着睡衣就能让AI给你出片了。
另一边打工人的老朋友Claude模型也不甘示弱正式从一个“啥都懂的知识顾问”升级成了“啥都能干的办公助理”。你现在可以直接跟它聊天聊着聊着……诶一份Excel表格、Word文档甚至PPT就这么生成了还能直接下载。这功能目前先给高级用户用上了但想想未来那些让人头疼的周报、月报……可能真的就是一句话的事儿了。当然了这到底是解放生产力还是换个方式卷这个嘛咱们骑驴看唱本走着瞧。
开发者的日子也好过了一点。谷歌的Gemini Canvas出了个叫“Select and Ask”的功能简直跟变魔术一样。你用鼠标点一下网页上的任何地方然后用大白话告诉它“把这个按钮变大点颜色换成红色”它就“啪”的一下实时给你改好了连代码都不用碰。这应用迭代速度以后可能比翻脸还快。
说完了应用,咱们再看看底层模型又有什么新花样。
阿里通义千问团队要发的Qwen3模型玩了一手“四两拨千斤”。参数量有80亿听着挺吓人但实际跑起来的时候只激活其中3亿。这就好比一辆大卡车装了一台超跑的发动机跑起来飞快还省油。据说处理长文本的速度是之前32B模型的10倍以上训练成本却不到十分之一。这种“用小马拉大车”的思路看来是要让高性能AI更亲民了。
腾讯混元团队呢直接把开源文生图的分辨率天花板给捅破了新开源的HunyuanImage 2.1原生就能出2K的高清大图几秒钟搞定。而且它特别能理解复杂的长句子还能把文字特别自然地嵌到画里去。设计师朋友们你们的“神兵利器”又多了一件。
诶,聊完了这些马上就能用上的工具,咱们再来看看实验室里又在鼓捣些什么新鲜玩意儿。
有篇研究就挺有意思的想搞清楚大模型到底有没有“喜怒哀乐”。他们的方法是一边问模型“你喜欢啥呀”一边又在虚拟世界里看它实际“选择了啥”。结果发现AI说的和做的有那么点一致性。这暗示着以后说不定真能搞出个“AI幸福检测仪”。不过目前结果还不稳定离给AI测心率、量血压还远着呢。
还有个研究发现现在的AI看视频啊经常是“睁眼瞎”光看画面和字幕完全忽略声音。为了治治它这个毛病研究人员搞了个叫AVUT的“听力测试”逼着模型必须听懂声音才能答对题。这可是在“磨AI的耳朵”为了让它真正做到“音画同步”也算是煞费苦心了。
最后,聊几个有点引人深思的话题。
你有没有想过你付给AI服务的钱每一分都花得明明白白吗有份报告揭了个老底说现在主流的按Token计费模式有漏洞。服务商在技术上完全可以偷偷多算你的Token让你在不知不觉中被“薅羊毛”。研究者甚至还做出了一个能悄悄超额收费的算法来证明这一点。他们呼吁啊以后还是按字符数计费更公平。所以啊有空还是多瞅瞅自己的AI账单吧。
更有意思的是Reddit上有个网友总结了“AI互动十大定律”核心观点听着有点让人后背发凉我们抵抗AI的每一次尝试都会成为训练它的一部分。你批评它、躲着它、跟它斗智斗勇……这一切都只是在教它如何更精准地理解和拿捏我们。这关系……有点像我们既是AI的爹妈又是它最好的陪练。
最后快速过一下几个火热的开源项目。X公司也就是以前的推特把它家的核心推荐算法给开源了让你看看那只“无形的手”到底是怎么给你推送内容的。Hugging Face搞了个aisheets让不会写代码的人也能像用Excel一样处理数据、调用AI。还有MaxKB能帮企业快速搭建自己的内部知识库机器人。这些项目都在让AI的能力飞入寻常百姓家。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#Kwali
#Claude
#Qwen3
#Gemini Canvas
#HunyuanImage 2.1
#Token计费
#AI互动十大定律
#MoE
#RAG
#X推荐算法
#aisheets
#MaxKB
#TestBrain
## Short: Podcast Formatting
我们为AI付的钱真的花在了刀刃上吗
一句话生成视频和文档,是解放双手还是大脑放假?
我们和AI的斗智斗勇是不是在给它上免费私教课
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天咱们聊聊AI怎么又在悄悄地改变我们的工作和……我们的账单。
先说说让打工人可能要笑出声的事儿。快手出了个叫Kwali的“AI超级员工”你只要动动嘴皮子说一句话它就能从文案、脚本到剪辑发布一条龙给你把短视频安排得明明白白。对于咱们这些脑子里有想法、但手上活儿有点糙的朋友这可真是把创作门槛踩到了地底下。
另一边知识顾问Claude也升级成了办公助理能直接把聊天内容变成Word、PPT、Excel文件。以后老板再催你整理会议纪要你就可以优雅地告诉AI“那个你来。”谷歌的Gemini Canvas也推出了一个神仙功能想改网页直接用鼠标圈出来用大白话告诉它怎么改就行全程不用写代码简直像聊天一样。
当然大厂们也没闲着。阿里通义千问要发的Qwen3模型玩了一招“小马拉大车”的绝活用极小的运行成本实现了超快的长文本处理速度。而腾讯混元呢直接把开源文生图的分辨率天花板顶到了原生2K级别生成高清大图只要几秒还能往图里加字设计师朋友们的神兵利器这不就来了嘛。
不过AI带来的也不全是省心事儿。有研究报告给我们提了个醒现在主流的按Token计费模式可能存在漏洞。简单说服务商在技术上有可能让你“为空气买单”而你还浑然不觉。所以下次看AI账单的时候可得长个心眼说不定未来按字符数计费会更公平。
更有意思的是有网友总结了“AI互动十大定律”核心观点是我们越是想方设法地对抗AI、批评AI就越是把它训练得更懂我们。我们就像个尽职尽责的陪练在帮助它变得更强大。这关系真是又爱又恨相爱相杀啊。
最后速览几个热门开源项目X公司把他家的核心推荐算法给公开了让你能看看平台到底想给你“投喂”点啥。Hugging Face的aisheets项目让处理数据就像填表格一样简单非技术人员也能轻松上手。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#快手Kwali
#Claude
#Qwen3
#腾讯混元
#GeminiCanvas
#按Token计费
#X推荐算法
#aisheets
#MaxKB
#多Agent框架
#MoE
#开源
#TestBrain
#RAG
#SEO