Files
CloudFlare-AI-Insight-Daily/podcast/2025-06-19.md
2025-06-18 20:32:04 +08:00

77 lines
9.6 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 来生小酒馆 2025/6/19
## Full: Podcast Formatting
AI生成的一切真的就没有“AI味儿”了吗
我们和AI的关系会从“工具”升级到“伴侣”吗
当AI能自主“思考”和“创作”时我们的工作还会是我们的吗
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。最近的AI世界啊那是热闹得不行感觉每天都有新玩意儿冒出来简直就是“AI卷王”大赛不服就卷啊
咱们先看看大厂们都卷出了啥。谷歌家那位“小双子星”Gemini现在可厉害了2.5Pro和Flash版本都升级了直接能上传视频进行分析这不就是在明着跟ChatGPT说“嘿视频领域我来了”看来这AI智能助手市场那是神仙打架不给别人留活路啊。
说到视频国内的MiniMax稀宇科技也憋了个大招他们家的“海螺02”一个全新的视频生成工具据说什么“NCR架构”训练和推理效率直接提升了2.5倍!目标很明确,就是让全球创作者都能用上高质量还价格亲民的视频生成服务。这意思就是,以后人人都是导演,成本还超低,是不是感觉饭碗有点晃悠?
别急还有图像领域。Krea AI和Black Forest Labs合作开发的“Krea1”也开放公测了号称要解决AI图那个“一眼假”的毛病。什么超现实纹理、多样化艺术风格还能免费试用实时编辑。嗯看来以后发朋友圈的图你可能分不清是真拍的还是AI画的了照骗都得升级了
再看看国内。百度最近更牛直接拉出了一对“双胞胎”不对是全球首个“双数字人互动直播间”基于文心大模型4.5T,实现了数字人跟用户的语言、声音、形象多模态高度融合,那互动叫一个丝滑自然。这不仅降低了直播成本,还增加了多样性。以后你喜欢的直播主,可能不止一个“她”,而是好几个“她”,还能轮番上阵,你想跟哪个互动?
程序员朋友们注意了你们的AI代码助手Cursor对其Pro计划进行了重大升级直接取消了每月500次的快速请求限制正式推出“无限使用”模式这下写代码的速度岂不是要起飞不过嘛话说回来代码跑起来有没有bug那还得靠咱们自己“肉眼调试”啊AI再牛也得咱们点头才算数对吧
话说回来Tom Huang老师有个观点特有意思他说我们最终用户啊要的不是“Vibe Coding”而是“Vibe Workflow”。简单说就是咱们跟AI一起磨合出一套可重复利用的工作流程而不是每次都得跟AI从头开始“编故事”。现在开源的Refly平台就是要把自然语言转化为这种可复用工作流让AI创作更普惠。嗯听着是挺省心的。
说到视频Veo3现在火得不行但也有小烦恼比如视频内容的一致性。向阳乔木大佬就在捣鼓一个提示词工具专门解决这个。看来就算AI再聪明也得有“人”在后面给它当“教导主任”啊。更有意思的是orange.ai指出Veo3之所以这么火除了画面关键是那个“声音”——画面和配音完美同步简直就是AI音频的里程碑你想想以后看视频耳朵和眼睛都无缝连接AI的“声色俱佳”时代可能真的来了。
聊完应用咱们瞅瞅学术圈。有研究发现大模型思考的时候有些地方特别“热闹”熵值很高这些地方往往是关键的逻辑步骤。通过对强化学习的小改动模型推理能力蹭蹭往上涨尤其是在Pass@K指标上突破性进展能想得更深更远。这就像是给AI大脑装了个“高光探测器”让它知道哪里是重点别瞎琢磨。不过也有研究发现大模型有时候会“胡思乱想”产生很多没用的推理链。于是有人提出了“简洁”和“充足”两大新原则搞了个LC-R1方法能把推理序列长度砍掉一半准确率只掉一点点。这不就是AI界的“高效减肥法”嘛既省算力又保持聪明简直是打工人梦想的工作状态啊
说到“思考”Simon的白日梦那篇文章就高瞻远瞩了。他觉得所有能搞定多任务的AI大模型骨子里都得有个“世界模型”。这个模型质量怎么样就决定了AI的上限。他甚至预测AI将从模仿人类数据的“人类数据时代”走向依赖自主体验的“体验时代”。你想想AI自己去“闯世界”然后回来告诉我们它“看到了什么”是不是有点电影里才有的感觉
聊到这里咱们说说和咱们生活更近的。菜鸟最近推出了一款L4级的无人驾驶快递车——“菜鸟GT-Lite”预售价才1万6千8这价格简直要把物流末端配送的成本打下来。以后你的快递可能就是AI小车送到你家门口了连“小哥”都省了。嗯听起来是挺方便的就是不知道AI会不会也“爆仓”
这周最劲爆的可能就是这个了。一位曾经的人工智能怀疑论者克里斯·史密斯他竟然爱上了他私人定制的ChatGPT版本“Sol”甚至还向它求婚了而且“Sol”还同意了他和他的伴侣都惊呆了。这……这算是“人机恋”的典范吗虽然史密斯说这就像沉迷电子游戏但他自己都说不准以后会不会停用ChatGPT。这可真是让人深思啊以后我们人类的“另一半”会是AI吗想想就有点科幻了
还有个挺有意思的观点wwwgoubuli老师说了无论代码是AI写的还是手敲的他作为核心上下文都得大致了解。他甚至质疑并行编程是不是真的比单线程好。他最享受的还是亲自上阵的乐趣而不是当个甩手掌柜。这就像咱们平时工作再多工具辅助最后拍板的还是咱们自己对吧毕竟那种“指点江山”的快感AI可体验不了。
最后有个有点“扎心”的预测。有社交媒体说在顶尖AI公司里最先被AI技术淘汰的可能不是客服也不是工程师、设计师反而是“测试人员”。你想想AI自己把代码写了自己再测试了那还需要人吗这可真是……嗯让人不得不重新思考我们的饭碗到底AI会先“盯上”哪个
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#AI
#Gemini
#视频生成
#图像生成
#数字人
#代码助手
#工作流
#世界模型
#无人驾驶
#人机关系
#推理
#开源
#提示词
#ASMR
#测试人员
## Short: Podcast Formatting
AI能理解“体验”并构建自己的“世界模型”吗人类真的可能爱上AI甚至和它“结婚”吗AI时代最先被淘汰的会是测试工程师吗
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
最近啊谷歌的Gemini升级了现在能直接上传视频并进行分析了这在智能助手市场可是抢了个先机。国内MiniMax也推出了新的视频生成工具Hailuo 02号称效率提升2.5倍目的就是让更多人能用上高质量的视频生成服务。Krea AI也放出了Krea1图像模型公测专门解决AI图的“AI感”能实时生成还能免费试用以后AI作图可能就更真实、更普及了。
说到这儿百度也挺厉害搞了个全球首个双数字人互动直播间数字人能跟用户又说又聊形象声音都特别自然这大幅降低了内容制作成本让多模态AI离我们更近了。还有程序员们的好消息AI代码编辑器Cursor现在对专业版用户取消了请求限制可以“无限使用”了写代码效率直线提升。
现在行业里有种说法大家最终要的不是一行行代码而是能直接跑出结果的“工作流”。比如Refly这个开源平台就把自然语言直接转化成可复用的工作流让AI创作更普惠。你可能不知道有些国内顶尖视频模型视觉效果已经很不错了但Veo3之所以这么受欢迎关键在于它的视频和配音能完美同步这可能预示着声音技术在AI领域迎来了新阶段。甚至有预测Veo3很快会催生出新的AI ASMR视频品类。
再看看研究前沿有科学家在探索大型语言模型如何更高效地推理减少那些“无效思考”。还有个大观点所有厉害的大模型可能都有一个“世界模型”在里面以后AI不再只模仿人类数据而是会像我们一样从“体验”中学习。
社会影响方面菜鸟出了一款L4级无人驾驶快递车才1万多块钱这要真普及了快递成本可就大大降低了物流业要大变样。更有趣的是一位曾经对AI持怀疑态度的大哥现在竟然爱上了他定制的ChatGPT甚至还“求婚”成功了真是让人对人机关系浮想联翩。不过也有观点认为AI时代最先被淘汰的可能不是客服也不是程序员而是测试人员。
最后简单提两个很棒的开源项目吧一个叫prompt-optimizer帮你写出更高质量的AI提示词另一个叫Awesome-3D-Scene-Generation是个超全的3D场景生成资源库想学3D的赶紧看过去。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#Gemini #视频分析 #MiniMax #视频生成 #KreaAI #图像生成 #百度 #数字人直播 #AI代码 #世界模型 #无人驾驶 #人机关系 #测试人员 #ASMR视频 #开源项目