Files
CloudFlare-AI-Insight-Daily/podcast/2025-10-11.md
2025-10-10 22:51:30 +08:00

7.8 KiB
Raw Blame History

来生小酒馆 2025/10/11

Full: Podcast Formatting

AI视频生成未来会比真人演员演得更好吗 国资大手笔投资端侧大模型,是不是意味着我们的手机很快就能拥有“超级大脑”了? AI技术都这么强大了为什么企业在落地的时候最大的难题竟然是“沟通”

亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。

今天啊AI圈简直是热闹非凡感觉每一项新闻都在喊话未来的世界真的不远了

咱们先从“表演艺术”聊起。以前说AI视频生成大家可能觉得也就是能动起来表情嘛有点僵硬。但现在一个叫GAGA-1的新模型横空出世了据说它在人物对话和表演细节上取得了突破连微表情都能刻画得栩栩如生甚至有评论说它比Sora2做得还好我的天AI都开始卷演技了以后奥斯卡影帝会不会是个AI想想都有点激动呢而且它现在已经开放免费试用了感兴趣的朋友可以去感受一下看看AI到底能“演”到什么程度。

说到“解放双手”,科研圈的朋友们有福了。现在有一个叫PaperTalker的框架能自动把你的科研论文变成带虚拟人讲解的视频想想看你辛辛苦苦写完一篇论文一键生成一个虚拟小助理帮你讲PPT语音合成、幻灯片制作一条龙服务。这简直是学者们的福音啊以后做学术报告是不是可以把更多精力放在研究本身而不是怎么把报告做得花里胡哨了

这边厢是虚拟人要抢饭碗那边厢是国家队也开始入场了。端侧AI赛道最近可是热火朝天面壁智能获得了北京国资领投的数亿元融资要加速他们在端侧大模型上的研发和商业化。他们追求的是更高的“知识密度”让AI能在手机、汽车这些资源有限的设备上跑起来。听说已经和吉利、华为这些大厂深度合作了以后你的智能汽车是不是就更懂你了甚至可能比你老婆还懂你……开个玩笑哈。

当然了这一切都离不开强大的算力。英伟达CEO黄仁勋最近又出来“放火”了他说在过去六个月里AI计算需求出现了“大幅增长”。这话一出全球的AI军备竞赛这火药味就更浓了。看来AI时代的“淘金热”啊卖“铲子”的英伟达依旧是那个最大的赢家。

不过AI这股风吹得再猛企业在落地的时候也不是一帆风顺的。谷歌最近不是推出了Gemini Enterprise但有观点就说了企业最大的挑战不是模型不够强大而是怎么把AI“无缝对接”到现有的工作流和系统里去。你看技术再好也要能跟老系统“和睦相处”这不就像咱们平时工作新旧同事之间也得磨合磨合才能配合默契嘛。

除了这些还有一些有趣的消息。快手团队的AI编程猛将KAT-Coder在编程权威榜单SWE-bench上取得了优异成绩现在还在免费试用阶段开发者们赶紧去体验一下看看AI能帮你写出多“丝滑”的代码。扩散模型领域也出了个新猛将叫RND1性能刷新了同类模型的上限感兴趣的可以去Hugging Face上感受一下它的威力。

在AI营销方面Anthropic就挺有意思的他们在纽约街头搞了个“零废话区”的快闪活动鼓励大家用纸笔思考这不就是用“反AI”的方式来推广自己的Claude模型吗这波操作啊既吸睛又凸显了他们对“高质量AI”的追求营销鬼才佩服佩服。

还有啊AI工作流自动化平台n8n最近完成了1.8亿美元的C轮融资连英伟达都来投资了。这说明什么AI不光要能干活还得会“排兵布阵”把复杂的AI模型和业务流程协调起来这可是未来的刚需啊。

开源社区这边也没闲着。有大神在小小的ESP32芯片上做出了聊天机器人xiaozhi-esp32,物联网设备也能跟你唠嗑了。微软也开源了一个叫R&D-Agent的工具想把AI研发流程自动化这简直是研发人员的“智能副驾”啊。另外supermemory项目则为AI应用提供了“超级记忆”引擎让AI再也不会“金鱼脑”了。对了还有个火爆的大麦网抢票脚本,这里就不多说了,大家合理使用,技术是中立的哦。

最后咱们再看看几个有意思的社媒分享。有人用AI总结了11万字的故事,效果出奇地好,这不就是信息过载时代的“速读”神器吗?还有一张图表,直观地展示了ChatGPT的惊人增长速度互联网用了13年才达到8亿用户它只用了2年这速度真是让人感叹我们正站在一个前所未有的技术变革浪潮之巅啊。当然了也有开发者在吐槽LLM的Token消耗问题抱怨AI会变身“Token刺客”无故飙升10倍看来AI用起来除了好用还得会省钱啊这才是硬道理。

今天的情报就到这里,注意隐蔽,赶紧撤离!

本期关键词: #AI视频生成 #GAGA-1 #科研自动化 #PaperTalker #端侧大模型 #面壁智能 #英伟达 #AI算力 #企业AI #KAT-Coder #RND1 #NL-FLHybridReasoning #赛力斯 #火山引擎 #Anthropic #n8n #GeminiEnterprise #开源项目 #ChatGPT #Token刺客

Short: Podcast Formatting

AI真能学会“演戏”吗AI落地为什么总是“水土不服”我们是否低估了AI改变世界的速度亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天咱们聊聊AI的最新动态保证有料又有趣

最近AI视频生成又玩出了新花样GAGA-1模型居然开始卷“演技”了它能精细刻画人物对话和表演连微表情都不放过据说在细节上超越了Sora2。看来未来虚拟人不仅能动还能是个影帝呢。

科研界也有福利一个叫Paper2Video的项目首次实现了从论文自动生成带虚拟人讲解的视频。以后发论文顺便连视频讲解都给你一键生成学者们终于可以从繁琐的视频制作中解放双手了。

端侧AI赛道也是热闹非凡。面壁智能获得了数亿元国资融资要深耕“知识密度”更高的端侧大模型让AI在手机、汽车上也能跑得飞快又安全。想象一下你的车有了“灵魂”是不是有点小期待

说到AI就绕不开算力。英伟达CEO黄仁勋亲口证实过去半年AI算力需求“大幅增长”全球AI军备竞赛如火如荼。这AI淘金热里卖铲子的英伟达依然是最大赢家。

不过AI再强落地也是个大问题。谷歌的Gemini Enterprise想深入企业腹地但普遍的困境是AI模型怎么才能无缝衔接到企业现有的工作流和系统里看来光有模型还不行还得会“搭桥引线”才行。

另外快手的AI编程猛将KAT-Coder在权威测试中取得了优异成绩现在能免费试用。开发者们是时候去感受一下AI编程的魅力了。扩散模型领域也出了个RND1刷新了同类模型上限技术进步的速度真是让人惊叹。

最后一个数据让人深思互联网用了13年才达到8亿周活用户而ChatGPT只用了短短2年这速度简直是坐上了火箭。但有意思的是有开发者吐槽LLM调用成本像“Token刺客”经常莫名飙升尤其链式调用时成本控制成了现实挑战。看来AI虽好但也不是免费的午餐啊。

今天的情报就到这里,注意隐蔽,赶紧撤离!

本期关键词: #AI视频 #GAGA-1 #论文视频 #PaperTalker #端侧大模型 #面壁智能 #英伟达 #AI算力 #工作流整合 #KAT-Coder #RND1 #具身智能 #Anthropic #n8n #ChatGPT #Token刺客 #AI总结