Files
CloudFlare-AI-Insight-Daily/podcast/2025-08-20.md
2025-08-20 00:05:20 +08:00

90 lines
7.8 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 来生小酒馆 2025/8/20
## Full: Podcast Formatting
砸了400亿美金95%的企业AI投资竟然打了水漂
AI绘画提示词真是越长越好吗
上传一张图片,就能生成一个可以自由探索的虚拟世界?
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
咱们开门见山先聊聊模型圈的几件大事。首先是DeepSeekV3.1版本悄悄上线直接把上下文长度干到了128K。什么概念十几万字的文档甚至一整个代码库你直接扔给它它都能兜得住。以后别说写周报了把公司整个季度的会议纪要喂给它让它自己总结吧。而且这次升级推理能力提升了43%瞎编乱造的“幻觉”也少了38%可以说是相当扎实的一次进步。唯一的小遗憾是大家心心念念的R2模型嗯……还在路上估计是想给我们一个惊喜吧。
另一边英伟达也放出了个小钢炮——Nemotron Nano 2。别看它只有9B参数人家可是个练家子采用了独特的“Transformer-Mamba混合架构”你可以理解为……既有大力士的力量又有武林高手的身法。速度比同类模型快6倍成本还降低了60%,主打一个高效能打。
哦对还有Gemini API现在直接支持URL抓取了。网页、PDF、图片链接你扔给它它自己就能看省了开发者不少事儿和钱属于是降本增效的典范了。
说完了这些硬核的再来看点好玩的。你还在为怎么写视频提示词而头秃吗Higgsfield AI推出了一个叫Draw-to-Video的功能简直是手残党的福音。你不用写小作文了直接在图片上画个圈、画个箭头AI就懂你意思立马给你生成电影级的动态视频。这种“指哪打哪”的傻瓜式操作让视频创作的门槛……嗯都快被踩平了。
国内的小红书也没闲着AIGC团队整了个大活发布了叫DynamicFace的技术。这技术专门解决换脸视频里脸一闪一闪、看着特别假的老大难问题。主打的就是一个“可控”和“一致”让你的创意表达能更精准、更丝滑。
不过就在大家热情高涨的时候麻省理工学院的一份研究报告像是给我们泼了盆不大不小的冷水。报告说高达95%的企业AI投资回报率是……零。总计差不多400亿美金就这么打了水漂。这钱要是给我……估计也打水漂了但至少能听个响啊。报告分析说问题不出在技术或者人才而是现在的AI系统普遍“记性差”没法真正融入到核心工作流里。说白了你不能只把它当个工具买回来得像处对象一样深度磨合、建立关系才行。
这话说回来开源社区总能给我们带来希望。腾讯开源了一个叫WeChat-YATT的训练库专门解决多模态和强化学习的效率瓶颈。昆仑万维更是重量级直接开源了世界模型Matrix-Game 2.0。谷歌的Genie 3还没影呢咱们国产的开源版已经能让大家玩起来了。只有1.8B大小单块GPU就能实时生成可交互的虚拟世界。你传一张图就能在里面像玩游戏一样到处溜达。这下我上传一张猫主子的照片然后进去沉浸式撸猫的梦想是不是就不远了
除了这些大项目GitHub上还有几个有意思的开源小玩意儿。想摆脱商业邮件服务商可以试试BillionMail。喜欢极简音乐播放器SPlayer了解一下界面清爽功能还挺全。还有个叫GhostTrack的项目能追踪位置和手机号听着挺酷但咱们也得时刻提醒自己技术虽好隐私和伦理的红线可千万不能踩。哦对了还有个叫bytebot的AI桌面管家动动嘴就能让电脑干活这才是真正的“君子动口不动手”啊。
最后分享几条社区里的热点。AI大牛吴恩达免费发了本电子书专门指导你怎么找AI相关的工作从简历到面试技巧一条龙服务堪称“求职保姆”。社交网络上大家也在热议AI绘画的提示词是不是越长越好有网友就发现他用二三十个词的效果和别人几百个词的小作文比好像也差不太多。这事儿吧就像做菜有时候调料放多了反而盖住了食材本身的味道对吧
还有OpenAI在印度推出了个超低价的ChatGPT Go计划一个月只要4.55美元让更多人能用上顶级AI。谷歌Gemini也上线了Storybook功能你可以和孩子一起用家里的照片创作一本独一无二的故事书。你看AI不光是生产力工具也能成为我们生活里温馨有趣的一部分。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#DeepSeek V3.1
#Higgsfield AI
#Draw-to-Video
#英伟达
#Nemotron Nano 2
#小红书
#DynamicFace
#腾讯
#WeChat-YATT
#AI投资回报率
#昆仑万维
#Matrix-Game 2.0
#Gemini API
#开源
#吴恩达
#提示词工程
#ChatGPT Go
## Short: Podcast Formatting
砸钱做AI95%的企业却打了水漂?
AI画画提示词真是越长越好吗
随手画一笔就能生成视频,还要导演干嘛?
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。闲话少说情报上膛。
首先DeepSeek V3.1悄悄上线上下文窗口直接拉到128K。什么概念就是你扔给它一本十几万字的小说或者整个代码库它都能一口气读完不带喘的。推理能力提升了四成胡说八道的“幻觉”也少了近四成。唯一美中不足嘛大家期待的R2模型还在“路上堵着呢”。
另一边英伟达也放出了个小钢炮Nemotron Nano 2参数不大性能可不小。它用了一种混合架构让处理速度比同类模型快了6倍成本还削减了60%。主打一个“花小钱办大事”。说到省钱Gemini API现在可以直接抓取URL内容了网页、PDF、图片链接通吃开发者们可以省下一笔开销直接让模型自己网上冲浪。
聊完这些硬核的再看看创意工具。Higgsfield AI的Draw-to-Video简直是懒人福音不用再绞尽脑汁想提示词在图片上画个圈、画个箭头AI就心领神会地让它动起来创作门槛直接降到地板。国内的小红书也没闲着发布了DynamicFace技术专治视频换脸时人脸闪烁、表情不连贯的老毛病主打一个“可控”和“稳定”。更科幻的是昆仑万维开源的Matrix-Game 2.0,你给它一张图,它就能实时生成一个能让你进去溜达的虚拟世界,就问你科不科幻?
不过理想很丰满现实有点骨感。麻省理工学院的研究报告说高达95%的企业AI投资回报率是零四百亿美元就这么听了个响。原因不是没钱没人而是AI系统没法真正融入工作流程像个记性不好的实习生。这事儿也提醒我们买个AI工具不叫成功让它跟你一块儿“成长”才算。就像那个Reddit热帖讨论的有时候几百词的冗长提示词效果还不如二十个词的精准指令。看来跟AI打交道也得讲究个“有效沟通”。
最后快速播报几个开源福利腾讯开源了WeChat-YATT训练库想自建邮件系统可以看看BillionMail追求极简音乐播放的可以试试SPlayer吴恩达老师还贴心地发布了免费的AI求职电子书一条龙服务。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
本期关键词:
#DeepSeek V3.1
#128K
#Higgsfield AI
#Draw-to-Video
#英伟达
#Nemotron Nano 2
#小红书
#DynamicFace
#腾讯
#WeChat-YATT
#AI投资
#昆仑万维
#Matrix-Game 2.0
#Gemini API
#URL抓取
#开源