From e97f26710164e0ed71c48e93792760d4bd53fb5f Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E4=BD=95=E5=A4=952077?= <274166795@qq.com> Date: Wed, 20 Aug 2025 00:05:20 +0800 Subject: [PATCH] Create podcast script file for 2025-08-20 --- podcast/2025-08-20.md | 90 +++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 90 insertions(+) create mode 100644 podcast/2025-08-20.md diff --git a/podcast/2025-08-20.md b/podcast/2025-08-20.md new file mode 100644 index 0000000..34c6848 --- /dev/null +++ b/podcast/2025-08-20.md @@ -0,0 +1,90 @@ +# 来生小酒馆 2025/8/20 + +## Full: Podcast Formatting + +砸了400亿美金,95%的企业AI投资竟然打了水漂? +AI绘画,提示词真是越长越好吗? +上传一张图片,就能生成一个可以自由探索的虚拟世界? + +三问炼心,嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。 + +咱们开门见山,先聊聊模型圈的几件大事。首先是DeepSeek,V3.1版本悄悄上线,直接把上下文长度干到了128K。什么概念?十几万字的文档,甚至一整个代码库,你直接扔给它,它都能兜得住。以后别说写周报了,把公司整个季度的会议纪要喂给它,让它自己总结吧。而且这次升级,推理能力提升了43%,瞎编乱造的“幻觉”也少了38%,可以说是相当扎实的一次进步。唯一的小遗憾是,大家心心念念的R2模型,嗯……还在路上,估计是想给我们一个惊喜吧。 + +另一边,英伟达也放出了个小钢炮——Nemotron Nano 2。别看它只有9B参数,人家可是个练家子,采用了独特的“Transformer-Mamba混合架构”,你可以理解为……既有大力士的力量,又有武林高手的身法。速度比同类模型快6倍,成本还降低了60%,主打一个高效能打。 + +哦对,还有Gemini API,现在直接支持URL抓取了。网页、PDF、图片链接,你扔给它,它自己就能看,省了开发者不少事儿和钱,属于是降本增效的典范了。 + +说完了这些硬核的,再来看点好玩的。你还在为怎么写视频提示词而头秃吗?Higgsfield AI推出了一个叫Draw-to-Video的功能,简直是手残党的福音。你不用写小作文了,直接在图片上画个圈、画个箭头,AI就懂你意思,立马给你生成电影级的动态视频。这种“指哪打哪”的傻瓜式操作,让视频创作的门槛……嗯,都快被踩平了。 + +国内的小红书也没闲着,AIGC团队整了个大活,发布了叫DynamicFace的技术。这技术专门解决换脸视频里,脸一闪一闪、看着特别假的老大难问题。主打的就是一个“可控”和“一致”,让你的创意表达能更精准、更丝滑。 + +不过,就在大家热情高涨的时候,麻省理工学院的一份研究报告,像是给我们泼了盆不大不小的冷水。报告说,高达95%的企业,AI投资回报率是……零。总计差不多400亿美金,就这么打了水漂。这钱要是给我……估计也打水漂了,但至少能听个响啊。报告分析说,问题不出在技术或者人才,而是现在的AI系统普遍“记性差”,没法真正融入到核心工作流里。说白了,你不能只把它当个工具买回来,得像处对象一样,深度磨合、建立关系才行。 + +这话说回来,开源社区总能给我们带来希望。腾讯开源了一个叫WeChat-YATT的训练库,专门解决多模态和强化学习的效率瓶颈。昆仑万维更是重量级,直接开源了世界模型Matrix-Game 2.0。谷歌的Genie 3还没影呢,咱们国产的开源版已经能让大家玩起来了。只有1.8B大小,单块GPU就能实时生成可交互的虚拟世界。你传一张图,就能在里面像玩游戏一样到处溜达。这下,我上传一张猫主子的照片,然后进去沉浸式撸猫的梦想,是不是就不远了? + +除了这些大项目,GitHub上还有几个有意思的开源小玩意儿。想摆脱商业邮件服务商?可以试试BillionMail。喜欢极简音乐播放器?SPlayer了解一下,界面清爽功能还挺全。还有个叫GhostTrack的项目,能追踪位置和手机号,听着挺酷,但咱们也得时刻提醒自己,技术虽好,隐私和伦理的红线可千万不能踩。哦,对了,还有个叫bytebot的AI桌面管家,动动嘴就能让电脑干活,这才是真正的“君子动口不动手”啊。 + +最后,分享几条社区里的热点。AI大牛吴恩达免费发了本电子书,专门指导你怎么找AI相关的工作,从简历到面试技巧,一条龙服务,堪称“求职保姆”。社交网络上大家也在热议,AI绘画的提示词是不是越长越好?有网友就发现,他用二三十个词的效果,和别人几百个词的小作文比,好像也差不太多。这事儿吧,就像做菜,有时候调料放多了,反而盖住了食材本身的味道,对吧? + +还有,OpenAI在印度推出了个超低价的ChatGPT Go计划,一个月只要4.55美元,让更多人能用上顶级AI。谷歌Gemini也上线了Storybook功能,你可以和孩子一起,用家里的照片创作一本独一无二的故事书。你看,AI不光是生产力工具,也能成为我们生活里温馨有趣的一部分。 + +今天的情报就到这里,注意隐蔽,赶紧撤离。 + +--- +**本期关键词:** +#DeepSeek V3.1 +#Higgsfield AI +#Draw-to-Video +#英伟达 +#Nemotron Nano 2 +#小红书 +#DynamicFace +#腾讯 +#WeChat-YATT +#AI投资回报率 +#昆仑万维 +#Matrix-Game 2.0 +#Gemini API +#开源 +#吴恩达 +#提示词工程 +#ChatGPT Go + +## Short: Podcast Formatting + +砸钱做AI,95%的企业却打了水漂? +AI画画,提示词真是越长越好吗? +随手画一笔就能生成视频,还要导演干嘛? + +三问炼心,嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。闲话少说,情报上膛。 + +首先,DeepSeek V3.1悄悄上线,上下文窗口直接拉到128K。什么概念?就是你扔给它一本十几万字的小说或者整个代码库,它都能一口气读完,不带喘的。推理能力提升了四成,胡说八道的“幻觉”也少了近四成。唯一美中不足嘛,大家期待的R2模型还在“路上堵着呢”。 + +另一边,英伟达也放出了个小钢炮Nemotron Nano 2,参数不大,性能可不小。它用了一种混合架构,让处理速度比同类模型快了6倍,成本还削减了60%。主打一个“花小钱,办大事”。说到省钱,Gemini API现在可以直接抓取URL内容了,网页、PDF、图片链接通吃,开发者们可以省下一笔开销,直接让模型自己网上冲浪。 + +聊完这些硬核的,再看看创意工具。Higgsfield AI的Draw-to-Video简直是懒人福音,不用再绞尽脑汁想提示词,在图片上画个圈、画个箭头,AI就心领神会地让它动起来,创作门槛直接降到地板。国内的小红书也没闲着,发布了DynamicFace技术,专治视频换脸时人脸闪烁、表情不连贯的老毛病,主打一个“可控”和“稳定”。更科幻的是昆仑万维开源的Matrix-Game 2.0,你给它一张图,它就能实时生成一个能让你进去溜达的虚拟世界,就问你科不科幻? + +不过,理想很丰满,现实有点骨感。麻省理工学院的研究报告说,高达95%的企业AI投资回报率是零,四百亿美元就这么听了个响。原因不是没钱没人,而是AI系统没法真正融入工作流程,像个记性不好的实习生。这事儿也提醒我们,买个AI工具不叫成功,让它跟你一块儿“成长”才算。就像那个Reddit热帖讨论的,有时候几百词的冗长提示词,效果还不如二十个词的精准指令。看来,跟AI打交道,也得讲究个“有效沟通”。 + +最后,快速播报几个开源福利:腾讯开源了WeChat-YATT训练库;想自建邮件系统可以看看BillionMail;追求极简音乐播放的可以试试SPlayer;吴恩达老师还贴心地发布了免费的AI求职电子书,一条龙服务。 + +今天的情报就到这里,注意隐蔽,赶紧撤离。 + +--- +本期关键词: +#DeepSeek V3.1 +#128K +#Higgsfield AI +#Draw-to-Video +#英伟达 +#Nemotron Nano 2 +#小红书 +#DynamicFace +#腾讯 +#WeChat-YATT +#AI投资 +#昆仑万维 +#Matrix-Game 2.0 +#Gemini API +#URL抓取 +#开源 \ No newline at end of file