Create podcast script file for 2025-08-20
This commit is contained in:
90
podcast/2025-08-20.md
Normal file
90
podcast/2025-08-20.md
Normal file
@@ -0,0 +1,90 @@
|
||||
# 来生小酒馆 2025/8/20
|
||||
|
||||
## Full: Podcast Formatting
|
||||
|
||||
砸了400亿美金,95%的企业AI投资竟然打了水漂?
|
||||
AI绘画,提示词真是越长越好吗?
|
||||
上传一张图片,就能生成一个可以自由探索的虚拟世界?
|
||||
|
||||
三问炼心,嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。
|
||||
|
||||
咱们开门见山,先聊聊模型圈的几件大事。首先是DeepSeek,V3.1版本悄悄上线,直接把上下文长度干到了128K。什么概念?十几万字的文档,甚至一整个代码库,你直接扔给它,它都能兜得住。以后别说写周报了,把公司整个季度的会议纪要喂给它,让它自己总结吧。而且这次升级,推理能力提升了43%,瞎编乱造的“幻觉”也少了38%,可以说是相当扎实的一次进步。唯一的小遗憾是,大家心心念念的R2模型,嗯……还在路上,估计是想给我们一个惊喜吧。
|
||||
|
||||
另一边,英伟达也放出了个小钢炮——Nemotron Nano 2。别看它只有9B参数,人家可是个练家子,采用了独特的“Transformer-Mamba混合架构”,你可以理解为……既有大力士的力量,又有武林高手的身法。速度比同类模型快6倍,成本还降低了60%,主打一个高效能打。
|
||||
|
||||
哦对,还有Gemini API,现在直接支持URL抓取了。网页、PDF、图片链接,你扔给它,它自己就能看,省了开发者不少事儿和钱,属于是降本增效的典范了。
|
||||
|
||||
说完了这些硬核的,再来看点好玩的。你还在为怎么写视频提示词而头秃吗?Higgsfield AI推出了一个叫Draw-to-Video的功能,简直是手残党的福音。你不用写小作文了,直接在图片上画个圈、画个箭头,AI就懂你意思,立马给你生成电影级的动态视频。这种“指哪打哪”的傻瓜式操作,让视频创作的门槛……嗯,都快被踩平了。
|
||||
|
||||
国内的小红书也没闲着,AIGC团队整了个大活,发布了叫DynamicFace的技术。这技术专门解决换脸视频里,脸一闪一闪、看着特别假的老大难问题。主打的就是一个“可控”和“一致”,让你的创意表达能更精准、更丝滑。
|
||||
|
||||
不过,就在大家热情高涨的时候,麻省理工学院的一份研究报告,像是给我们泼了盆不大不小的冷水。报告说,高达95%的企业,AI投资回报率是……零。总计差不多400亿美金,就这么打了水漂。这钱要是给我……估计也打水漂了,但至少能听个响啊。报告分析说,问题不出在技术或者人才,而是现在的AI系统普遍“记性差”,没法真正融入到核心工作流里。说白了,你不能只把它当个工具买回来,得像处对象一样,深度磨合、建立关系才行。
|
||||
|
||||
这话说回来,开源社区总能给我们带来希望。腾讯开源了一个叫WeChat-YATT的训练库,专门解决多模态和强化学习的效率瓶颈。昆仑万维更是重量级,直接开源了世界模型Matrix-Game 2.0。谷歌的Genie 3还没影呢,咱们国产的开源版已经能让大家玩起来了。只有1.8B大小,单块GPU就能实时生成可交互的虚拟世界。你传一张图,就能在里面像玩游戏一样到处溜达。这下,我上传一张猫主子的照片,然后进去沉浸式撸猫的梦想,是不是就不远了?
|
||||
|
||||
除了这些大项目,GitHub上还有几个有意思的开源小玩意儿。想摆脱商业邮件服务商?可以试试BillionMail。喜欢极简音乐播放器?SPlayer了解一下,界面清爽功能还挺全。还有个叫GhostTrack的项目,能追踪位置和手机号,听着挺酷,但咱们也得时刻提醒自己,技术虽好,隐私和伦理的红线可千万不能踩。哦,对了,还有个叫bytebot的AI桌面管家,动动嘴就能让电脑干活,这才是真正的“君子动口不动手”啊。
|
||||
|
||||
最后,分享几条社区里的热点。AI大牛吴恩达免费发了本电子书,专门指导你怎么找AI相关的工作,从简历到面试技巧,一条龙服务,堪称“求职保姆”。社交网络上大家也在热议,AI绘画的提示词是不是越长越好?有网友就发现,他用二三十个词的效果,和别人几百个词的小作文比,好像也差不太多。这事儿吧,就像做菜,有时候调料放多了,反而盖住了食材本身的味道,对吧?
|
||||
|
||||
还有,OpenAI在印度推出了个超低价的ChatGPT Go计划,一个月只要4.55美元,让更多人能用上顶级AI。谷歌Gemini也上线了Storybook功能,你可以和孩子一起,用家里的照片创作一本独一无二的故事书。你看,AI不光是生产力工具,也能成为我们生活里温馨有趣的一部分。
|
||||
|
||||
今天的情报就到这里,注意隐蔽,赶紧撤离。
|
||||
|
||||
---
|
||||
**本期关键词:**
|
||||
#DeepSeek V3.1
|
||||
#Higgsfield AI
|
||||
#Draw-to-Video
|
||||
#英伟达
|
||||
#Nemotron Nano 2
|
||||
#小红书
|
||||
#DynamicFace
|
||||
#腾讯
|
||||
#WeChat-YATT
|
||||
#AI投资回报率
|
||||
#昆仑万维
|
||||
#Matrix-Game 2.0
|
||||
#Gemini API
|
||||
#开源
|
||||
#吴恩达
|
||||
#提示词工程
|
||||
#ChatGPT Go
|
||||
|
||||
## Short: Podcast Formatting
|
||||
|
||||
砸钱做AI,95%的企业却打了水漂?
|
||||
AI画画,提示词真是越长越好吗?
|
||||
随手画一笔就能生成视频,还要导演干嘛?
|
||||
|
||||
三问炼心,嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。闲话少说,情报上膛。
|
||||
|
||||
首先,DeepSeek V3.1悄悄上线,上下文窗口直接拉到128K。什么概念?就是你扔给它一本十几万字的小说或者整个代码库,它都能一口气读完,不带喘的。推理能力提升了四成,胡说八道的“幻觉”也少了近四成。唯一美中不足嘛,大家期待的R2模型还在“路上堵着呢”。
|
||||
|
||||
另一边,英伟达也放出了个小钢炮Nemotron Nano 2,参数不大,性能可不小。它用了一种混合架构,让处理速度比同类模型快了6倍,成本还削减了60%。主打一个“花小钱,办大事”。说到省钱,Gemini API现在可以直接抓取URL内容了,网页、PDF、图片链接通吃,开发者们可以省下一笔开销,直接让模型自己网上冲浪。
|
||||
|
||||
聊完这些硬核的,再看看创意工具。Higgsfield AI的Draw-to-Video简直是懒人福音,不用再绞尽脑汁想提示词,在图片上画个圈、画个箭头,AI就心领神会地让它动起来,创作门槛直接降到地板。国内的小红书也没闲着,发布了DynamicFace技术,专治视频换脸时人脸闪烁、表情不连贯的老毛病,主打一个“可控”和“稳定”。更科幻的是昆仑万维开源的Matrix-Game 2.0,你给它一张图,它就能实时生成一个能让你进去溜达的虚拟世界,就问你科不科幻?
|
||||
|
||||
不过,理想很丰满,现实有点骨感。麻省理工学院的研究报告说,高达95%的企业AI投资回报率是零,四百亿美元就这么听了个响。原因不是没钱没人,而是AI系统没法真正融入工作流程,像个记性不好的实习生。这事儿也提醒我们,买个AI工具不叫成功,让它跟你一块儿“成长”才算。就像那个Reddit热帖讨论的,有时候几百词的冗长提示词,效果还不如二十个词的精准指令。看来,跟AI打交道,也得讲究个“有效沟通”。
|
||||
|
||||
最后,快速播报几个开源福利:腾讯开源了WeChat-YATT训练库;想自建邮件系统可以看看BillionMail;追求极简音乐播放的可以试试SPlayer;吴恩达老师还贴心地发布了免费的AI求职电子书,一条龙服务。
|
||||
|
||||
今天的情报就到这里,注意隐蔽,赶紧撤离。
|
||||
|
||||
---
|
||||
本期关键词:
|
||||
#DeepSeek V3.1
|
||||
#128K
|
||||
#Higgsfield AI
|
||||
#Draw-to-Video
|
||||
#英伟达
|
||||
#Nemotron Nano 2
|
||||
#小红书
|
||||
#DynamicFace
|
||||
#腾讯
|
||||
#WeChat-YATT
|
||||
#AI投资
|
||||
#昆仑万维
|
||||
#Matrix-Game 2.0
|
||||
#Gemini API
|
||||
#URL抓取
|
||||
#开源
|
||||
Reference in New Issue
Block a user