Create podcast script file for 2025-09-13

This commit is contained in:
何夕2077
2025-09-12 23:31:47 +08:00
parent 2e4ca60cf8
commit 0cac608572

78
podcast/2025-09-13.md Normal file
View File

@@ -0,0 +1,78 @@
# 来生小酒馆 2025/9/13
## Full: Podcast Formatting
AI写歌是解放了谁的生产力
模型越大就越好吗?
免费的午餐,最终该由谁买单?
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。最近的AI圈啊那叫一个热闹感觉每天都有新花样。咱们今天就来盘点一下看看这些科技巨头们又在整什么活儿。
先说说字节跳动吧这次是真不客气直接甩了个王炸叫Seedream 4.0。刚发出来就在“文生图”和“图像编辑”这两个全球权威榜单上拿了第一把谷歌那个……嗯叫什么来着哦对Nano Banana给甩身后了。这模型厉害在哪呢它能直接给你整出原生4K的高清大图还能把最多10张照片天衣无缝地拼在一起。最关键的是你知道吧AI画图最头疼的中文写字问题它处理得相当不错。现在火山方舟上已经可以免费体验了以后什么电影分镜、动漫连环画感觉门槛都要被踩没了。
说完画画再聊聊音乐。MiniMax也放了个大招叫Music 1.5。以前AI写歌怎么说呢顶多算是个demo小样哼个旋律就不错了。现在这个Music 1.5一出来,直接给你生成一首长达四分钟的……完整的歌!对,你没听错,编曲、人声、结构都像模像样。以后别再说自己五音不全了,打开官网,输入几句歌词,下一首热门单曲可能就出自你我之手了。这可真是“一人即乐队”的时代啊。
除了这些文娱产品咱们的日常生活也被安排得明明白白。支付宝那个健康管家AQ现在是越来越神了。你对着手机自拍一张它“唰”一下就能给你一份皮肤分析报告顺便还给点护肤建议。还能看舌苔测体质拍头发查脱发风险……我寻思再这么下去我每年体检的钱是不是都能省了而且它还跟中国移动合作搞了个“AI防骗专线”专门守护咱爸妈的健康和钱包这个得点个赞。
对了还有几个技术圈的消息也很有意思。蚂蚁集团跟人大联合搞了个叫LLaDA-MoE的东西听着很绕口是吧简单说这是业界第一个原生的MoE扩散模型。这个MoE你可以理解成一个“专家混合团队”让模型里的不同部分干自己最擅长的事效率特别高。他们用了一个很形象的比喻说这就像“教会一个奥数冠军倒着背诗”解决了AI一个老大难的“反转诅咒”问题。结果呢一个只有1.4B参数的小模型性能居然能跟3B的大模型掰手腕速度还更快。这说明啊模型不一定非要傻大黑粗。
这个观点港科大和MiniMax的另一个研究也证明了。他们发现AI在网上搜东西的时候老犯迷糊不是模型不够大是训练数据不够“刁钻”。于是他们搞了个叫WebExplorer的框架专门给AI定制了一套高强度“脑力健身”计划。结果你猜怎么着一个8B参数的小模型在好几个测试里把72B的大模型都给超了。所以说数据质量有时候真的比模型规模更重要。
说到这儿我想起最近网上有个讨论特别火。一个开发者做了个Trello的小插件免费的时候三万用户把他夸上了天可当他标价每月10美元也就两杯咖啡的钱吧用户呼啦一下全跑了。这位老哥含泪总结免费的午餐一旦吃习惯了再想让人掏钱那真是比登天还难。所以啊这跟咱们纠结用哪个大模型一个道理有博主就说了对大多数人来说现在主流模型的智能水平早就“超纲”了日常用用完全足够别再有“模型选择困难症”了用好手里的那一个比啥都强。
最后给开发者朋友们推荐几个好玩的开源项目。比如那个超火的developer-roadmap简直是程序员的职业生涯地图还有个叫codebuff的工具能让你在命令行里直接写代码跟使唤神灯精灵一样。当然最受关注的还是一个叫HuMo的视频生成框架专门做以人为中心的视频以后估计咱们都能当导演了。
你看,技术就是这样,一边在飞速发展,一边又在悄悄改变我们的生活和观念。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#Seedream4.0
#Music1.5
#LLaDA-MoE
#WebExplorer
#MoE
#文生图
#音乐生成
#支付宝
#Claude
#数据质量
#开源
#免费模式
#AI防骗
## Short: Podcast Formatting
AI写歌以后KTV新歌榜会是什么样
小模型也能干翻大模型,是不是不用死磕算力了?
免费产品一旦收费用户就跑光,这生意还怎么做?
三问炼心亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。情报已到咱们长话短说。
先聊聊“卷王”字节跳动他们刚发布的Seedream 4.0一出场就把谷歌那个叫“纳米香蕉”的模型给比了下去直接登顶了文生图和图像编辑两大全球榜单。这玩意儿不仅能直接生成4K高清大图还能把最多10张图片无缝融合最关键的是在老大难的中文文字渲染上效果相当不错。现在火山方舟上可以免费体验感觉离人人都能做电影分镜不远了。
看完图再来听个曲儿。MiniMax也放出了大招他们的Music 1.5不再是只能生成30秒小样了现在能直接创作长达4分钟的完整歌曲从人声到编曲都像模像样。以后咱们普通人想发单曲可能真的只需要动动嘴皮子编排下歌词就行。
你可能觉得这些模型肯定是越大越好。诶先别急着下结论。最近一项新研究就提出只要给模型喂的数据质量够高训练方法够“刁钻”一个80亿参数的小个子照样能在特定任务上超越720亿参数的大块头。这说明啥以后AI竞赛可能不光是比谁块头大还得比谁的“食谱”更精良。
同样在技术路线上搞创新的还有蚂蚁集团他们联合发布了业界首个原生MoE扩散模型LLaDA-MoE。简单理解就是教会了AI“倒着想问题”用更小的模型跑出了更快的速度而且很快就要开源了。
当然AI也没忘了走进咱们的生活。支付宝的AI健康管家现在能让你拍张照就分析肤质、看舌苔简直是手机里的赛博老中医。另一边Anthropic的Claude也终于学会了“记事儿”能记住特定项目的上下文办公协作效率估计又能提一提了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#Seedream4.0
#Music1.5
#LLaDA-MoE
#WebExplorer
#字节跳动
#MiniMax
#蚂蚁集团
#文生图
#音乐生成
#高质量数据
#MoE
#Claude
#支付宝