Create podcast script file for 2025-09-13
This commit is contained in:
78
podcast/2025-09-13.md
Normal file
78
podcast/2025-09-13.md
Normal file
@@ -0,0 +1,78 @@
|
||||
# 来生小酒馆 2025/9/13
|
||||
|
||||
## Full: Podcast Formatting
|
||||
|
||||
AI写歌,是解放了谁的生产力?
|
||||
模型越大就越好吗?
|
||||
免费的午餐,最终该由谁买单?
|
||||
|
||||
嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。最近的AI圈啊,那叫一个热闹,感觉每天都有新花样。咱们今天就来盘点一下,看看这些科技巨头们又在整什么活儿。
|
||||
|
||||
先说说字节跳动吧,这次是真不客气,直接甩了个王炸叫Seedream 4.0。刚发出来,就在“文生图”和“图像编辑”这两个全球权威榜单上拿了第一,把谷歌那个……嗯,叫什么来着,哦对,Nano Banana,给甩身后了。这模型厉害在哪呢?它能直接给你整出原生4K的高清大图,还能把最多10张照片天衣无缝地拼在一起。最关键的是,你知道吧,AI画图最头疼的中文写字问题,它处理得相当不错。现在火山方舟上已经可以免费体验了,以后什么电影分镜、动漫连环画,感觉门槛都要被踩没了。
|
||||
|
||||
说完画画,再聊聊音乐。MiniMax也放了个大招,叫Music 1.5。以前AI写歌,怎么说呢,顶多算是个demo小样,哼个旋律就不错了。现在这个Music 1.5一出来,直接给你生成一首长达四分钟的……完整的歌!对,你没听错,编曲、人声、结构都像模像样。以后别再说自己五音不全了,打开官网,输入几句歌词,下一首热门单曲可能就出自你我之手了。这可真是“一人即乐队”的时代啊。
|
||||
|
||||
诶,除了这些文娱产品,咱们的日常生活也被安排得明明白白。支付宝那个健康管家AQ,现在是越来越神了。你对着手机自拍一张,它“唰”一下就能给你一份皮肤分析报告,顺便还给点护肤建议。还能看舌苔测体质,拍头发查脱发风险……我寻思再这么下去,我每年体检的钱是不是都能省了?而且它还跟中国移动合作搞了个“AI防骗专线”,专门守护咱爸妈的健康和钱包,这个得点个赞。
|
||||
|
||||
对了,还有几个技术圈的消息也很有意思。蚂蚁集团跟人大联合搞了个叫LLaDA-MoE的东西,听着很绕口是吧?简单说,这是业界第一个原生的MoE扩散模型。这个MoE,你可以理解成一个“专家混合团队”,让模型里的不同部分干自己最擅长的事,效率特别高。他们用了一个很形象的比喻,说这就像“教会一个奥数冠军倒着背诗”,解决了AI一个老大难的“反转诅咒”问题。结果呢?一个只有1.4B参数的小模型,性能居然能跟3B的大模型掰手腕,速度还更快。这说明啊,模型不一定非要傻大黑粗。
|
||||
|
||||
这个观点,港科大和MiniMax的另一个研究也证明了。他们发现AI在网上搜东西的时候老犯迷糊,不是模型不够大,是训练数据不够“刁钻”。于是他们搞了个叫WebExplorer的框架,专门给AI定制了一套高强度“脑力健身”计划。结果你猜怎么着?一个8B参数的小模型,在好几个测试里,把72B的大模型都给超了。所以说,数据质量,有时候真的比模型规模更重要。
|
||||
|
||||
说到这儿,我想起最近网上有个讨论特别火。一个开发者做了个Trello的小插件,免费的时候,三万用户把他夸上了天;可当他标价每月10美元,也就两杯咖啡的钱吧,用户呼啦一下全跑了。这位老哥含泪总结:免费的午餐一旦吃习惯了,再想让人掏钱,那真是比登天还难。所以啊,这跟咱们纠结用哪个大模型一个道理,有博主就说了,对大多数人来说,现在主流模型的智能水平早就“超纲”了,日常用用完全足够,别再有“模型选择困难症”了,用好手里的那一个比啥都强。
|
||||
|
||||
最后,给开发者朋友们推荐几个好玩的开源项目。比如那个超火的developer-roadmap,简直是程序员的职业生涯地图;还有个叫codebuff的工具,能让你在命令行里直接写代码,跟使唤神灯精灵一样。当然,最受关注的还是一个叫HuMo的视频生成框架,专门做以人为中心的视频,以后估计咱们都能当导演了。
|
||||
|
||||
你看,技术就是这样,一边在飞速发展,一边又在悄悄改变我们的生活和观念。
|
||||
|
||||
今天的情报就到这里,注意隐蔽,赶紧撤离。
|
||||
|
||||
---
|
||||
**本期关键词:**
|
||||
#Seedream4.0
|
||||
#Music1.5
|
||||
#LLaDA-MoE
|
||||
#WebExplorer
|
||||
#MoE
|
||||
#文生图
|
||||
#音乐生成
|
||||
#支付宝
|
||||
#Claude
|
||||
#数据质量
|
||||
#开源
|
||||
#免费模式
|
||||
#AI防骗
|
||||
|
||||
## Short: Podcast Formatting
|
||||
|
||||
AI写歌,以后KTV新歌榜会是什么样?
|
||||
小模型也能干翻大模型,是不是不用死磕算力了?
|
||||
免费产品一旦收费用户就跑光,这生意还怎么做?
|
||||
|
||||
三问炼心,嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。情报已到,咱们长话短说。
|
||||
|
||||
先聊聊“卷王”字节跳动,他们刚发布的Seedream 4.0,一出场就把谷歌那个叫“纳米香蕉”的模型给比了下去,直接登顶了文生图和图像编辑两大全球榜单。这玩意儿不仅能直接生成4K高清大图,还能把最多10张图片无缝融合,最关键的是,在老大难的中文文字渲染上效果相当不错。现在火山方舟上可以免费体验,感觉离人人都能做电影分镜不远了。
|
||||
|
||||
看完图,再来听个曲儿。MiniMax也放出了大招,他们的Music 1.5不再是只能生成30秒小样了,现在能直接创作长达4分钟的完整歌曲,从人声到编曲都像模像样。以后咱们普通人想发单曲,可能真的只需要动动嘴皮子,编排下歌词就行。
|
||||
|
||||
你可能觉得,这些模型肯定是越大越好。诶,先别急着下结论。最近一项新研究就提出,只要给模型喂的数据质量够高,训练方法够“刁钻”,一个80亿参数的小个子,照样能在特定任务上超越720亿参数的大块头。这说明啥?以后AI竞赛,可能不光是比谁块头大,还得比谁的“食谱”更精良。
|
||||
|
||||
同样在技术路线上搞创新的还有蚂蚁集团,他们联合发布了业界首个原生MoE扩散模型LLaDA-MoE。简单理解,就是教会了AI“倒着想问题”,用更小的模型跑出了更快的速度,而且很快就要开源了。
|
||||
|
||||
当然,AI也没忘了走进咱们的生活。支付宝的AI健康管家现在能让你拍张照就分析肤质、看舌苔,简直是手机里的赛博老中医。另一边,Anthropic的Claude也终于学会了“记事儿”,能记住特定项目的上下文,办公协作效率估计又能提一提了。
|
||||
|
||||
今天的情报就到这里,注意隐蔽,赶紧撤离。
|
||||
|
||||
本期关键词:
|
||||
#Seedream4.0
|
||||
#Music1.5
|
||||
#LLaDA-MoE
|
||||
#WebExplorer
|
||||
#字节跳动
|
||||
#MiniMax
|
||||
#蚂蚁集团
|
||||
#文生图
|
||||
#音乐生成
|
||||
#高质量数据
|
||||
#MoE
|
||||
#Claude
|
||||
#支付宝
|
||||
Reference in New Issue
Block a user