Files
CloudFlare-AI-Insight-Daily/podcast/2025-07-08.md
2025-07-08 00:14:22 +08:00

8.1 KiB
Raw Blame History

来生小酒馆 2025/7/8

Full: Podcast Formatting

AI文本进学术真能信吗机器人变形金刚我们的工作要没了AI辅助创作人类创意还值钱吗

亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。今天咱们就来聊聊AI这个“磨人的小妖精”看看它最近又搞出了哪些大动静以及它到底会把我们带向何方。

话说最近啊,中国科学院计算技术研究所的团队,发布了一个叫Stream-Omni的多模态大模型听名字就觉得很高大上对吧它厉害在哪儿呢就是能像“边看边听”一样同时处理文本、视觉、语音让你跟AI的交互那叫一个自然。想想看以后跟AI聊天它不仅能听懂你说啥还能“看”懂你指着啥甚至还能用不同的音色跟你对话是不是感觉自己的电脑不够智能了虽然现在在拟人化和音色上还有进步空间但这无疑是给未来的多模态智能交互打了个坚实的地基。

诶,说到高大上,智元公司也整了个活儿,发布了一款“变形金刚”机器人,叫哪吒机器人灵犀X2-N。这机器人最酷的地方就是能“轮足双形态”切换,你想啊,在崎岖不平的地方,它就迈着小脚丫灵活越障;换个平地,嗖一下,轮子一出,就跑得飞快。据说,你推它都不会倒,这哪吒,简直就是机器人界的“哪吒闹海”啊,适应能力一流。

当然提到AI怎么能少了OpenAI呢他们也官宣了大家期待已久的GPT-5,今年夏天就要来了!据说,这回它要把现有的强大推理能力和多模态功能完美整合,变成一个统一的版本。嗯,听起来是不是有点像把“学霸”和“社交达人”合二为一了?目标是让你用起来更流畅、更高效,不用在不同模型间跳来跳去,省心。

除了这些“大明星”小日子也过得有滋有味。你知道吗智能音箱市场最近居然“起死回生”了在618期间销量和销售额都涨了不少这背后最大的功臣就是AI大模型。消费者现在就喜欢那种交互更人性化、更智慧的音箱这AI音箱是不是比你家猫还听话像小米的“超级小爱”和百度的“文心大模型”加持的新品都卖得特别好。看来AI技术真把这智能音箱从“听个响”拉到了“真智能”的层次。

还有啊Anthropic的Claude Code,发布才四个月,就吸引了十几万开发者,一周内处理了近两亿行代码,简直是编程界的新星。这年头,写代码都能躺平了,是不是感觉开发效率噌噌往上涨?

不过AI这股风吹得可不都是顺风。最近《自然》杂志就发了个研究说2024年PubMed上的生物医学论文摘要里有差不多14%都出现了AI生成文本的特征词。尤其在一些发表门槛比较低的期刊里这个比例更高。这就引出了一个问题这AI写的文章到底靠不靠谱学术的严谨性和公正性还能不能保证这背后的思考是不是也敲响了我们对未来信息真伪的警钟呢

不止学术界商业世界也为AI吵翻了天。独立出版商联盟最近就因为谷歌搜索引擎里的AI摘要功能把谷歌告到了欧盟委员会说谷歌“滥用网络内容”把他们的流量、读者和收入都给“吸”走了。这事儿再次把大型科技公司如何使用网络内容的问题推到了风口浪尖可见AI带来的冲击已经不止于技术层面更是触及了利益和规则的边界。

当然也有人对AI保持着清醒的认识。皮克斯的首席创意官彼特·道克特就“吐槽”说现在的AI技术“很无聊”。他强调在动画创作中人类创意是无可替代的他依然期待AI能帮大家减轻工作负担。所以你看人类的创意和判断依然是AI无法取代的。所以别焦虑多学学怎么跟AI“搭档”才是正道。

最后再给大家带来几个小惊喜。B站也要搞自己的AI创作工具代号“代号H”说是输入文案和音频千字内容6分钟就能自动生成视频这简直是为创作者量身定制的神器这是要让大家彻底告别PPT制作的噩梦吗还有谷歌的Gemini CLI命令行工具现在竟然能识别视频信息结合FFmpeg就能实现简单的视频自动剪辑这不就是传说中的“懒人福音”嘛

今天的AI情报站就到这里你是不是也对未来又多了一分期待又多了一点思考呢

今天的情报就到这里,注意隐蔽,赶紧撤离。

本期关键词: #Stream-Omni #多模态模型 #智元 #机器人 #OpenAI #GPT-5 #智能音箱 #Claude Code #学术写作 #内容创作 #AGI #工具应用

Short: Podcast Formatting

AI生成文本已经渗入学术论文这会影响科研的严谨性和公正性吗 当AI摘要开始“滥用”网络内容传统出版商的生计该怎么办 如果AI能像人类一样持续学习那人类的创造力还会是唯一的“王牌”吗

亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。

今天的情报有点意思。首先国内AI技术又放大招了中科院计算所发布了Stream-Omni一个能“边看边听”的多模态大模型听起来就像未来的人机交互。智元公司也不甘示弱推出了能“变形”的哪吒机器人灵犀X2-N轮足双形态切换适应各种复杂地形简直是机器人界的“变形金刚”。

再来看看国际动态。OpenAI证实GPT-5今年夏天就要来了它目标是整合现有的推理和多模态功能让体验更流畅。国内B站也计划推出“代号H”的AI创作工具帮你自动匹配视频画面千字内容6分钟生成看来创作者们要起飞了

市场方面也有好消息智能音箱市场在经历四年低迷后终于强势复苏。618期间销量和销售额都蹭蹭上涨主要功臣就是那些搭载了AI大模型的智能音箱消费者就爱这种更智慧的交互体验。小米和百度都表现亮眼成了领头羊。

在开发者圈Anthropic的Claude Code才发布四个月就吸引了超过11万开发者一周能处理将近两亿行代码这生产力提升得真是肉眼可见啊

不过AI的快速发展也带来了一些小困扰。比如《自然》杂志就发现去年PubMed上居然有14%的生物医学论文摘要都出现了AI生成文本的特征词这让大家开始思考AI在学术写作中的规范性和严谨性。另外谷歌搜索引擎的AI摘要功能也引来了出版商的反垄断投诉他们认为谷歌“滥用网络内容”影响了大家的流量和收入。甚至连皮克斯的首席创意官都说现在的AI技术“有点无聊”但他依然期待AI能帮人类减轻工作负担毕竟人类创意还是动画创作的核心。

当然AI也带来了很多提升效率的好工具。比如新出的Glass开源AI桌面助手它隐形设计能实时处理屏幕和音频信息帮你整理成结构化知识开会、学习都超实用。谷歌的Gemini CLI也更新了现在能处理音视频结合FFmpeg还能实现简单的视频自动剪辑是不是很方便

最后我们来聊聊对AI未来的看法。有博主认为AGI通用人工智能的主要瓶颈在于大模型还缺乏像人类一样的持续学习能力不能像我们一样通过经验不断成长。但他也超看好AI的长期前景预测一旦解决了持续学习问题就可能迅速催生超级智能甚至觉得AI视频制作正迎来它的“GPT时刻”未来普通人也能轻松把创意变成视频

今天的情报就到这里,注意隐蔽,赶紧撤离。

本期关键词: #AI #Stream-Omni #多模态 #机器人 #GPT-5 #智能音箱 #Claude Code #学术写作 #内容创作 #AGI #谷歌 #出版商 #皮克斯 #桌面助手 #Gemini CLI #开源 #持续学习 #超级智能 #视频制作 #大模型