8.1 KiB
来生小酒馆 2025/7/8
Full: Podcast Formatting
AI文本进学术,真能信吗?机器人变形金刚,我们的工作要没了?AI辅助创作,人类创意还值钱吗?
嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。今天,咱们就来聊聊AI这个“磨人的小妖精”,看看它最近又搞出了哪些大动静,以及,嗯,它到底会把我们带向何方。
话说最近啊,中国科学院计算技术研究所的团队,发布了一个叫Stream-Omni的多模态大模型,听名字就觉得很高大上对吧?它厉害在哪儿呢?就是能像“边看边听”一样,同时处理文本、视觉、语音,让你跟AI的交互那叫一个自然。想想看,以后跟AI聊天,它不仅能听懂你说啥,还能“看”懂你指着啥,甚至还能用不同的音色跟你对话,是不是感觉自己的电脑不够智能了?虽然现在在拟人化和音色上还有进步空间,但这无疑是给未来的多模态智能交互打了个坚实的地基。
诶,说到高大上,智元公司也整了个活儿,发布了一款“变形金刚”机器人,叫哪吒机器人灵犀X2-N。这机器人最酷的地方就是能“轮足双形态”切换,你想啊,在崎岖不平的地方,它就迈着小脚丫灵活越障;换个平地,嗖一下,轮子一出,就跑得飞快。据说,你推它都不会倒,这哪吒,简直就是机器人界的“哪吒闹海”啊,适应能力一流。
当然,提到AI,怎么能少了OpenAI呢?他们也官宣了,大家期待已久的GPT-5,今年夏天就要来了!据说,这回它要把现有的强大推理能力和多模态功能完美整合,变成一个统一的版本。嗯,听起来是不是有点像把“学霸”和“社交达人”合二为一了?目标是让你用起来更流畅、更高效,不用在不同模型间跳来跳去,省心。
除了这些“大明星”,小日子也过得有滋有味。你知道吗?智能音箱市场最近居然“起死回生”了!在618期间,销量和销售额都涨了不少,这背后最大的功臣就是AI大模型。消费者现在就喜欢那种交互更人性化、更智慧的音箱,这AI音箱,是不是比你家猫还听话?像小米的“超级小爱”和百度的“文心大模型”加持的新品,都卖得特别好。看来,AI技术真把这智能音箱从“听个响”拉到了“真智能”的层次。
还有啊,Anthropic的Claude Code,发布才四个月,就吸引了十几万开发者,一周内处理了近两亿行代码,简直是编程界的新星。这年头,写代码都能躺平了,是不是感觉开发效率噌噌往上涨?
不过,AI这股风,吹得可不都是顺风。最近,《自然》杂志就发了个研究,说2024年PubMed上的生物医学论文摘要里,有差不多14%都出现了AI生成文本的特征词。尤其在一些发表门槛比较低的期刊里,这个比例更高。这就引出了一个问题:这AI写的文章,到底靠不靠谱?学术的严谨性和公正性还能不能保证?这背后的思考,是不是也敲响了我们对未来信息真伪的警钟呢?
不止学术界,商业世界也为AI吵翻了天。独立出版商联盟,最近就因为谷歌搜索引擎里的AI摘要功能,把谷歌告到了欧盟委员会,说谷歌“滥用网络内容”,把他们的流量、读者和收入都给“吸”走了。这事儿再次把大型科技公司如何使用网络内容的问题推到了风口浪尖,可见AI带来的冲击,已经不止于技术层面,更是触及了利益和规则的边界。
当然,也有人对AI保持着清醒的认识。皮克斯的首席创意官彼特·道克特就“吐槽”说现在的AI技术“很无聊”。他强调,在动画创作中,人类创意是无可替代的!他依然期待AI能帮大家减轻工作负担。所以你看,人类的创意和判断,依然是AI无法取代的。所以,别焦虑,多学学怎么跟AI“搭档”才是正道。
最后再给大家带来几个小惊喜。B站也要搞自己的AI创作工具了,代号“代号H”,说是输入文案和音频,千字内容6分钟就能自动生成视频!这简直是为创作者量身定制的神器,这是要让大家彻底告别PPT制作的噩梦吗?还有,谷歌的Gemini CLI命令行工具,现在竟然能识别视频信息,结合FFmpeg,就能实现简单的视频自动剪辑!这不就是传说中的“懒人福音”嘛?
嗯,今天的AI情报站就到这里,你是不是也对未来又多了一分期待,又多了一点思考呢?
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词: #Stream-Omni #多模态模型 #智元 #机器人 #OpenAI #GPT-5 #智能音箱 #Claude Code #学术写作 #内容创作 #AGI #工具应用
Short: Podcast Formatting
AI生成文本已经渗入学术论文,这会影响科研的严谨性和公正性吗? 当AI摘要开始“滥用”网络内容,传统出版商的生计该怎么办? 如果AI能像人类一样持续学习,那人类的创造力还会是唯一的“王牌”吗?
嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。
今天的情报有点意思。首先,国内AI技术又放大招了!中科院计算所发布了Stream-Omni,一个能“边看边听”的多模态大模型,听起来就像未来的人机交互。智元公司也不甘示弱,推出了能“变形”的哪吒机器人灵犀X2-N,轮足双形态切换,适应各种复杂地形,简直是机器人界的“变形金刚”。
再来看看国际动态。OpenAI证实GPT-5今年夏天就要来了,它目标是整合现有的推理和多模态功能,让体验更流畅。国内B站也计划推出“代号H”的AI创作工具,帮你自动匹配视频画面,千字内容6分钟生成,看来创作者们要起飞了!
市场方面也有好消息,智能音箱市场在经历四年低迷后终于强势复苏。618期间销量和销售额都蹭蹭上涨,主要功臣就是那些搭载了AI大模型的智能音箱,消费者就爱这种更智慧的交互体验。小米和百度都表现亮眼,成了领头羊。
在开发者圈,Anthropic的Claude Code才发布四个月,就吸引了超过11万开发者,一周能处理将近两亿行代码,这生产力提升得真是肉眼可见啊!
不过,AI的快速发展也带来了一些小困扰。比如《自然》杂志就发现,去年PubMed上居然有14%的生物医学论文摘要都出现了AI生成文本的特征词,这让大家开始思考AI在学术写作中的规范性和严谨性。另外,谷歌搜索引擎的AI摘要功能也引来了出版商的反垄断投诉,他们认为谷歌“滥用网络内容”,影响了大家的流量和收入。甚至连皮克斯的首席创意官都说,现在的AI技术“有点无聊”,但他依然期待AI能帮人类减轻工作负担,毕竟人类创意还是动画创作的核心。
当然,AI也带来了很多提升效率的好工具。比如新出的Glass开源AI桌面助手,它隐形设计,能实时处理屏幕和音频信息,帮你整理成结构化知识,开会、学习都超实用。谷歌的Gemini CLI也更新了,现在能处理音视频,结合FFmpeg还能实现简单的视频自动剪辑,是不是很方便?
最后,我们来聊聊对AI未来的看法。有博主认为,AGI(通用人工智能)的主要瓶颈在于大模型还缺乏像人类一样的持续学习能力,不能像我们一样通过经验不断成长。但他也超看好AI的长期前景,预测一旦解决了持续学习问题,就可能迅速催生超级智能,甚至觉得AI视频制作正迎来它的“GPT时刻”,未来普通人也能轻松把创意变成视频!
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词: #AI #Stream-Omni #多模态 #机器人 #GPT-5 #智能音箱 #Claude Code #学术写作 #内容创作 #AGI #谷歌 #出版商 #皮克斯 #桌面助手 #Gemini CLI #开源 #持续学习 #超级智能 #视频制作 #大模型