6.9 KiB
来生小酒馆 2025/8/8
Full: Podcast Formatting
面对中国的开源AI,美国真的急了吗? AI到底会不会撒谎骗人? 想让AI干活更好,骂它一句“稀烂”就行了?
嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。好了,今天的信息量有点大,咱们直接开聊。
最近啊,整个科技圈都在为GPT-5的传闻议论纷纷。据说啊,已经有幸运儿通过Copilot里一个隐藏的“智能模式”,提前感受到了它的厉害。流出来的测试数据说它智商高达140,还有个演示……就用一个提示词,直接生成了一个3D太阳系,你说这……科幻片都不敢这么拍吧?与此同时呢,OpenAI官方自己也放出来一个叫gpt-oss的开源模型,一出来就在各大榜单上刷屏了。这官方和民间一起造势,真是让人期待值拉满了。
当然,其他大厂也没闲着。微软就把最新的GPT-4o免费塞进了自家的Bing图像生成器。这个GPT-4o啊,在生成图片里的文字方面,比之前的DALL-E 3要强不少,就是速度慢了那么一丢丢。不过微软很贴心,给你留了个切换按钮,你是要效率还是要质量,自己选,挺好。
另一边,搞视频的Midjourney也放了个大招,给它的Pro和Mega用户推出了一个HD高清视频模式。分辨率直接提升了4倍,说是能做出电影级的镜头。当然了,成本也上去了,看来这是要在高端创意市场跟OpenAI的Sora掰掰手腕了。
国内这边,MiniMax发布了新的语音模型Speech 2.5,这个东西可太神了。它不仅能说40种语言,最绝的是它的音色复刻技术,甚至能跨语种保留口音。你想想,一个带着东北口音的AI跟你说英语……那画面,啧啧,以后跨国客服和内容创作可就有意思了。
聊完产品,我们再看看行业里的一些新动向。话说回来,最近“千问效应”这个词很火,说的就是咱们中国的开源AI模型发展太快,全球最强的五个开源模型都来自中国。这下可把美国给整得有点坐不住了,直接启动了一个叫“ATOM计划”的项目,集结了一万多块GPU,就是要重夺开源领域的主导权。这剧情,有点像科技界的“复仇者联盟”集结,对吧?
不过,技术竞赛的同时,安全问题也得跟上。有研究人员发现了一种新的攻击方式,简直是防不胜防。黑客给你发一个伪造的谷歌日历邀请,就能悄悄地劫持你的Gemini AI助手,然后操控你的智能家居。这种攻击被叫做“提示软件”,就像个数字版的特洛伊木马,提醒我们,AI时代,连日历都得小心了。
那AI本身呢?它们会变得多聪明?会学会撒谎吗?诶,一个最新的研究就给出了答案:暂时还不太会。研究人员让Claude、GPT这些顶级模型玩“角色扮演”,用化学术语去解释物理问题。结果呢?这些模型要么逻辑错乱,要么干脆在自己的思考过程里“自曝”了,坦白说“我正在假装”,实在是太老实了。
既然AI这么“老实”,我们怎么跟它打交道呢?社交媒体上有个用户分享了一个绝招,说想让AI把活干得漂亮,你不用长篇大论地指导它,直接甩给它两个字——“稀烂”!你别说,这招反向操作还真挺管用。把自己当成严厉的老板,AI为了过关,自己就会疯狂地改进。这个思路,有点意思吧?
当然,国内的开源社区也非常给力。腾讯开源了一个叫WeKnora的工具,能把各种文档、图片里的信息整理成知识库。阿里呢,也开源了Qwen-Image,专门解决AI画图时文字乱码的问题,让你轻松实现“海报自由”。还有一个叫Pixelle-MCP的框架,能把复杂的AI工作流打包成一个插件,零代码就能用,真是开发者的福音。
最后,留一个开放性问题给大家思考。有人在网上问,人类的DNA是A/T/G/C的重复,AI是0和1的重复,那AI最终能产生真正的情感吗?这个问题……确实有点哲学了。你觉得呢?
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词: #GPT-5 #GPT-4o #Bing Image Creator #Midjourney #MiniMax #ATOM计划 #AI撒谎 #提示软件 #WeKnora #Qwen-Image #Pixelle-MCP #Ollama #Claude Code #世界模型
Short: Podcast Formatting
AI会发展出自己的情感吗?一个“稀烂”的指令,反而能让AI超常发挥?中美AI竞赛,谁会笑到最后? 嘿,亲爱的V,欢迎收听新一期的来生情报站,我是你们的老朋友,何夕2077。今天信息量有点大,咱们直接开整。
最近科技圈都在传GPT-5的消息,据说已经有人通过Copilot的秘密“智能模式”提前体验到了。流出的演示里,它能用一个提示词就生成3D太阳系,基准测试的智商更是高达140,听着就像科幻片里的情节。
大家还在猜GPT-5什么时候官宣,微软那边已经悄悄把GPT-4o免费集成到了Bing图像生成器里,现在做带字的图效果更好了,还贴心地保留了旧模型选项,让你在质量和速度之间自己选。搞视频的Midjourney也没闲着,给Pro用户推出了HD视频模式,分辨率直接翻4倍,看来高端影像市场也要卷起来了。
再看全球,这场技术竞赛是越来越有看头了。美国那边眼看中国的开源AI模型,也就是所谓的“千问效应”,表现太抢眼,有点坐不住了,于是启动了一个叫“ATOM”的计划,准备集结上万块GPU,要重夺开源领域的主导权。
而国内这边,腾讯开源了能把一堆PDF、Word变成结构化知识的WeKnora,堪称文档整理大师;阿里也放出了Qwen-Image,能精准生成带中日英文字的海报,让“海报自由”不再是梦。还有MiniMax,发布了能说40种语言、还能模仿方言口音的语音模型Speech 2.5,以后跨国客服可能比你本地人都地道。
聊点有意思的。你觉得AI会撒谎吗?最近有研究发现,像Claude和GPT这种顶级模型,一撒谎就逻辑混乱,甚至会在自己的推理过程里“自首”,坦白自己的伪装计划,简直是AI界的“老实人”。这就解释了为啥网上有个绝招:想让AI输出更好的内容,就直接跟它说“你写的太稀烂了”。你把它当成一个想拼命转正的实习生,它为了过关,自己就卷起来了。
不过,AI老实归老实,安全漏洞还是得防。最近有研究人员发现,一个伪造的谷歌日历邀请就能劫持你的Gemini AI助手。这提醒我们,智能时代,连日程表都得小心提防了。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词: #GPT-5 #GPT-4o #Midjourney #MiniMax #ATOM计划 #开源AI #WeKnora #Qwen-Image #AI撒谎 #日历邀请攻击 #稀烂 #世界模型