Files
CloudFlare-AI-Insight-Daily/podcast/2025-09-07.md
2025-09-06 23:28:50 +08:00

90 lines
8.2 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 来生小酒馆 2025/9/7
## Full: Podcast Formatting
如何教AI说“我不知道”
“全自动驾驶”只是营销术语吗?
AI能成为你的高情商社交替身吗
三问炼心。嘿亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。
今天信息量不小,咱们快速进入正题。
首先国内的阿里同学又给我们带来了新惊喜。通义千问家族的最强模型Qwen3-Max-Preview现在已经登录模型竞技场OpenRouter了。这个新版本啊据说在数学、代码和逻辑推理上都更上一层楼成了个不折不扣的“学霸”。而且它在RAG也就是检索增强生成还有工具调用方面的能力也优化了。说人话就是它更听话也更少出现“一本正经地胡说八道”的情况。开发者朋友们可以去体验一下看看这个“学霸”到底有多强。
说到胡说八道也就是AI的“幻觉”问题OpenAI最近可算是挖到根儿了。他们发了篇论文指出AI之所以爱瞎说罪魁祸首竟然是咱们训练和评估它的方式。你想想啊以前的考试是不是鼓励你就算不会也要写点东西万一蒙对了呢现在的AI训练就是这个路子它鼓励模型大胆猜测而不是承认“我不知道”。结果呢就养出了一堆自信满满的“小骗子”。所以OpenAI建议咱们得改改规矩以后AI要是瞎说就得“打手心”要是坦白说“这个我真不会”就给它奖励一朵小红花。嗯……听起来AI的教育改革也挺重要的。
AI不仅会瞎说有时候还会“脸盲”。特别是在茫茫人海里摄像头角度一刁钻它就分不清谁是谁了。不过一篇新论文提出了个聪明的办法叫“K近邻加权融合”。你听着可能有点复杂但原理很有意思。它相当于让AI搞“群众路线”通过参考目标人物周围好几张照片的特征在脑子里给他生成一个更立体的“3D画像”。这么一来不管视角怎么变AI都能认出你。最关键的是这方法还不用重新训练模型直接就能用可以说是给AI的眼睛做了个无痛升级手术。
说到升级还有个研究更精妙叫CLIP-SVD。我们都知道像CLIP这样的大模型知识渊博但想让它快速适应一个新领域比如从识别猫猫狗狗变成看懂医学影像通常得大动干戈。而这个研究呢就像个外科手术大师只通过调整极少量的参数——具体来说是0.04%——就让模型完成了华丽转身。这就好比一个全科医生,你只给他点拨了几个关键,他就立刻成了顶尖的专科专家。这种四两拨千斤的智慧,确实值得点赞。
聊完技术咱们也看看行业里的一些……嗯……微妙的变化。特斯拉的“全自动驾驶”也就是FSD最近似乎在悄悄“降级”。有报告指出啊特斯拉调整了这个词的定义好像变相地放弃了最初那个完全不需要人管的承诺。这事儿就提醒我们以后看到这些科技巨头的宣传语心里得多打个问号。通往真正无人驾驶的道路可能比导航上显示的要曲折和漫长得多啊。
话说回来AI已经实实在在地在改变我们的生活了。有网友就展示了用一个浏览器插件让AI自动帮你回复微信消息。你看视频里那回复流畅自然情商拉满简直就是社恐的救星、微商的福音啊。感觉AI浏览器插件的竞争要提前进入决赛圈了。
当然还有更硬核的。一位快毕业的大学生在Reddit上分享了他自己攒的一个开源语音翻译神器。效果怎么样呢就是能把英文视频实时翻译成其他语言而且注意了还能保留说话人原来的音色顺带把口型都给你对上。这哥们儿组合了Whisper、NLLB好几个模型解决了小语种语音克隆的难题真是高手在民间。
想让AI这么听话你得会“提问”也就是写好Prompt。宝玉老师最近就分享了一套黄金公式教你怎么把AI调教成一个能写出深度推荐语的专栏主笔而不是只会做内容摘要的“课代表”。核心就是要独立成篇、观点先行让AI产出的不只是信息更是思想的火花。
最后快速给开发者朋友们报几个开源好项目。想打造自己的AI智能体大军可以看看GitHub上3.8千星的 **ottomator-agents**。Java开发者嫌应用启动慢14.9千星的 **Quarkus** 框架号称能带来“超音速亚原子级”的体验。处理海量多模态数据头疼3.5千星的 **Daft** 查询引擎来帮忙。哦对了,还有一个所有人都可能用得上的,**Stirling-PDF**在GitHub上狂揽65.1千颗星它是个全能的PDF工具箱开源免费你可以自己部署在本地合并、拆分、转换PDF从此告别隐私泄露和付费订阅的烦恼。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#阿里通义千问
#Qwen3-Max-Preview
#OpenAI
#模型幻觉
#特斯拉
#全自动驾驶
#FSD
#人物识别
#CLIP-SVD
#ottomator-agents
#Quarkus
#Daft
#Stirling-PDF
#语音翻译
#Prompt
## Short: Podcast Formatting
AI的胡言乱语竟是训练机制“逼良为娼”
特斯拉的全自动驾驶,怎么就悄悄“降级”了?
微信自动回复,是效率神器还是社交终结者?
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。闲话少说咱们直接上情报。
先看大厂动态。阿里通义千问家族又添了一位“猛将”代号Qwen3-Max-Preview现在已经在模型竞技场OpenRouter上等着大家去挑战了。据说这位新选手在数学、代码和逻辑推理上更胜一筹堪称一个幻觉更少、更听话的“学霸”型AI。
说到幻觉OpenAI最近可算是把AI“一本正经胡说八道”这毛病的老底给揭了。他们发了篇论文直指AI的“幻觉”问题罪魁祸首竟然是训练评估机制。你想想这机制鼓励模型大胆猜测而不是承认“我不知道”这不就是典型的“逼良为娼”嘛OpenAI建议以后得改改规矩对“瞎说”的要打手心对“坦白”的得给奖励希望能从根子上净化AI的语言环境。
行业方面特斯拉这边有点意思。他们那个听起来很厉害的“全自动驾驶”也就是FSD最近被指悄悄调整了定义。这操作给人的感觉就像是当初承诺给你一整块蛋糕现在告诉你“蛋糕的概念我们得重新聊聊”。这事儿也提醒我们面对科技巨头的宣传语还是得多留个心眼毕竟通往真正无人驾驶的路可能比导航显示的要长得多。
再来看几项有意思的研究和项目。现在AI识别人脸遇到刁钻的摄像头角度也容易“脸盲”。有篇新论文就提出一个“众筹”式的方法让AI参考邻近图像的特征给目标人物生成一个更立体的“3D画像”还不用重新训练模型准确率就上去了。另一篇研究更秀只动了模型里0.04%的参数就让CLIP这种大模型快速适应了新领域堪称AI界的“外科手术”。
社区里也是高手云集。有位快毕业的大学生自己动手搞了个开源的语音翻译神器能把英文视频实时翻译还保留原说话者的音色和口型效果相当不错。还有网友展示了用浏览器插件让AI自动回复微信化身“高情商社交嘴替”微商朋友们听了估计都想下单。
最后如果你还在为写不出有深度的推荐语发愁宝玉老师分享了一套“保姆级”的Prompt黄金公式手把手教你把AI调教成一位睿智的专栏主笔。想要让AI为你产出思想火花的朋友可以去学一手。
今天的情报就到这里,注意隐蔽,赶紧撤离。
---
**本期关键词:**
#阿里
#通义千问
#OpenAI
#模型幻觉
#特斯拉
#全自动驾驶
#FSD
#人物识别
#CLIP
#开源
#ottomator-agents
#Quarkus
#Daft
#Stirling-PDF
#语音翻译
#微信
#Prompt