Files
CloudFlare-AI-Insight-Daily/podcast/2025-06-10.md
justlovemaki b191843448 init book
2025-06-11 17:11:23 +08:00

45 lines
7.1 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 来生小酒馆 2025/6/10
未来高质量的AI服务是不是都要变成我们钱包里的硬通货免费午餐真的要吃完了吗AI是越越好还是小而精专而深更能出奇制胜我们是不是对AI的认知还停留在越大越智能的误区里还有啊在AI这条路上究竟是闭门造车的独门秘籍更胜一筹还是集思广益的开源生态才能走得更远而当我们看到AI编程都开始遇到瓶颈那下一个颠覆性的奇点又会在哪里呢
亲爱的V欢迎收听新一期的来生情报站我是你们的老朋友何夕2077。哎呀最近这AI圈子里啊可真是热闹得不行信息量大到我都觉得脑细胞有点不够用了。但是呢咱们情报站的宗旨就是化繁为简用最轻松的方式给您把这最前沿的科技八卦啊不科技新闻给您说道说道。您甭管您是坐在格子间里写代码的还是在茶水间里摸鱼的都得听听这未来啊可能就藏在这些小小的变化里头呢。
首先啊咱们得说说谷歌这老大哥。你说这以前吧免费俩字儿在互联网时代那可是个香饽饽尤其是在AI这块儿。结果最近呢谷歌AI Studio说变脸就变脸从5月开始它那个Gemini 2.5 Pro就是那个特别厉害的模型免费用户啊您就别想随便用了。想用得自己掏API密钥说白了就是得花钱了。你说这事儿闹的是不是就像咱们食堂突然宣布以前免费的汤现在要收费了大家伙儿都在议论啊这恐怕是谷歌在推动Gemini商业化要把高性能模型往付费体系里头塞的信号。嗯看来这年头连AI也得内卷免费的终究还是最贵的羊毛出在羊身上的道理AI也不例外啊。
但是呢有人关门就有人敞开怀抱。咱们国产大模型这边啊阿里旗下的通义千问3那可真是扬眉吐气了一回。你知道吗它开源才一个月全球下载量就突破了1250万次在Hugging Face这些国际大平台上衍生出来的模型那叫一个多啊超过13万个直接就跃居全球第一了哎呀这可真是人逢喜事精神爽这说明什么说明咱们中国的大模型在开源这块儿那可是实打实地跟国际水平接轨了甚至在某些方面还得领先一步。这阿里啊在全球AI基础模型生态里头那是妥妥地站稳了脚跟有牌面
说到模型啊这不最近又杀出了一匹黑马叫MonkeyOCR。一听这名字就透着股灵气猴子识别呗。这哥们儿可不得了它是个轻量级的文档解析模型参数才3B才3个B啊结果呢在英文文档解析这任务上它直接就把Gemini 2.5 Pro这些大块头给超了而且处理速度还快了一大截。你说这是不是有点像一个练轻功的小师傅一招四两拨千斤把那些膀大腰圆的壮汉都给撂倒了它的秘诀啊就是一套结构-识别-关系的三元组范式。这不仅仅是提高了准确率关键是大大降低了对计算资源的需求也就是说咱们中小企业啊以后想用AI来处理文档那成本可就下来了这不就得了嘛可别小看这些小而美的AI有时候啊它们才是真正解决咱们实际问题的行家
有意思的是啊前一阵子字节的豆包和腾讯的元宝这俩AI去挑战了2025年高考新课标的数学卷。结果呢都考了68分并列第一。哎呀你说这AI现在都开始考高考了以后我们孩子是不是直接让AI替考就行了开玩笑啊千万别当真这分数啊虽然不能说逆天但也充分展现了它们在复杂推理上的潜力。这说明啊AI在细节处理、公式应用和逻辑推理上确实进步不小。
但是呢您可别光顾着看AI的高光时刻有时候啊它也会翻车。前几天有个架构师叫罗伯特·卡鲁索他就做了一个特别有意思的实验拿1977年的老古董Atari 2600游戏机上的国际象棋引擎去跟OpenAI的ChatGPT下棋。结果您猜怎么着这ChatGPT啊居然输了它下棋的时候那是频繁犯错甚至连棋子都混淆。这可真是新AI不如旧AI。这事儿就给咱们提了个醒儿AI虽厉害但它也不是万能的每个AI都有自己擅长的领域别拿它的短板去比人家的长板那不是自讨没趣嘛。
话说回来咱们再聊聊AI编程代理。有位博主叫wwwgoubuli他就说啊AI编程代理现在有点进入平台期了。虽然像Gemini 2.5 Pro和Claude这些模型还是很强但他觉得模型本身再有飞升的空间有限了。他预测啊未来会是更多产品井喷式发展重点呢在于载体媒介和像IDE/plugin这些方面的完善而不是核心模型能力的突破。这AI啊就像咱们打工人有时也得停下来喘口气想想下一步该往哪儿走。这说明啊AI的发展不仅仅是算法的进步更是工程化的落地还有咱们如何把这些超能力真正地融入到日常的工作生活里头。
说到这融入日常啊最近还有两个特别实用的小发明。一个呢是Tw93推荐的PayQrcode方案。你知道以前咱们线下付款微信支付宝得扫俩码多麻烦啊。这哥们儿就厉害了他用物理图片合并技术把微信和支付宝的收款码合到一张图上去了而且啊离线场景下也能识别识别效果还挺好。你说这不就是妥妥的懒人福音还有呢就是博主归藏介绍的在Liblib平台在线使用FLUX Kontext工具修改图片。以前用Comfyui得在本地跑特别吃资源。现在呢人家直接给你搬到线上了什么单图、双图、三图融合图片放大都给你整明白了。这不就是把复杂的专业工具变成人人都能用的傻瓜式操作了吗这AI啊有时候就得这样把高深的玩意儿变得接地气变得人人都能玩转这才能真正改变咱们的生活。
你看啊从谷歌的收费到阿里的开源大模型小而精再到AI考高考、AI下象棋还有那些让生活更便利的小工具。AI的发展啊真是你方唱罢我登场精彩得很。它既有让我们惊叹的超能力也有需要我们理性看待的局限性。但是可以肯定的是AI这股浪潮它不是来一阵风就走的它会越来越深入地融入到我们生活的方方面面。所以啊咱们得保持好奇心保持学习的热情这样才能在这股浪潮里稳稳地站住脚跟。
今天的情报就到这里,注意隐蔽,赶紧撤离。
本期关键词:
#AI模型
#GoogleAIStudio
#Gemini2.5Pro
#商业化
#阿里
#通义千问3
#大模型
#开源
#MonkeyOCR
#文档解析
#高考数学
#AI能力
#ChatGPT
#Atari2600
#AI编程代理
#检索增强生成
#PayQrcode
#Liblib
#FLUXKontext
#收款码