AI的“前世今生”——从“只会下棋”到“能聊能写”(2 / 5)

—这个数字比宇宙里的星星还多!要想赢棋,不仅需要记住规则,还得预判对方的策略、调整自己的布局,甚至在关键时刻“声东击西”,这些都是“需要动脑筋”的复杂决策,大家都觉得“机器不可能做到”。

但“深蓝”做到了。它不是“靠运气”赢的,而是背后有强大的技术支撑:首先,科学家给“深蓝”输入了几百万场国际象棋比赛的历史数据,让它“记住”各种经典的棋局和走法;其次,“深蓝”的计算速度特别快,每秒能计算2亿种走法,能在瞬间预判出接下来10步甚至20步的可能情况,然后选出最优的走法;最后,它还能根据比赛中的情况实时调整策略,比如如果发现对方喜欢“进攻”,就会主动加强防守。

比赛一共进行了6局,“深蓝”以35比25的比分战胜了卡斯帕罗夫。当最后一步棋落下时,全世界都震惊了——大家第一次意识到:ai不仅能做简单的计算,还能在“需要策略和思考”的领域,赢过最顶尖的人类!

这时候的ai,就像刚小学毕业的孩子:它不再是只会干基础活的“新手”,而是能完成有“复杂逻辑”的任务了。虽然它的“本事”还很“单一”——只会下国际象棋,换个围棋、中国象棋就完全“不会玩”;而且它也不懂“为什么要下棋”,只是机械地执行计算和策略,但这已经是巨大的进步。

这次胜利,就像ai给人类递了一张“成绩单”,证明了“机器能模仿人类的复杂思考”,也让更多科学家和企业开始关注ai,为后来的发展注入了强大的动力。

3 2010年代:ai“看懂图片、听懂话”——能“感知世界”的“中学生”入人类日常生活

进入2010年后,ai迎来了“加速成长”的阶段。如果说1990年代的ai是“偏科生”(只会下棋),那2010年代的ai就是“全面发展的中学生”——它开始能“看懂”图片、“听懂”语音,甚至能跟人简单互动,真正走进了普通人的生活。

这一阶段的第一个关键突破,是2012年的“图片识别比赛”。当时有个叫“iage”的全球图片识别大赛,参赛的都是来自世界各地的ai团队。比赛的规则很简单:给ai看一张图片,让它判断图片里的东西是什么,比如是“猫”“狗”“汽车”还是“飞机”,然后看谁的准确率最高。

在这之前,ai的图片识别能力特别差:比如给它看一张猫的照片,它可能会认错成狗;就算认对了是猫,也分不清是“橘猫”还是“英短”。但2012年,一个叫“alex”的ai模型改变了这一切——它的图片识别准确率达到了847,超过了人类的831!

为什么“alex”能这么厉害?因为它用了一种新的技术——“深度学习”。简单说,以前的ai看图片,只能“逐点看”,比如看猫的眼睛,就只认“圆形、黑色”;但“alex”能像人类一样“分层看”:先看整体轮廓(比如“四脚、有尾巴”),再看细节(比如“耳朵是尖的、毛发有条纹”),最后综合判断“这是一只猫”。而且它还能“从错误中学习”,比如第一次认错了“橘猫”和“英短”,下次再看到类似的图片,就会记住两者的区别(比如橘猫的毛色更浅、英短的脸更圆),准确率越来越高。

除了“看懂图片”,ai在“听懂话”上也有了大突破。2016年前后,各种语音助手开始普及:苹果的siri、小米的小爱同学、百度的小度……以前咱们对着手机说“打电话给妈妈”,手机可能会听错成“打电话给爸爸”;但这时候的语音助手,不仅能准确识别普通话,还能听懂方言(比如四川话、广东话),甚至能理解“模糊指令”。

比如你说“明天早上早点叫我”,它会主动问你“请问要设置几点的闹钟呀?”;你说“查一下今天的天气”,它会直接告诉你“今天北京晴,气温15-25c,适合穿薄外套”;甚至你跟它闲聊“今天心情不好”,它还能安慰你“别难过啦,要不要我给你讲个笑话?”——虽然这些互动还比较“简单”,但已经能满足日常生活的需求了。

这时候的ai,就像中学生:它不再是“只会在实验室里赢比赛”的“偏科生”,而是变成了能融入日常生活的“小帮手”。你用手机拍照时,它能自动识别“人脸”“风景”,调整拍照参数;你用导航时,它能听懂你的语音指令,比如“掉头”“避开拥堵”;你用购物软件时,它能根据你浏览的记录,推荐你可能喜欢的商品……ai开始真正“落地”,从“科技概念”变成了大家能实实在在用到的工具。

4 2020年代:ai“能聊能写能创造”——能当“得力助手”的“大学生”,开始帮人做“创造性工作”

最近这几年,ai的进步可以用“突飞猛进”来形容。如果说2010年代的ai是“帮小忙”的中学生,那2020年代的ai就是“能独当一面”的大学生——它不仅能完成基础任务,还能进行“创造性工作”,比如写文案、画插画、编故事,甚至能帮人做专业领域的研究,成为真正的“得力助手”。

这一阶段最具代表性的,就是2022年底推出的chatgpt。