演讲——“数学之美”读后感
博士太太沙龙的朋友邀我讲一些科技方面书的读后感,遂选了这本“数学之美”和她们分享。
今天很荣幸能有一个机会和大家分享一本书《数学之美》,它讲的是数学,可并不高冷。
在座的各位都有手机,对吧?手机通常有个语音助理,苹果手机有个单独的名字叫Siri.我们可以通过它设定行程、语音拨号、查询天气、播放音乐、读短消息,还可以和它聊天,你使用过程中有没有哪怕一点点好奇去想过它是怎么实现的呢?
阿法狗打败了所有的人类围棋职业高手,你有没有一点点担心电脑超过了人脑,我们该怎么办?为电脑打工吗?
其实在目前,这都是数学问题。
数学一开始只是为了计数存在的,据说很早时候一个部落选酋长,老酋长对两个竞争者说你们各说一个最大的数吧,谁说的数大,那么新任酋长就是谁。其中一个张口说:“三”。另一个人抓耳挠腮想了半天回答不上来,只好认输。因为在那个时候,三就是最大的数了。
现在,我们日常购物、理财的时候会用到数学,其他时候似乎离我们很远。可实际呢?大家都听过大数据吧,现在什么都讲大数据,不论是天气预报还是世界杯,你都能从中听到这个词。那什么是大数据?
大数据,就是以往数据的整合。数量少的可以用excel表格解决。真正用到大数据的是在人工智能方面。而这个可不是excel表格可以解决的,谷歌搜索用到的处理大数据的电脑,摆几个足球广场肯定是没问题的,里面存储的数据也是海量的。为了方便大家理解,我来举个例子:我们在百度搜索上输入“今日天气”,然后敲回车,得到什么呢?是今日气温的一些数据。百度服务器理解了“今天天气”的意思,然后反馈给我们相应的搜索结果吗?
不是的!百度服务器并不知道“今日天气”是什么意思,它只是对大数据进行了处理,然后给出反馈的。大数据是如何处理的呢?
其实就是找规律,规律是统计的基础上来的,而这个就利用了数学知识。可能有些人不理解了,这有什么规律?假如百度第一天上线,那么输入天气后反馈出来的是很多和今日天气有关的链接,有关于古诗方面的,有今日天气的名词解释,也有今天天气的实时报道。一天下来,服务器根据大数据监控到,99%人输入今日天气后,点击的是实时报道的链接,那么统计的结果就是这个链接就有优先级,下一次还有人输入今日天气,那么第一个链接就是实时报道。这里百度服务器并不具备理解词义的能力,而只是做一个简单的统计,而这利用了数学。
有些用过Siri聊天的朋友可能的会问,那么为什么和Siri聊天呢,回复还比较准确?难道也是不理解我们说的意思?其实在上世纪70年代前,科学家是不用统计来做这样的事的。而是认为语言是高度抽象的,人和其他动物的本质区别,所以要理解语言,首先要有一个人的大脑才行,可后来发现,人的大脑要实现起来太难了,那怎么办呢?就想利用语法规则来实现,可这条路看上去容易,执行起来太难了,因为语言的模糊性和多义歧义性,这里就不展开讲。后来有个科学家想偷个懒,就用了数学统计的方法,没想到!效果不错。他是怎么做的呢?就是先收集大量的语料,形成大数据,然后找规律。我听业界的人说Siri刚开始的时候,后面不是聊天机器人,而是一堆印度人,他们真人在和苹果的手机用户聊天,等聊到一定程度了,那么把他们相互之间聊的内容作为语料。这个一定程度不是上万条聊天记录,而是上亿上百亿的概念。这样后面的用户再和Siri聊天的时候,就可以看之前统计中这个问对应了多少条回复,然后选一个回复概率最高的。阿法狗也是采用了统计方法,当然更加复杂一点。如果之前没有和这句一摸一样的呢?那么选取关键词,比如我们要知道世界杯法国的情况,我们可以输入‘世界杯 法国’,就可以了。这就是关键词,而不用输入‘2018世界杯中法国比赛的情况是什么?’当然你这样输入也没问题,但关键词也可以实现同样的效果。
时至今日,机器人对自然语言的识别仍然是采用同样的方法。也就是虽然网上电视吹嘘的AI机器人似乎很厉害,实际上它们是没什么智力的,它们根本不懂你说的话是什么意思。现在还有一些AI智能音箱什么的,其实也是没智力的。能根据你的指令播放音乐,做一些事情,只是在对台词,它也不懂你说的内容是什么。如果你换了表述方法,对不上台词了,它就不知道该怎么做了。Siri也是如此,经常要告诉用户,需要用户怎么表述,它才知道该怎么做。
我想现在大家可能都觉得AI机器人也太不智能了,也不再担心是不是马上要为机器人打工的问题了。是的,目前采用数学统计的方法来解决人机交互已经走到瓶颈了,这本书讲的数学之美可以说现在已经不美了。可一旦突破这个瓶颈,那么迎来的是什么?就是我们手机上不用再装那么多APP了,不需要再点开淘宝搜索商品,打开百度地图来导航,打开抖音来看好玩的,只需要一个语音聊天机器人,它能理解我们说的,然后后台执行,打开淘宝,打开百度,打开抖音,然后把我们想要的反馈给我们。我们只需要说:“我要去上海金茂,给我导航”,那么聊天机器人就会后台启动地图APP,然后设定好起始位置,并且把最优的路线设计好反馈到手机界面上来。也就是你手机上的支付宝、微信、百度地图、抖音统统看不到了,手机屏幕上只有一个聊天机器人。这才是真正的智能手机。
这也是为什么跨国大公司都拼命在做聊天机器人,因为谁拿下它,那么就是拿下了这个出入口,这个市场将是千万亿的新市场。在我的微博中也强调了这点,大家有机会可以去看下。我也自我介绍一下,我开发了一套聊天机器人系统,已经申请了国家发明专利,也就是解决目前数学方法无法解决的AI智能机器人不智能的问题。希望大家也能多看看我的博客,给我提点建议。微博名是《这个民科有点忙》,可以微博搜索搜索到。谢谢大家!