速度上我手边没有数据所以不敢乱说,我说的高效指的是效率。
以视觉图像处理为例。
在处理图像时,计算机是以帧为单位进行图像处理,也就是所谓的帧驱动。这种处理方式需要传感器以帧为单位收集图像,然后再处理,处理完了再输出,因而存在延迟。现在最先进的人工视觉(artificial vision)是基于视频流(video streams)的,通过一定的帧频获取图像序列,并一帧一帧地处理。这种处理方式不仅存在延时,还耗能大、对CPU要求高。 而人脑不是这样处理图像的,人脑没有帧这个概念,人脑的处理如同一条流动的河流,我们称之为“事件驱动”(Event-Driven, ED)。 当生物看到图像时,视网膜细胞通过光学神经纤维传送动作电位(也就是spike或者event)给大脑,大脑皮质再通过多级处理对外界刺激进行反应。整个过程中只有事件流,没有帧。并且每个神经元完全自主地根据自己收集到的事件来决定什么时候对外送出事件。这就是事件驱动。 那么这意味着什么呢? 我们假设有一张图片,并且我们使用现在专门用于机器人辨识静物、手写字、背景的五层结构前馈卷积神经网络(feed-forward Convolutional Neural Network, ConvNet)来处理它。那么计算机会首先收集1帧的数据,然后进行五级处理,并且每一级处理完了后一级才能开始处理,最后输出。假设收集一帧和每一级处理都需要1毫秒的延时,于是输入和输出之间延时6毫秒。 而大脑是怎么处理这张图的呢?依靠事件驱动,如果帧驱动每一帧需要1毫秒的间距,那么每个事件之间的间距一般可以低于100纳秒,并且,大脑不需要等前一级处理好了再进行后一级处理,收集到足够的事件(不超过4个就行了)时,大脑就开始处理并开始输出,最终的结果就是输入输出之间几乎没有延时,我们称之为“伪同步”(pseudo-simultaneity)。 同样一张图,一个需要6毫秒的延迟,一个只有几百纳秒的延迟,高下立分。 所以,事件驱动意味着高效。
当然,现在的计算机或许已经很快,也许处理同一张图片,计算机可以比人运算快一万倍,从而在时间上表现得和人一样高效。可是,真正明白了原理后你不觉得丢人么,你得比我快一万倍才能和我做同样多的事,而你的CMOS零件已经接近印制极限和功率密度极限。我不仅距离极限还早,而且我组成的网络不仅能处理图像,还能产生联想记忆、突现行为等等人类到现在都没完全弄明白的行为。一个只能做一件事,要做另外的事就得改变结构,另一个却什么都能做,这是更高的高效。
综上所述,我认为相比于人脑,计算机并不高效。
|