口译培训

机器翻译、图像识别,如何影响我们的生活?(8)

<< 返回业内先知 2016-10-09来源:口译
尽管出现了这些进展,但神经网络在1990年代中期还是再一次失宠,风头被更加高效的机器学习工具盖过。这种情况维持了近十年,直至计算性能又增长了

  尽管出现了这些进展,但神经网络在1990年代中期还是再一次失宠,风头被更加高效的机器学习工具盖过。这种情况维持了近十年,直至计算性能又增长了三四个数量级,研究人员发现GPU的加速发展。

  大数据

  不过,还缺少了一样东西:数据。虽然互联网上充斥着大量的数据,但大多数数据——尤其是图像方面的——都没有标签,因此你需要训练神经网络。这个时候,斯坦福AI教授李菲菲站了出来。“我们的愿景是,大数据改变机器学习的运作方式。”她在受访时解释道,“数据驱动学习。”

  2007年,她创办ImageNet,建立了一个含有超过1400万张带标签图像的免费数据库。该数据库于2009年上线,次年她创办一年一度的比赛来鼓励和公布计算机视觉方面的突破性进展。

  2012年10月,辛顿的两位学生在比赛中获胜,预示着深度学习时代降临。

  当时,公众也有听说深度学习,不过是通过另一个事件得知。2012年6月,谷歌大脑公布了一个名为“猫试验”的古怪项目的研究结果。相关的视频相当滑稽有趣,很快就在各家社交网络上得到了病毒式的传播。

  未来的一大挑战

  该项目实际上探索了深度学习领域的一个很重要但未解决的问题,它就是“非监督式学习”。目前,几乎所有的商用深度学习产品都使用“监督式学习”,即它们的神经网络是用标记数据来训练的,比如用ImageNet建立的图像数据库。相比之下,在“非监督式学习”中,神经网络会被展示未被标记的数据,被要求发现反复出现的模式。研究人员非常希望有朝一日能够掌握非监督式学习技术,因为那样机器就能够自行利用当下大量无法使用的数据来理解这个世界——像婴儿那样完全依靠自己来了解这个世界。

(责任编辑:tysd001)