台湾 || 语言: 大陆简体港澳繁體台灣正體

F-Principle：初探理解深度学习不能做什么

雪花台湾 2019-08-04 05:20

作者丨许志钦、张耀宇

学校丨纽约大学阿布扎比分校博士后、纽约大学库朗研究所访问学者

研究方向丨计算神经科学、深度学习理论

近些年来，随著深度学习在众多实际应用中取得成功，在越来越多的科学领域内，研究人员开始尝试利用深度学习来解决各自领域的传统难题。和深度学习已获得成功的问题（比如图像分类）相比，许多科学领域内的问题往往有完全不同的特性。

因此，理解深度学习的适用性，即其能做什么尤其是不能做什么，是一个极为重要的问题。比如设计演算法的时候，它可以帮助我们考虑是完全用深度学习来代替传统演算法，还是仅在这个问题中的某些步骤用深度学习。

为了探讨这个问题，我们首先来看下面这个例子。在下面两组图中，左组中的每张图和右组有什么差别呢？

▲ 左边：数据集/DNN的Fourier变换在一个特定高维频率方向的变化曲线，右图：左图中黑色频率点处的相对误差与训练步数的关系，红色表示相对误差小。第一行是MNIST数据集的结果，使用全连接tanh网路。第二行是CIFAR10数据集的结果，使用ReLU-CNN网路。

▲ 左边：数据集/DNN的Fourier变换在一个特定高维频率方向的变化曲线，右图：左图中黑色频率点处的相对误差与训练步数的关系，红色表示相对误差小。第一行是MNIST数据集的结果，使用全连接tanh网路。第二行是CIFAR10数据集的结果，使用ReLU-CNN网路。

相关文章