深度学习应用与实战
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.1 深度学习的基本概念

1.1.1 深度学习的概述

人工智能是指使用机器代替人类实现认知、识别、分析、决策等功能,并研究模拟人类智能理论、方法、技术的科学,与之相关的领域近些年发展十分快速,而机器学习与深度学习是实现人工智能最重要的方式。机器学习是让机器去分析数据以找到数据的内在规律,并通过找到的内在规律对新数据进行预测与处理。深度学习是基于深层神经网络实现的模型或算法,可以通过对数据特征的学习来进行结论的预测。人工智能、机器学习和深度学习的关系如图1.1所示,即机器学习是人工智能的分支技术,而深度学习是实现机器学习的技术之一,三者是包含与被包含的关系。

图1.1 人工智能、机器学习和深度学习的关系

深度学习作为人工智能领域最有成效的实现技术之一,通过叠加多层神经网络来提高算法的性能,它于2006年被提出之后,就展现出强大的学习能力,故其常被应用于以下领域。

(1)计算机视觉,包括图像识别、目标检测、语义分割、视频理解、图像生成等。

(2)NLP,包括机器翻译、聊天机器人等。

(3)强化学习,包括虚拟游戏、机器人、自动驾驶等。

与传统的机器学习相比,深度学习具有以下特点。

(1)不需要进行数据预处理。使用机器学习算法构建模型之前,一般需要进行大量的数据预处理工作,将数据的特征进行提取并完成处理之后输入机器学习算法中进行模型训练,此过程往往会耗费大量的时间与精力,并会占用较多的计算资源。而使用深度学习算法解决问题时,不需要对数据进行过多的预处理,通常可以直接将数据输入构建的深度学习模型进行训练。数据的特征提取工作可由深度学习模型自行完成,节省了大量的数据预处理时间。

(2)需要海量的数据进行模型构建。使用机器学习算法构建模型时,所需要的数据集往往比较小,数据量规模一般在10万条以下。而深度学习模型的网络层数一般较深,模型的参数个数可达到百万、千万甚至数十亿级别。因此,模型在进行训练时需要规模巨大的数据集才能得到较好的预测效果。

(3)需要较强的算力。传统的机器学习对算力没有太多要求,在一般的 CPU 上进行训练也能得到满意的模型性能。而深度学习模型因其具有规模巨大的参数个数,故在深度学习中进行模型构建时,往往较为依赖并行加速计算设备,如GPU或TPU等。

(4)具有更强的学习能力。传统机器学习模型的参数个数比较固定,模型的容量也比较固定,但是对于深度学习而言,随着网络层数的增加,深度学习模型的容量会相应增加,且学习能力也会相应增强,它可以学习到较为复杂的数据的规律,从而解决较为复杂的问题。但是在深度学习模型学习能力增强的同时,也可能引入新的问题,如模型容易出现过拟合等。