上QQ阅读APP看书,第一时间看更新
本书特点
应用机器学习、人工智能技术不仅需要理解算法原理,还需要对算法参数调优、算法使用时的数据要求、算法输出结果,以及如何在具体业务场景使用数据挖掘模型等方面都有所了解,这样才能真正发挥数据价值,产生实际的业务效果。
本书作者结合多年来给不同的大型机构“构建数据挖掘模型、解决实际业务问题”的实践,总结归纳技术、应用等方面的经验,以“介绍较新机器学习及人工智能技术”和“如何应用这些技术解决实际问题”两个方面作为本书的整体选题思路。总体来讲,本书具有如下两个主要特点。
(1)介绍较新的技术
有监督学习的建模技术早已不是只懂得算法就可以了。目前基于集成学习、Grid Search、交叉验证等自动化建模技术方兴未艾,这些技术在专门的章节作了重点介绍;基于序列模式挖掘、序列规则、序列预测等进入公众视野还较新的技术在实际业务中有巨大的价值,这些也是本书介绍的重点;对于目前比较火热的深度学习、对抗学习等内容,本书也有专门的章节进行介绍。从这些技术的特点来看,已经具备了增强型分析的部分特点,如集成学习的技术就是旨在将多个模型结合起来,达到相对于单独采用一个模型而明显改善的效果。
(2)兼顾原理与大量实例
按照深入浅出的方式介绍算法原理、参数调优及使用方法等信息,并结合实际例子展示如何使用以及使用时的思路。笔者采用“深入浅出的原理介绍+实际使用的案例”的内容安排,期望能够让读者真正了解机器学习及人工智能的技术原理、特点与使用方法,并能直接在实践中起到指导作用。
除此之外,在本书中涉及汉语直译不能达意的词汇时都是采用英语原词,方便读者能够与科技类的英文材料对应,尽量避免生硬翻译带来的疑惑。在本书的大量实例中,代码注释基本上都是英文的,这与笔者多年的编码习惯有关。