前面挖的坑,要写这三本书的比较,这里来填坑了。在编写期间突然发现密歇根州立的马博士和汤老师的书《图深度学习》中文版也出来了,赶紧入手一本,然后参与进来,这样就变成4本书的比较了。方便起见,给四本书来个简称:《深浅》、《基础》、《导论》和《图DL》。先上图片来个大小比较,给大家一点直观感受。
然后上个表格,比较一下基本信息和核心点。
|
《深浅》
|
《基础》
|
《导论》
|
《图DL》
|
页数
|
214
|
138
|
148
|
298
|
印张
|
14
|
9.5
|
5
|
20(全彩色印刷)
|
标价
|
89
|
79
|
69.8
|
118
|
第一作者背景
|
创业企业的技术专家
|
外企研究院资深研究员
|
国内Tier1大学教授
|
美国Tier2大学教授
|
核心内容模块
|
1. 图+CNN基础 2. GCN理论、性质 3. 变体和框架 4. 前沿应用
|
1. 图理论基础 2. GCN的演化及扩展 3. 知识图谱及异构图应用 4. GNN的应用
|
1. GNN介绍及基础知识 2. GNN模型及变形和框架3. GNN的应用
|
1. 基础理论 2. 模型方法 3. 实际应用 4. 前沿进展
|
适用读者
|
有一定基础的算法工程师和研究人员
|
需要有相当基础的算法工程师和研究人员
|
专业学生和研究人员
|
专业学生和研究人员
|
下面主要分析一下这4本书的对于读者的阅读建议。
对于大学的本科生,特别是低年级的学生,建议先把基础课学好,特别是高数/线代、概率论,有条件的学习一下机器学习和深度学习的基础课。这4本书里面,都单独辟出了几个章节来简单的介绍了相关基础内容,《深浅》的2-4章,《导论》的第2、3章和《图DL》的第3章,其中《图DL》给的介绍更全面一些。但仅仅靠这些书里的内容肯定是不够的,所以同学们还是要把相关的基础打好。有了这些基础后,可以仔细地看看和图论以及基础图分析内容,比如《深浅》的第1、5章,《基础》的第2章,《图DL》的第2章。对于GNN的部分,建议同学们看看基础的一些GNN的模型介绍(《深浅》的7章,《基础》的第3章)就好了,比如经典的GCN、GAT和RGCN。更新的一些模型可以暂时不用看。下面就直接找一些现有的库上手来看代码和运行一些例子,比如看看DGL之类的库的文档和教程,有一个基本的了解就差不多了,后续可以根据未来的职业方向来决定。
对于已经毕业工作的,或者相关专业的硕士及以上学历的。如果是算法工程师之类的半工程和半研究的人员,可以把相关的基础章节复习一下。如果是非相关专业,那么还是要和学生一样,把基础搞一下,特别是机器学习和深度学习的基础,外加一部分相关图论的部分。然后可以仔细学习基础的GNN模型及其原理,理解其核心公式,同时结合现有的库和例子上手学习编写GNN的模型,特别是整个GNN训练和推断的pipeline的构建,这样就能把GNN运用到自己实际的项目里。然后就可以跟进一些SOTA的模型,比如《基础》的第8章,《导论》的12-14章里相关的方向。在有了一定的实践经验之后,可以看看相关的一些训练技巧层面的内容,比如《基础》的第5章,《导论》的第10章,《图DL》的第7章和14.2小节。因为GNN的训练,特别是小批次训练和其他DL的训练还是有些区别,这里面涉及的内容比较多,所以不仅要看这些内容,还需要根据使用的库(DGL或PyG)的例子来学习怎么做小批次训练和推断。
对于搞科研的人来说,如果不是专门搞GNN方向的,可以浏览一下《基础》、《导论》和《图DGL》。大致了解GNN是什么东西,能找到自己研究课题可以结合的东西,再细看论文也不迟。毕竟GNN也是深度学习的一个分支,很多的原理都是想通和可以相互借鉴的。如果学科跨度比较大,而又希望深入的学学GNN,这里推荐《图DL》。相比其他3本,《图DL》更类似于教材,可以比较深入的学习。
对一些只是希望了解图神经网络是什么的读者。只要看看每本书的第1和最后关于应用的一章看看就好了。这里《基础》和《导论》对于做PPT是相对容易理解的。
好了,基本比较就写这么多。GNN现在越来越热,相应的中文书从2019年初只看到一本到2021年初开始井喷一样的一下出来了3本,预计后续会有相应的教科书出来,现在的学生有福。
由于《图DL》刚刚入手不久,只是匆匆浏览了一下全书,仔细读完后,再补一个读后感吧。
由于此领域的发展非常迅速,GNN背后的知识还不是那么容易获得。目前,你可以在互联网上以研究论文、文章或博客的形式找到散落在各地的GNN理论。我们缺乏的是一本GNN
书籍
,或者是一本在线资源汇编,来帮助人们进入了解这个领域的工作。
经过一番搜索,我发现其实有几个相当不错的资源,以一种容易理解的方.
第三章 卷积
神经网络
第四章 表示学习
传统机器学习:通过人的先验知识在原始数据基础上手动获取特征(特征工程),然后带入下游学习任务,学习效果的好坏很大程度上取决于特征获取的好坏。
深度学习
:将原始数据作为输入带入学习任务,直接输出目标。称为端到端的学习,即将表示学习(对应传统机器学
文本分类指的是在制定文本的类别体系下,让计算机学会通过某种分类
算法
将待分类的内容完成分类的过程.与文本分类有关的
算法
已经被应用到了网页分类、数字
图
书馆、新闻推荐等领域.本文针对短文本分类任务的特点,提出了基于多
神经网络
混合的短文本分类模型(Hybrid Short Text Classical Model Base on Multi-neural Networks).通过对短文本内容的关键词提取进行重构文本特征,并作为多
神经网络
模型的输入进行类别向量的融合,从而兼顾了FastText模型和TextCNN模型的特点.实验结果表明,相对于目前流行的文本分类
算法
而言,多
神经网络
混合的短本文分类模型在精确率、召回率和F1分数等多项指标上展现出了更加优越的
算法
性能.