NVIDIA 联合智能产业媒体智东西推出的「NVIDIA 超级公开课」,专注于系统讲解最新 GPU 产品、行业 AI 加速技术和深度学习训练、推理解决方案,以及在互联网、数据科学、智能医疗、金融、科学计算等重要行业中的加速案例。截至 2020 年 1 月,NVIDIA 超级公开课已完结 35 讲,直播讲解和互动答疑超过 3000 分钟。
NVIDIA 超级公开课的讲师既有来自 NVIDIA 的技术工程师、资深研究人员,也有来自诸如阿里巴巴、百度、图玛深维、希氏异构、清华大学、复旦大学、上海交通大学等 NVIDIA 优秀合作方的开发负责人、创业者、资深学者和科研人员。他们系统、专业和极具实战价值地讲授和答疑,已经影响了无数的开发者、数据科学家、科研人员和学生。截止2020年1月,NVIDIA 超级公开课累计已有超过 11 万人次收听。
以下为公开课详情,点击课程题目可查看课程简介、提纲以及回看入口。更多 NVIDIA GPU 加速各行业 AI 最新案例,敬请关注 “英伟达 NVIDIA 企业解决方案微信公众号” (微信号: NVIDIA-Enterprise)。
百度就采用大规模的NVIDIA Tesla P4为主的GPU集群这一专门为深度学习设计的GPU集群在2017年11月推出了一个开放的定制化训练和服务平台:EasyDL。本次揭秘百度开发工程师揭密EasyDL定制化训练和服务平台如何为每一位开发者赋能。
AI赋能行业的痛点
EasyDL服务端和设备端技术解析
GPU集群加速EasyDL训练与推理
EasyDL赋能行业案例分享
2018年9月13日,NVIDIA推出首款基于新一代图灵架构打造的GPU——Tesla T4,采用多精度 Turing Tensor Core和全新 RT Core,用于机器学习和数据推理。
当前线上推理端的困境
新一代硬件推理平台T4 GPU架构剖析
线上自动优化工具TensorRT5特性介绍
TensorRT Inference Server如何提高线上推理服务部署效率
生成式对抗网络GAN因其在图像合成方面的巨大潜力,受到了广大开发者和研究机构的广泛关注和深入研究,是目前深度学习领域最受大家关注的方向之一。我们将为大家深入解读GauGAN背后的技术秘密。
生成式对抗网络研究进展
基于GAN空间自适应归一化技术解析
GauGAN高逼真图像合成的实现与挑战
课程将从TensorRT的高级特性出发,告诉你如何利用TensorRT的高级特性加速自定义网络层、低精度数据支持、以及对不同深度学习框架的支持方法,并辅以代码示例,深入浅出进行系统讲解。
前期课程回顾
TensorRT高级特性详解
针对SSD的目标检测推理加速实例
总结:深度学习推理优化的基本原则
作为致力于将深度学习人工智能技术引入到智能医学诊断的系统开发商,图玛深维采用了DGX Station以及CUDA并行加速来进行神经网络模型的训练。
DGX Station在助力智能医疗,NVIDIA更早发布的超级计算机DGX-1也已经在医疗行业快速商用。去年9月,NVIDIA宣布已经向美国MGH&BWH CCDS研究中心出货了第一台基于Telsa V100计算卡的DGX-1,帮助他们建立医疗图片智能分析AI系统。通过这堂课,您将学会:
走出癌症认知和诊断误区;
深度学习在推动智能医疗方面的应用;
如何更好地为医疗影像分析训练算法;
图玛深维σ-Discover Lung系统详解;
σ-DiscoverLung在肺结节临检测和诊断的实践案例
作为NVIDIA合作伙伴,希氏异构推出了专用于医学图像人工智能技术的超算平台“神农一号”,希氏异构也是首次解密医疗图像AI领域最强超级计算机。通过这堂课,您将学会:
医学AI的发展历程
深度学习与GPU的平行运算
希氏异构医学超算平台
AI赋能医疗,推动产业变革
NVIDIA推出了为医疗健康行业专门设计的端到端AI计算平台,其GPU 加速深度学习解决方案可为实时病理评估、即时干预、临床决策预测分析的医疗健康和医学研究应用设计更为复杂的神经网络。深度讲解深度学习在药物研发、基因研究和疾病诊断方面的应用。通过这堂课,您将学会:
深度学习在医疗领域发展现状及常见应用场景
深度学习加速药物研发
深度学习加速基因研究
深度学习加速疾病诊断
医疗领域英伟达解决方案平台
Clara医学影像平台核心是Clara AGX,以NVIDIA Xavier AI运算模组和Turing GPU为基础运算架构,辅以 Clara 软件开发套件,允许开发人员通过开发各种应用程序来处理现有系统的数据。Clara平台可以将存储在医疗设备中的数据转换为动态的医学影像数据,帮助医疗设备提升成像质量,降低因为医疗设备产生的误诊率。
医疗影像发展近况简介
医疗影像平台Clara的成像原理及优势
人工智能对医学图像领域的影响
NVIDIA在智能医疗领域的研究
迁移学习在医学影像分析中的应用
提升医学影像分析效率的工具包介绍
磁共振影像是医学影像中常见的一种,几乎适用于全身各系统的不同疾病,例如肿瘤、炎症、创伤、退行性病变,以及各种先天性疾病等的检查。那么,如何使用深度学习对磁共振影像进行分析处理呢?
磁共振医学影像数据处理中的挑战
使用NVIDIA DGX Station GPU工作站搭建医学影像分析的深度学度环境
不同深度学习算法在磁共振医疗影像中的应用案例
课程介绍:智能信贷,智慧银行、智能投顾、智能投研、智能保险和智能监管是当前人工智能在金融领域的主要应用,分别作用于银行运营、投资理财、保险和监管等业务场景,我们将推出第一场AI金融主题的公开课。
数据科学对传统行业的变革
RAPIDS最新架构解读
RAPIDS不同组件的特点与功能
RAPIDS在金融领域的应用
NVIDIA为开发者们打造了NVIDIA GPU Cloud(简称NGC),一个用于深度学习和高性能计算的容器。开发者可以通过NGC优化的深度学习框架、HPC应用程序及可视化容器,大大简化深度学习的开发过程,不必拥有本地GPU、不必搭建开发环境,借助NGC就可以方便、快速地进行深度学习和高性能计算。通过这堂课,您将学会:
Deep Learning软件部署的挑战与NGC解决方案
NGC使用场景和软件堆栈介绍
如何注册与使用NGC
通过NGC进行深度学习训练和推理实战
NVIDIA GPU CLOUD(NGC)平台通过容器镜像将深度学习软件依赖库进行封装,开发者可以在NGC平台上下载不同的深度学习框架不同版本的容器镜像,快速进行应用开发,省去了软件安装、编译和部署的时间。目前NGC平台可以支持深度学习、机器学习、高性能计算等不同领域的七十多款软件。本课程将介绍以下内容:
NGC详解及其优势
NGC如何简化GPU应用软件部署
不同领域如何使用NGC加速应用开发
应用案例分析
空间天气预报问题可以抽象为磁流体动力学(MHD)问题。由于其复杂性,许多方法,都采用不同形式的近似来进行求解,但是这对最终解的精度有较大的影响。 PPMLR-MHD方法可以保证有更高阶的空间精度和更小的数值耗散度,但是也面临着更大的计算挑战,我们采用GPU集群来解决这一实际的大型计算密集型应用问题,采用混合MPI+OpenACC+CUDA编程,GPU的直接内存访问,Streaming,数据重组等手段,实现了大幅度的性能提升,满足了实时空间天气预报的要求。通过这堂课,您将学会:
NVIDIA GPU在高性能领域的应用
NVIDIA Tesla Volta GPU核心架构和特点
NVIDIA DGX系统架构与高性能计算
GPU集群运维和作业调度
至今已有数种深度学习框架,如深度神经网络、卷积神经网络和深度置信网络和递归神经网络已被应用在计算机视觉、语音识别、自然语言处理、生物信息学等领域并获取了极好的效果。揭秘深度学习的讲解,并利用NVIDIA交互式深度学习训练平台教你应用深度学习。通过这堂课,您将学会:
机器学习、深度学习和人工智能的前世今生
深度学习的应用范围
深度学习的实现及特点
上手NVIDIA交互式深度学习训练平台
NVIDIA DGX系统专为深度学习定制的超级计算机组合,基于全新NVIDIA Volta GPU平台而构建,包括DGX Station、DGX-1、DGX-2和NGC(NVIDIA GPU Cloud)等。旨在为数据科学家提供适用范围包括桌面、数据中心乃至云端探索人工智能所需的强大工具,其系列产品针对拥有不同需求的用户,为用户工作或研究提供强大工具更高性能。通过这堂课,您将学会:
不同类型AI服务器之比较分析
选择GPU服务器的基本原则
AI超级计算机DGX系统详解
NGC云平台使用方法和价值
DGX系统快速部署的最佳攻略
DGX系统各行业应用案例
飞桨(PaddlePaddle),是百度2016年宣布开源的一款深度学习平台,同时也是国内最先开源开放、功能完备的深度学习框架。 NCCL(NVIDIA Collective Communications Library),是由 NVIDIA 提出的一种针对GPU性能优化的多GPU和多节点集体通信原语库。通过NCCL提供的多GPU和多节点通信,可以有效地扩展神经网络训练的规模,即使用多GPU进行并行训练。
大规模GPU集群通信的挑战
NCCL如何提升大规模GPU集群的数据传输效率
飞桨平台多GPU并行训练的基础能力
飞桨平台的并行训练案例解析
课程将从上海交大AI计算平台的搭建、遇到的挑战、架构特性、不同容器技术的差异、如何利用Spack创建自己的容器镜像到如何实现计算资源的灵活调度、实际应用优化案例等方面进行系统讲解。
上海交通大学校级人工智能平台建设的最新进展;
基于NVIDIA DGX-2的上海交通大学校级AI计算平台的搭建与特性
如何利用容器技术在AI计算平台实现高效的应用部署
上海交大用户在DGX-2上应用优化的成功案例
Tesla V100 基于最新的 NVIDIA Volta GV100 GPU 平台研发,采用台积电 12nmFFN 工艺,在815平方毫米的硅片上集成211亿个晶体管,5120个CUDA单元,640个Tensor单元,可在单一 GPU 上提供相当于100个 CPU 的性能,助力数据科学家、研究人员和工程师攻克曾经无法逾越的算力鸿沟。通过这堂课,您将学会:
Volta最新特性;
深度解析GV100微架构;
Volta加速HPC应用;
Volta加速Deep Learning应用;
Volta产品家族定位及选择;
空间天气预报问题可以抽象为磁流体动力学(MHD)问题。由于其复杂性,许多方法,都采用不同形式的近似来进行求解,但是这对最终解的精度有较大的影响。 PPMLR-MHD方法可以保证有更高阶的空间精度和更小的数值耗散度,但是也面临着更大的计算挑战,我们采用GPU集群来解决这一实际的大型计算密集型应用问题,采用混合MPI+OpenACC+CUDA编程,GPU的直接内存访问,Streaming,数据重组等手段,实现了大幅度的性能提升,满足了实时空间天气预报的要求。通过这堂课,您将学会:
空间天气预报的意义和挑战
大型科学应用程序在GPU上优化的难点
如何利用GPU来实现实时空间天气预报
空间天气预报问题可以抽象为磁流体动力学(MHD)问题。由于其复杂性,许多方法,都采用不同形式的近似来进行求解,但是这对最终解的精度有较大的影响。 PPMLR-MHD方法可以保证有更高阶的空间精度和更小的数值耗散度,但是也面临着更大的计算挑战,我们采用GPU集群来解决这一实际的大型计算密集型应用问题,采用混合MPI+OpenACC+CUDA编程,GPU的直接内存访问,Streaming,数据重组等手段,实现了大幅度的性能提升,满足了实时空间天气预报的要求。通过这堂课,您将学会:
NVIDIA GPU在高性能领域的应用
NVIDIA Tesla Volta GPU核心架构和特点
NVIDIA DGX系统架构与高性能计算
GPU集群运维和作业调度
作为NVIDIA合作伙伴,希氏异构推出了专用于医学图像人工智能技术的超算平台“神农一号”,希氏异构也是首次解密医疗图像AI领域最强超级计算机。通过这堂课,您将学会:
医学AI的发展历程
深度学习与GPU的平行运算
希氏异构医学超算平台
AI赋能医疗,推动产业变革
本次讲解将主要介绍甘霖博士所在团队近年来基于GPU等高性能平台,在全球气候模拟、地球物理勘探等重要地学领域的研究成果,包括一系列通用与专用的全新优化方法等。通过充分挖掘GPU的计算性能,甘霖博士所在团队在地学相关工作中取得了十分优异的加速性能,并且在包括天河超级计算机等平台上取得了良好的大规模模拟结果。
地球科学的意义及重要性
典型的地学应用
地学应用专用及通用的GPU优化方案
课程将从上海交大AI计算平台的搭建、遇到的挑战、架构特性、不同容器技术的差异、如何利用Spark创建自己的容器镜像到如何实现计算资源的灵活调度、实际应用优化案例等方面进行系统讲解。
上海交通大学校级人工智能平台建设的最新进展;
基于NVIDIA DGX-2的上海交通大学校级AI计算平台的搭建与特性
如何利用容器技术在AI计算平台实现高效的应用部署
上海交大用户在DGX-2上应用优化的成功案例
本课将解析无监督学习在图像转换领域的创新和应用,内容包括无监督学习的发展现状、无监督学习在图像转换领域的的应用和创新、少样本无监督图像转换FUNIT(Few-Shot Unsupervised Image-to-Image Translation)模型的实现和应用。
无监督学习发展现状
少样本无监督图像转换模型FUNIT解析
少样本无监督图像转换的应用前景和挑战
作为针对人工智能开发的GPU工作站,NVIDIA DGX Station的计算能力相当于400颗CPU,而所需功耗不足其1/20,而计算机的尺寸恰好能够整齐地摆放在桌侧。数据科学家可以用它来进行深度神经网络训练、推理与高级分析等计算密集型人工智能探索。通过这堂课,您将学会:
面向人工智能应用的计算引擎V100特性及DGX硬件设计
NVIDIA DGX软件堆栈解决方案
使用DGX-1搭建人工智能高性能计算集群
RAPIDS是针对数据科学和机器学习的GPU加速平台,该平台构建于Apache Arrow、PANDAS和SKLEARN等组件之上,通过CUDF数据过滤、CUML机器学习、CUGRAPH数据图像化来加速处理数据,为数据科学家提供标准化的流水线式工具,数据处理速度较仅用CPU提升50倍,大大提高了数据科学家的工作效率。
数据科学面临的挑战
开源软件平台RAPIDS架构解读
RAPIDS安装及使用方法
XGBoost算法简介
RAPIDS应用案例分享
课程介绍:智能信贷,智慧银行、智能投顾、智能投研、智能保险和智能监管是当前人工智能在金融领域的主要应用,分别作用于银行运营、投资理财、保险和监管等业务场景,我们将推出第一场AI金融主题的公开课。
数据科学对传统行业的变革
RAPIDS最新架构解读
RAPIDS不同组件的特点与功能
RAPIDS在金融领域的应用
空间天气预报问题可以抽象为磁流体动力学(MHD)问题。由于其复杂性,许多方法,都采用不同形式的近似来进行求解,但是这对最终解的精度有较大的影响。 PPMLR-MHD方法可以保证有更高阶的空间精度和更小的数值耗散度,但是也面临着更大的计算挑战,我们采用GPU集群来解决这一实际的大型计算密集型应用问题,采用混合MPI+OpenACC+CUDA编程,GPU的直接内存访问,Streaming,数据重组等手段,实现了大幅度的性能提升,满足了实时空间天气预报的要求。通过这堂课,您将学会:
空间天气预报的意义和挑战
大型科学应用程序在GPU上优化的难点
如何利用GPU来实现实时空间天气预报
本次讲解将主要介绍甘霖博士所在团队近年来基于GPU等高性能平台,在全球气候模拟、地球物理勘探等重要地学领域的研究成果,包括一系列通用与专用的全新优化方法等。通过充分挖掘GPU的计算性能,甘霖博士所在团队在地学相关工作中取得了十分优异的加速性能,并且在包括天河超级计算机等平台上取得了良好的大规模模拟结果。
地球科学的意义及重要性
典型的地学应用
地学应用专用及通用的GPU优化方案