在高性能计算、数据科学、生物信息学和深度学习方面的计算密集型 CUDA C++ 应用,可以通过使用多个GPU来加速,这可以增加吞吐量和(或)减少总体运行时间。当计算和内存传输并发重叠时,计算可以扩展至多个GPU 而不增加内存传输的开销。对于拥有多GPU服务器的组织,无论是在云上还是在NVIDIA DGX系统上,这些技术使您能够通过GPU 加速应用程序,以实现最高性能。本课程所讲授的单节点多GPU技术,对于未来将应用扩展至多个节点至关重要。
本课程包含如何编写CUDA C++ 应用程序,正确且有效地使用单一节点中的所有 GPU ,实现大幅提升应用程序性能,发挥多 GPU 系统的最佳经济效益。
完成本课程后,您将能够了解:
下载课程大纲 (PDF 243 KB)