KSSOLV(Kohn-Sham Solver)是一款基于平面波基组的求解Kohn-Sham密度泛函理论的软件,采用MATLAB语言编写,类似Python为解释型语言,易于读写,可降低学习成本。KSSOLV无需额外编译安装,支持Windows、Mac OS X和Linux系统。其中KSSOLV-GPU是KSSOLV的英伟达GPU加速版本。
KSSOLV-GPU通过GPU加速后,可快速求解第一性原理密度泛函理论KS方程,且无需安装即可运行。KSSOLV-GPU加速后在个人PC端可达到主流计算软件的速度,这使课堂上演示量子力学计算成为可能。KSSOLV是一套既可以代替主流计算软件科研,又适用于教学的科教一体化计算程序,可以应用到前沿交叉科学研究和教学中。
放眼当前国内市场,占主流地位的是欧美等国外计算软件。它们大多采用Fortran/C++编写,不易理解,多数软件不支持在个人PC的WINDOWS环境下运行,这不利于将第一性原理计算程序搬入课堂进行教学演示。KSSOLV-GPU采用解释性语言MATLAB语言编写,学习成本较较低,易于读写,无需编译即可在个人PC的WINDOWS操作系统下快速运行,再加上便捷的可视化界面,让第一性原理软件在课堂上演示成为现实,可以填补国内第一性原理计算教学软件的空白。同时,借助KSSOLV-GPU平台还可以开展项目式和仿真式相结合的教学模从而给本科生、研究生量子力学的创新型教学提供有力的平台,培养学生的计算思维和并行计算能力,为以后专业课学习和科研能力的培养打下扎实的计算基础。
在RTX3090、V100和A100三种不同类型的GPU上测试了矩阵乘法( mtimes)、快速傅里叶变换( fft )、元素积(times)、水平级联( horzcat )、矩阵除法( mrdivide )和特征值( eig )的性能,并与MATLAB中的CPU进行了比较,用加速比来表示每个GPU的加速能力。
图 4-1-1 ( a )矩阵乘法( mtimes)、( b )快速傅里叶变换( fft )、( c )元素乘积(times)、( d )水平级联( horzcat )、( e )矩阵除法(mrdivide )和( f )特征值( eig )随测试矩阵维数增加,在MATLAB上,三种不同类型的GPU上分别与CPU的运算性能进行比较。
可以看到,不同的操作在GPU上都有相当大的加速比。对于V100和RTX3090 GPU,RTX3090作为最新的消费级GPU在eig、horzcat和times操作上的性能与V100相当甚至更好,但在fft上的性能只是V100的一半,在mtimes 和 mrdivide操作上的性能分别是V100的1/10和1 /5左右。因此,可以在此基础上推断出对KSSOLV迭代对角化算法GPU加速性能良好。
表4-2-1 取Ecut = 20.0Ha,在CPU、RTX3090、V100和A100上分别对LOBPCG、Davidson、Chebyfilt和OMM对角化算法的散点图进行线性拟合得到标度。
在不同GPU上测试了不同算法的加速比,结果如图4-2-2所示。加速比(speedup ratio)的计算公式为:
2021年,中国科学技术大学微电子学院龙世兵教授、孙海定研究员团队在氮化镓(GaN)半导体p-n异质结中实现了独特的光电流极性反转(即双向光电流现象)。相关成果以“Bidirectional photocurrent in p–n heterojunction nanowires”为题于9月23日发表在《自然 电子学》上(Nature Electronics 2021, 4, 645–652)。这是中国科大首次以第一作者单位在电子器件领域知名期刊
Nature Electronics
上发表研究论文。中科大研究员、瀚海量子创始人胡伟参与了该项目的联合攻关,利用团队的KSSOLV软件帮助作者完成论文中的DFT理论计算部分。
[1] 插值可分密度拟合分解加速线性响应时变密度泛函理论计算分子和固体的激发能
Wei Hu, Jie Liu*, Yingzhou Li, Zijing Ding, Chao Yang, and Jinlong Yang*, Accelerating excitation energy computation in molecules and solids within linear-response time-dependent density functional theory via interpolative separable density fitting decomposition, J. Chem. Theory Comput.16:964-973, (2020).
[2] 线性响应时变密度的两级迭代求解器
Jie Liu, Wei Hu, Jinlong Yang*, Two-level iterative solver for linear response time-dependent density functional theory with plane wave basis set, J. Chem. Phys. 154(6): 064101, (2021).
[3]加速自洽场迭代的椭圆预调节器
Accelerating Optical Absorption Spectra and Exciton Energy Computation via Interpolative Separable Density Fitting, Wei Hu, Meiyue Shao, Andrea Cepellotti, Felipe H.da Jornada, Lin Lin, Kyle Thicke, Chao Yang*, Steven G. Louie, ICCS, 2018, 10861, 604-617.
[4] 正交约束优化问题的交替梯度法
Yanmei Sun, Yakui Huang*, An alternate gradient method for optimization problems with orthogonality constraints,Numer. Algebra, Control. Optim.11(4): 665-676, (2021).
[5]G
0
W
0
中的低秩分解
MeiYue Shao, Lin Lin, Chao Yang*, Fang Liu, Felipe H. Da Jornada, Jack Deslippe & Steven G. Louie , Low rank approximation in G
0
W
0
calculations,Sci. China Math.59:1593–1612 (2016)
[6]在GW近似下从头计算多电子自能的数值积分
Fang Liu*, Lin Lin, Derek Vigil-Fowler, et al. ,Numerical integration for ab initio many-electron self energy calculations within the GW approximation. J. Comput. Phys. 286: 1-13 (2015).
[7]电子排斥积分张量的超收缩格式的压缩
Jianfeng Lu*,Lexing Ying,Compression of the electron repulsion integral tensor in tensor hypercontraction format with cubic scaling cost, J. Comput. Phys. 302: 329-335, (2015).
[8] 广义戴维森算法的网格独立性
C.T.Kelley*,J.Bernholc, et al. ,Mesh independence of the generalized Davidson algorithm, J. Comput. Phys. 409: 109322, (2020).
[9]正交约束优化问题的结构拟牛顿方法
Jiang Hu*, Bo Jiang, Lin Lin, Zaiwen Wen, and Ya-xiang Yuan,Structured quasi-Newton methods for optimization with orthogonality constraints, SIAM J. Sci. Comput. 41(4),(2019).
[10]使用间断伽辽金算法的量子模拟
Jarrod R McClean , Fabian M Faulstich, Qinyi Zhu, et al. Discontinuous Galerkin discretization for quantum simulation of chemistry, New. J. Phys. 22, 093015, (2020).
[11]KohnSham平面波离散后的后处理
Cancès E, Dusson G, Maday Y, et al. A perturbation-method-based post-processing for the planewave discretization of Kohn–Sham models, J. Comput. Phys.307: 446-459, (2016).
[12]大规模特征空间计算中的迹最小化
Zaiwen Wen*, Chao Yang, Xin Liu ,Yin Zhang, Trace-penalty minimization for large-scale eigenspace computation, J. Sci. Comput., 66:1175-1203, (2016).
[13]精确Hessian自适应正则化自洽场迭代法用于电子结构计算
Zaiwen Wen, Andre Milzarek, Michael Ulbrich, Hongchao Zhang, Adaptive regularized self-consistent field iteration with exact Hessian for electronic structure calculation, SIAM J. Sci. Comput. 35(3), (2013).
[14]系综密度泛函理论的近端梯度法
Michael Ulbrich, Zaiwen Wen, Chao Yang, Dennis Klöckner, Zhaosong Lu, A proximal gradient method for ensemble density functional theory, SIAM J. Sci. Comput. 37(4),(2015).
[15] p-n异质结纳米线的双向光电流
Danhao Wang, Xin Liu, Yang Kang, et al., Bidirectional photocurrent in p–n heterojunction nanowires,Nat. Electron. 4(9), 645-652, (2021).
[16] 利用边缘修饰的磷烯纳米带设计直接z型异质结用于光催化整体水分离
Yunzhi Gao, Cenfeng Fu, Wei Hu*, and Jinlong Yang*, Designing Direct Z-Scheme Heterojunctions Enabled by Edge-Modified Phosphorene Nanoribbons for Photocatalytic Overall Water Splitting, J Phys. Chem. Lett. 13: 1-11, (2021).