加快矩阵乘法可还行,我记得一个清华同学做体系结构的研究方向就做的这个。。