第一题要自己写公式推导, 从Y[sa,i,k] = sum_over_j(A[sa,i,j]*B[M[sa],j,k])求导可得。矩阵运算感觉比较麻烦就直接4个for循环了。dM不存在导数不用更新。 主要就这三句 sb = M[sa] dA[sa,i,j] += B[sb,j,k]*D[sa,i,k] dB[sb,j,k] += A[sa,i,j]*D[sa,i,k]