写kernel的时候查英伟达的手册,一些论文的优化方法,比如基础的共享内存