请问一下transformer是哪种手撕呀,写论文中原理性公式,还是直接pytorch那种