交叉熵损失函数不是由极大似然估计推出来的嘛?要说区别那就是一个对数函数的差别吧😂