LR 可以收敛应该是因为这是一个凹函数,有全局的极值点