梯度的维度是特征的维度吧?毕竟要给每个特征梯度下降。
不使用其他函数是应为逻辑回归是最大熵模型一种特殊情况,所以是sigmoid型的。
楼主什么方向啊?还问强化学习?