我的印象中,用采样后的做
softmax,和你说的那个用sigmoid那个算正负样本都可以的。而且你说的这个效果会更好(论文中说的)。
https://arxiv.org/abs/1402.3722