我见过的大多数示例都是在最后一层实现softmax。但是我读到Keras categorical_crossentropy
在最后一层后自动应用softmax,所以这样做是多余的,并且会导致性能下降。谁是对的?
转载请注明出处:http://www.jubohx.com/article/20230506/2210670.html
我见过的大多数示例都是在最后一层实现softmax。但是我读到Keras categorical_crossentropy
在最后一层后自动应用softmax,所以这样做是多余的,并且会导致性能下降。谁是对的?
转载请注明出处:http://www.jubohx.com/article/20230506/2210670.html