Извините, если это глупый вопрос, но я просто не могу уложить это в голове.
Я пытаюсь создать свою первую нейронную сеть, которая принимает данные MNIST (28x28), на которых нарисованы от руки числа 0–9, и выводит, какие цифры считает нейронная сеть. На последнем уровне мне нужно создать функцию softmax, которая может выводить все вероятности этих чисел, которые затем суммируются до 1.
def softmax(z):
exps = np.exp(z - z.max())
return exps/np.sum(exps), z
На этом этапе все должно быть хорошо.
Но теперь мы переходим к обратному распространению ошибки => Я нашел в Интернете эту функцию softmax для обратного распространения ошибки.
Извините, если это глупый вопрос, но я просто не могу уложить это в голове. Я пытаюсь создать свою первую нейронную сеть, которая принимает данные MNIST (28x28), на которых нарисованы от руки числа 0–9, и выводит, какие цифры считает нейронная сеть. На последнем уровне мне нужно создать функцию softmax, которая может выводить все вероятности этих чисел, которые затем суммируются до 1.
[code]def softmax(z): exps = np.exp(z - z.max())
return exps/np.sum(exps), z [/code]
На этом этапе все должно быть хорошо. Но теперь мы переходим к обратному распространению ошибки => Я нашел в Интернете эту функцию softmax для обратного распространения ошибки.