Отладка нейронной сети - упрощенная сеть, дающая странные результаты и иногда, когда точность высока, а иногда и в конеч

Отладка нейронной сети - упрощенная сеть, дающая странные результаты и иногда, когда точность высока, а иногда и в конеч ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Отладка нейронной сети - упрощенная сеть, дающая странные результаты и иногда, когда точность высока, а иногда и в конеч

Цитата

Сообщение Anonymous » 01 июн 2025, 07:35

Я хотел поработать над упрощенной нейронной сетью, не использующей кодирование Numpy или Aadvanced Type, чтобы по -настоящему сосредоточиться на чистой математике и фоне того, что делает работу нейронной сети. Я создал модель, используя проблему XOR, используя 2 вхождения, 2 скрытых узла и 1 выходной нейрон с скрытыми узлами, используя протекающую RELU для активации и вывода с использованием Sigmoid. Иногда он будет работать нормально с идеальной точностью, а в других случаях это не будет с плохой точностью, и это не будет исправлено с помощью тренировок. В настоящее время я работаю с уровнем обучения 0,5 с 500 эпохами, хотя я играл с обоими из них, без существенных изменений. Вот код, который у меня есть. Это в Python. Спасибо! < /P>
import math
import time

import numpy as numpy
import random

Input = [[0, 1], [0, 0], [1, 1], [1, 0]]
expectedoutputs = [1, 0, 0, 1]
alpha=0.01

def leakyrelu(x):
if x >= 0:
return x
else:
return alpha * x

def drelu(x):
if x >= 0:
returndx = 1
else:
returndx = alpha
return returndx

def sigmoid(x):
return 1 / (1 + math.exp(-x))

numofhiddennodes = 2
numofinputs = 2

def initweights():
w1 = []
# Xavier initialization for weights in the hidden layer
for i in range(0, numofhiddennodes):
h = []
for j in range(0, numofinputs):
# Xavier Initialization for weights
val = random.uniform(-1, 1) * math.sqrt(2 / (numofinputs + numofhiddennodes))
h.append(val)
w1.append(h)

# Xavier initialization for biases (usually a small value near zero)
b1 = [random.uniform(-1, 1) * math.sqrt(2 / (numofinputs + numofhiddennodes)) for _ in range(numofhiddennodes)]

# Xavier Initialization for weights in the output layer
w2 = [random.uniform(-1, 1) * math.sqrt(2 / (numofhiddennodes + 1)) for _ in range(numofhiddennodes)]
b2 = random.uniform(-1, 1) * math.sqrt(2 / (numofhiddennodes + 1))

return (w1, b1, w2, b2)

def forward(w1, b1, w2, b2, Input):
hidden = []
nvals = []
for i in range(0, numofhiddennodes):

nval = 0

for j in range(0, numofinputs):

nval = nval + Input[j] * w1[j]

nval = nval + b1
nvals.append(nval)
hidden.append(leakyrelu(nval))

oval = 0

for i in range(0, numofhiddennodes):
oval = oval + hidden * w2

oval = oval + b2

output = sigmoid(oval)

return output, hidden, nvals

def backprop(w1, b1, w2, b2, z, hiddens, inputs, epoch, expectedoutputs, learningrate, nvals):
zzero = expectedoutputs[Input.index(inputs)]

L = (z - zzero) * (z - zzero)

dldz = 2 * (z - zzero)

dzdy = z * (1 - z)

print(f"Gradient w.r.t. output: dldz = {dldz}, dzdy = {dzdy}")

for i in range(0, numofhiddennodes): #update w2

dydwi = hiddens

dldwi = dldz * dzdy * dydwi

print(f"Gradient for w2[{i}]: dldwi = {dldwi}")

w2 = w2 - learningrate * dldwi

dldb = dldz * dzdy #Adjusting B2

b2 = b2 - learningrate * dldb #b2

print(f"Gradient for b2: dldb = {dldb}")

for i in range(0, numofhiddennodes): #updating weight 1

for j in range(0, numofinputs):

dydhi = w2

dhidc = drelu(nvals)

dcdwi = inputs[j]

dcdwi = int(dcdwi)

dLdwone = dldz * dzdy * dydhi * dhidc * dcdwi
print(f"Gradient for w1[{i}][{j}]: dLdwone = {dLdwone}")
w1[j] = w1[i][j] - learningrate * dLdwone

for i in range(0,numofhiddennodes): #updating bias 1

dydhi = w2[i]

dhidc = drelu(nvals[i])

dcdbone = 1

dLdbone = dldz * dzdy * dydhi * dhidc * dcdbone

print(f"Gradient for b1[{i}]: dLdbone = {dLdbone}")

b1[i] = b1[i] - learningrate * dLdbone

return w1,b1,w2,b2, L

def train(epochs,Input,expectedoutputs, learningrate):
w1, b1, w2, b2 = initweights()
epoch = 1

for i in range(0, epochs):
tack = random.randint(0,3)

inputs = Input[tack]
output, hidden, nvals = forward(w1, b1, w2, b2, inputs)
w1,b1,w2,b2, Loss = backprop(w1, b1, w2, b2, output, hidden, inputs, epoch, expectedoutputs, learningrate, nvals)
epoch = epoch + 1
print("Loss: ", Loss)

return w1, b1, w2, b2

epoch = 1

def test():
learningrate = 0.5
epochs = 500
turn = 0

w1, b1, w2, b2 = train(epochs, Input, expectedoutputs, learningrate)

correctvals = []
for i in range(0,100):
turn = turn + 1
print("turn", turn)

randomvalue = random.randint(0,3)
set = Input[randomvalue]
exoutput = expectedoutputs[randomvalue]

recievedval,h,v = forward(w1, b1, w2, b2, set)

if recievedval >= 0.5:
recievedval = 1
else:
recievedval = 0
correctval = 0
if recievedval != exoutput:
correctval = 0
elif recievedval == exoutput:
correctval = 1
correctvals.append(correctval)

print("Accuracy:", sum(correctvals) / len(correctvals))
time.sleep(0.1)
print(correctvals)
print(w1, b1, w2, b2)

test()

Подробнее здесь: https://stackoverflow.com/questions/796 ... and-having

1748752523

Anonymous

 Я хотел поработать над упрощенной нейронной сетью, не использующей кодирование Numpy или Aadvanced Type, чтобы по -настоящему сосредоточиться на чистой математике и фоне того, что делает работу нейронной сети. Я создал модель, используя проблему XOR, используя 2 вхождения, 2 скрытых узла и 1 выходной нейрон с скрытыми узлами, используя протекающую RELU для активации и вывода с использованием Sigmoid. Иногда он будет работать нормально с идеальной точностью, а в других случаях это не будет с плохой точностью, и это не будет исправлено с помощью тренировок. В настоящее время я работаю с уровнем обучения 0,5 с 500 эпохами, хотя я играл с обоими из них, без существенных изменений. Вот код, который у меня есть. Это в Python. Спасибо! < /P>
import math
import time

import numpy as numpy
import random

Input = [[0, 1], [0, 0], [1, 1], [1, 0]]
expectedoutputs = [1, 0, 0, 1]
alpha=0.01

def leakyrelu(x):
if x >= 0:
return x
else:
return alpha * x

def drelu(x):
if x >= 0:
returndx = 1
else:
returndx = alpha
return returndx

def sigmoid(x):
return 1 / (1 + math.exp(-x))

numofhiddennodes = 2
numofinputs = 2

def initweights():
w1 = []
# Xavier initialization for weights in the hidden layer
for i in range(0, numofhiddennodes):
h = []
for j in range(0, numofinputs):
# Xavier Initialization for weights
val = random.uniform(-1, 1) * math.sqrt(2 / (numofinputs + numofhiddennodes))
h.append(val)
w1.append(h)

# Xavier initialization for biases (usually a small value near zero)
b1 = [random.uniform(-1, 1) * math.sqrt(2 / (numofinputs + numofhiddennodes)) for _ in range(numofhiddennodes)]

# Xavier Initialization for weights in the output layer
w2 = [random.uniform(-1, 1) * math.sqrt(2 / (numofhiddennodes + 1)) for _ in range(numofhiddennodes)]
b2 = random.uniform(-1, 1) * math.sqrt(2 / (numofhiddennodes + 1))

return (w1, b1, w2, b2)

def forward(w1, b1, w2, b2, Input):
hidden = []
nvals = []
for i in range(0, numofhiddennodes):

nval = 0

for j in range(0, numofinputs):

nval = nval + Input[j] * w1[i][j]

nval = nval + b1[i]
nvals.append(nval)
hidden.append(leakyrelu(nval))

oval = 0

for i in range(0, numofhiddennodes):
oval = oval + hidden[i] * w2[i]

oval = oval + b2

output = sigmoid(oval)

return output, hidden, nvals

def backprop(w1, b1, w2, b2, z, hiddens, inputs, epoch, expectedoutputs, learningrate, nvals):
zzero = expectedoutputs[Input.index(inputs)]

L = (z - zzero) * (z - zzero)

dldz = 2 * (z - zzero)

dzdy = z * (1 - z)

print(f"Gradient w.r.t.  output: dldz = {dldz}, dzdy = {dzdy}")

for i in range(0, numofhiddennodes): #update w2

dydwi = hiddens[i]

dldwi = dldz * dzdy * dydwi

print(f"Gradient for w2[{i}]: dldwi = {dldwi}")

w2[i] = w2[i] - learningrate * dldwi

dldb = dldz * dzdy #Adjusting B2

b2 = b2 - learningrate * dldb #b2

print(f"Gradient for b2: dldb = {dldb}")

for i in range(0, numofhiddennodes): #updating weight 1

for j in range(0, numofinputs):

dydhi = w2[i]

dhidc = drelu(nvals[i])

dcdwi = inputs[j]

dcdwi = int(dcdwi)

dLdwone = dldz * dzdy * dydhi * dhidc * dcdwi
print(f"Gradient for w1[{i}][{j}]: dLdwone = {dLdwone}")
w1[i][j] = w1[i][j] - learningrate * dLdwone

for i in range(0,numofhiddennodes): #updating bias 1

dydhi = w2[i]

dhidc = drelu(nvals[i])

dcdbone = 1

dLdbone = dldz * dzdy * dydhi * dhidc * dcdbone

print(f"Gradient for b1[{i}]: dLdbone = {dLdbone}")

b1[i] = b1[i] - learningrate * dLdbone

return w1,b1,w2,b2, L

def train(epochs,Input,expectedoutputs, learningrate):
w1, b1, w2, b2 = initweights()
epoch = 1

for i in range(0, epochs):
tack = random.randint(0,3)

inputs = Input[tack]
output, hidden, nvals = forward(w1, b1, w2, b2, inputs)
w1,b1,w2,b2, Loss = backprop(w1, b1, w2, b2, output, hidden, inputs, epoch, expectedoutputs, learningrate, nvals)
epoch = epoch + 1
print("Loss: ", Loss)

return w1, b1, w2, b2

epoch = 1

def test():
learningrate = 0.5
epochs = 500
turn = 0

w1, b1, w2, b2 = train(epochs, Input, expectedoutputs, learningrate)

correctvals = []
for i in range(0,100):
turn = turn + 1
print("turn", turn)

randomvalue = random.randint(0,3)
set = Input[randomvalue]
exoutput = expectedoutputs[randomvalue]

recievedval,h,v = forward(w1, b1, w2, b2, set)

if recievedval >= 0.5:
recievedval = 1
else:
recievedval = 0
correctval = 0
if recievedval != exoutput:
correctval = 0
elif recievedval == exoutput:
correctval = 1
correctvals.append(correctval)

print("Accuracy:", sum(correctvals) / len(correctvals))
time.sleep(0.1)
print(correctvals)
print(w1, b1, w2, b2)

test()
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79647189/neural-network-debugging-simplistic-network-producing-weird-results-and-having[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Функция st_makeenvelope (двойная точность, двойная точность, двойная точность, двойная точность, целое число) не существ

Последнее сообщение Anonymous « 07 авг 2025, 10:55
Добавлено в форуме JAVA

Anonymous » 07 авг 2025, 10:55 » в форуме JAVA

function st_makeenvelope (двойная точность, двойная точность, двойная точность, двойная точность, целое число) не существует
Подсказка: Никакая функция не соответствует данным имени и типам аргументов. Вам может потребоваться добавить явные типы....

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
07 авг 2025, 10:55
Точность нейронной сети меняется при сохранении и загрузке из файла.

Последнее сообщение Anonymous « 24 июл 2024, 19:54
Добавлено в форуме JAVA

Anonymous » 24 июл 2024, 19:54 » в форуме JAVA

Я считаю, что проблема в конструкторе MultNnet(String path, Activation[] активациях, Activation[] производных)
и/или методе void save(String path). Когда я вычисляю точность несколько раз в одном и том же экземпляре программы, она не меняется,...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
24 июл 2024, 19:54
Сверхнизкая точность модели нейронной сети

Последнее сообщение Anonymous « 06 окт 2024, 17:13
Добавлено в форуме Python

Anonymous » 06 окт 2024, 17:13 » в форуме Python

Я прошел руководство по оценке модели нейронной сети с использованием перекрестной проверки кода:
# Multiclass Classification with the Iris Flowers Dataset
import numpy
import pandas
from keras.models import Sequential
from keras.layers import...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
06 окт 2024, 17:13
Точность нейронной сети Python – правильная реализация?

Последнее сообщение Anonymous « 06 окт 2024, 17:17
Добавлено в форуме Python

Anonymous » 06 окт 2024, 17:17 » в форуме Python

Я написал простую нейронную сеть/MLP и получаю какие-то странные значения точности, и мне захотелось все перепроверить.
Это моя предполагаемая настройка: матрица функций с 913 выборками и 192 функции (913 192). Я классифицирую два результата,...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
06 окт 2024, 17:17
Почему точность проверки моей модели застряла во время обучения нейронной сети?

Последнее сообщение Anonymous « 17 июн 2025, 09:26
Добавлено в форуме Python

Anonymous » 17 июн 2025, 09:26 » в форуме Python

Я обучаю нейронную сеть для классификационной задачи с использованием tensorflow/keras. Точность обучения улучшается по сравнению с эпохами, но точность проверки остается постоянной и низкой. Я подозреваю, что это может быть переоборудовано, но...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
17 июн 2025, 09:26

Вернуться в «Python»