ПИНН не учится - Цифровое Кемерово

ПИНН не учится ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Цитата

Сообщение Anonymous » 17 сен 2024, 13:12

Я пытаюсь начать работу с pinns, поэтому создаю этот простой скрипт для обучения mlp, используя только оду.
Ода, которую я пытаюсь решить, — это y = dy/dx. Эта ода очень проста, но я использую ее как игрушечный пример, чтобы познакомиться с пинами. В этом скрипте я использую numpy, а не другие фреймворки ml. Проблема, с которой я столкнулся, заключается в том, что сеть не обучается, хотя я пытался настроить скорость обучения, размер сети, инициализацию весов, а также вклад потери оды и потери граничных условий. Любые идеи будут оценены по достоинству.
import numpy as np
import matplotlib.pyplot as plt

def tanh(x):
return np.tanh(x)

def tanh_derivative(x):
return 1 - np.tanh(x)**2

def initialize_adam(parameters):
v = {}
s = {}

for key in parameters.keys():
v[key] = np.zeros_like(parameters[key])
s[key] = np.zeros_like(parameters[key])

return v, s

def initialize(n1, n2, n3, n4):

W1 = np.random.normal(0,0.1,size = (n2, n1))
B1 = np.random.uniform(-0.5, 0.5, size=(n2, 1))
W2 = np.random.normal(0,0.1,size = (n3, n2))
B2 = np.random.uniform(-0.5, 0.5, size=(n3, 1))
W3 = np.random.normal(0,0.1,size = (n4, n3))
B3 = np.random.uniform(-0.5, 0.5, size=(n4, 1))

parameters = {'W1':W1,'W2':W2,'W3':W3,'B1':B1,'B2':B2,'B3':B3}
return parameters

def forward_propagation(A0, parameters:dict):
W1 = parameters['W1']
W2 = parameters['W2']
W3 = parameters['W3']
B1 = parameters['B1']
B2 = parameters['B2']
B3 = parameters['B3']

Z1 = np.dot(W1, A0) + B1
A1 = tanh(Z1)
Z2 = np.dot(W2, A1) + B2
A2 = tanh(Z2)
Z3 = np.dot(W3, A2) + B3
Y_hat = Z3 #Y_hat

forward = {'Z1':Z1,'A1':A1,'Z2':Z2,'A2':A2,'Z3':Z3,'Y_hat':Y_hat}
return forward

def back_propagation(A0,Y,forward:dict,parameters:dict,dydx):
W1 = parameters['W1']
W2 = parameters['W2']
W3 = parameters['W3']

A1 = forward['A1']
A2 = forward['A2']
Y_hat = forward['Y_hat']

Z1 = forward['Z1']
Z2 = forward['Z2']
Z3 = forward['Z3']

network_initial_condtion = forward_propagation(A0[0][0]*np.ones_like(A0), parameters) #netowrk ouput at x = A0[0][0]
Y0 = network_initial_condtion ['Y_hat']

initial_condition_error = Y0 - Y[0]
ode_error = Y_hat - dydx

l1 = 1
l2 = 0.01

m = A0.shape[1]

dldy = (1/m) * (l1*ode_error + l2*initial_condition_error)

dldz3 = dldy
dldw3 = np.dot(dldz3, np.transpose(A2))
dldb3 = np.sum(dldz3,axis=1, keepdims=True)

dlda2 = np.dot(W3.T, dldz3)
dldz2 = dlda2 * tanh_derivative(Z2)
dldw2 = np.dot(dldz2, np.transpose(A1))
dldb2 = np.sum(dldz2,axis=1, keepdims=True)

dlda1 = np.dot(W2.T, dldz2)
dldz1 = dlda1 * tanh_derivative(Z1)
dldw1 = np.dot(dldz1, np.transpose(A0))
dldb1 = np.sum(dldz1,axis=1, keepdims=True)

backward = {'W1':dldw1,'B1':dldb1,'W2':dldw2,'B2':dldb2,'W3':dldw3,'B3':dldb3}

return backward

def gradient(forward:dict,parameters:dict):
W1 = parameters['W1']
W2 = parameters['W2']
W3 = parameters['W3']

Y_hat = forward['Y_hat']
Z1 = forward['Z1']
Z2 = forward['Z2']

# graidents in relation to network outpout Y_hat
dydy = np.ones_like(Y_hat )
dydz3 = dydy

dyda2 = np.dot(W3.T, dydz3)
dydz2 = dyda2 * tanh_derivative(Z2)

dyda1 = np.dot(W2.T, dydz2)
dydz1 = dyda1 * tanh_derivative(Z1)

dydx = np.dot(W1.T, dydz1)

return dydx

def update_adam(parameters, grads, v, s, t, learning_rate=None, beta1=0.9, beta2=0.999, epsilon=1e-8):
v_corrected = {}
s_corrected = {}

for key in parameters.keys():
v[key] = beta1 * v[key] + (1 - beta1) * grads[key]
s[key] = beta2 * s[key] + (1 - beta2) * (grads[key] ** 2)

v_corrected[key] = v[key] / (1 - beta1 ** t)
s_corrected[key] = s[key] / (1 - beta2 ** t)

parameters[key] -= learning_rate * (v_corrected[key] / (np.sqrt(s_corrected[key]) + epsilon))

return parameters, v, s

def mean_squared_error(Y_hat, Y):
mse = np.mean((Y_hat - Y) ** 2)
return mse

def train(A0, Y, epochs, a, n1, n2, n3, n4):

parameters = initialize(n1, n2, n3, n4)
v,s = initialize_adam(parameters)

for i in range(1, epochs + 1):

forward = forward_propagation(A0, parameters)
dydx = gradient(forward,parameters)
gradients = back_propagation(A0,Y,forward,parameters, dydx)
parameters,v,s = update_adam(parameters, gradients, v, s, i, learning_rate=a)

Y_hat = forward['Y_hat'].flatten()

if i % 100 == 0 or i==1:
mse = mean_squared_error(Y_hat, Y)
print(f'Epoch: {i}/{epochs} MSE: {mse}')

return Y_hat

n1 = 1 #input
n2 = 18 #hidden 1
n3 = 18 #hidden 2
n4 = 1 #output

X = np.linspace(0, 3, 300)

Y = np.exp(X) #ode solution

m = len(X)
A0 = X.reshape((n1, m))

epochs = 100000
a = 0.001 #learning rate

Y_hat = train(A0, Y, epochs, a, n1, n2, n3, n4)

plt.figure(figsize=(12, 8))
plt.plot(X, Y, label='Original', color='b')
plt.plot(X, Y_hat, label='Predicted', color='black', linewidth=2)
plt.title('PINN')
plt.xlabel('X')
plt.ylabel('Y')
plt.legend()
plt.grid()
plt.show()

Подробнее здесь: https://stackoverflow.com/questions/789 ... t-learning

1726567922

Anonymous

Я пытаюсь начать работу с pinns, поэтому создаю этот простой скрипт для обучения mlp, используя только оду.
Ода, которую я пытаюсь решить, — это y = dy/dx. Эта ода очень проста, но я использую ее как игрушечный пример, чтобы познакомиться с пинами. В этом скрипте я использую numpy, а не другие фреймворки ml. Проблема, с которой я столкнулся, заключается в том, что сеть не обучается, хотя я пытался настроить скорость обучения, размер сети, инициализацию весов, а также вклад потери оды и потери граничных условий.  Любые идеи будут оценены по достоинству.
import numpy as np
import matplotlib.pyplot as plt

def tanh(x):
return np.tanh(x)

def tanh_derivative(x):
return 1 - np.tanh(x)**2

def initialize_adam(parameters):
v = {}
s = {}

for key in parameters.keys():
v[key] = np.zeros_like(parameters[key])
s[key] = np.zeros_like(parameters[key])

return v, s

def initialize(n1, n2, n3, n4):

W1 = np.random.normal(0,0.1,size = (n2, n1))
B1 = np.random.uniform(-0.5, 0.5, size=(n2, 1))
W2 = np.random.normal(0,0.1,size = (n3, n2))
B2 = np.random.uniform(-0.5, 0.5, size=(n3, 1))
W3 = np.random.normal(0,0.1,size = (n4, n3))
B3 = np.random.uniform(-0.5, 0.5, size=(n4, 1))

parameters = {'W1':W1,'W2':W2,'W3':W3,'B1':B1,'B2':B2,'B3':B3}
return parameters

def forward_propagation(A0, parameters:dict):
W1 = parameters['W1']
W2 = parameters['W2']
W3 = parameters['W3']
B1 = parameters['B1']
B2 = parameters['B2']
B3 = parameters['B3']

Z1 = np.dot(W1, A0) + B1
A1 = tanh(Z1)
Z2 = np.dot(W2, A1) + B2
A2 = tanh(Z2)
Z3 = np.dot(W3, A2) + B3
Y_hat = Z3 #Y_hat

forward = {'Z1':Z1,'A1':A1,'Z2':Z2,'A2':A2,'Z3':Z3,'Y_hat':Y_hat}
return forward

def back_propagation(A0,Y,forward:dict,parameters:dict,dydx):
W1 = parameters['W1']
W2 = parameters['W2']
W3 = parameters['W3']

A1 = forward['A1']
A2 = forward['A2']
Y_hat = forward['Y_hat']

Z1 = forward['Z1']
Z2 = forward['Z2']
Z3 = forward['Z3']

network_initial_condtion = forward_propagation(A0[0][0]*np.ones_like(A0), parameters) #netowrk ouput at x = A0[0][0]
Y0 = network_initial_condtion ['Y_hat']

initial_condition_error = Y0 - Y[0]
ode_error = Y_hat - dydx

l1 = 1
l2 = 0.01

m = A0.shape[1]

dldy = (1/m) * (l1*ode_error + l2*initial_condition_error)

dldz3 = dldy
dldw3 = np.dot(dldz3, np.transpose(A2))
dldb3 = np.sum(dldz3,axis=1, keepdims=True)

dlda2 = np.dot(W3.T, dldz3)
dldz2 = dlda2 * tanh_derivative(Z2)
dldw2 = np.dot(dldz2, np.transpose(A1))
dldb2 = np.sum(dldz2,axis=1, keepdims=True)

dlda1 = np.dot(W2.T, dldz2)
dldz1 = dlda1 * tanh_derivative(Z1)
dldw1 = np.dot(dldz1, np.transpose(A0))
dldb1 = np.sum(dldz1,axis=1, keepdims=True)

backward = {'W1':dldw1,'B1':dldb1,'W2':dldw2,'B2':dldb2,'W3':dldw3,'B3':dldb3}

return backward

def gradient(forward:dict,parameters:dict):
W1 = parameters['W1']
W2 = parameters['W2']
W3 = parameters['W3']

Y_hat = forward['Y_hat']
Z1 = forward['Z1']
Z2 = forward['Z2']

# graidents in relation to network outpout Y_hat
dydy = np.ones_like(Y_hat )
dydz3 = dydy

dyda2 = np.dot(W3.T, dydz3)
dydz2 = dyda2 * tanh_derivative(Z2)

dyda1 = np.dot(W2.T, dydz2)
dydz1 = dyda1 * tanh_derivative(Z1)

dydx = np.dot(W1.T, dydz1)

return dydx

def update_adam(parameters, grads, v, s, t, learning_rate=None, beta1=0.9, beta2=0.999, epsilon=1e-8):
v_corrected = {}
s_corrected = {}

for key in parameters.keys():
v[key] = beta1 * v[key] + (1 - beta1) * grads[key]
s[key] = beta2 * s[key] + (1 - beta2) * (grads[key] ** 2)

v_corrected[key] = v[key] / (1 - beta1 ** t)
s_corrected[key] = s[key] / (1 - beta2 ** t)

parameters[key] -= learning_rate * (v_corrected[key] / (np.sqrt(s_corrected[key]) + epsilon))

return parameters, v, s

def mean_squared_error(Y_hat, Y):
mse = np.mean((Y_hat - Y) ** 2)
return mse

def train(A0, Y, epochs, a, n1, n2, n3, n4):

parameters = initialize(n1, n2, n3, n4)
v,s = initialize_adam(parameters)

for i in range(1, epochs + 1):

forward = forward_propagation(A0, parameters)
dydx = gradient(forward,parameters)
gradients = back_propagation(A0,Y,forward,parameters, dydx)
parameters,v,s = update_adam(parameters, gradients, v, s, i, learning_rate=a)

Y_hat = forward['Y_hat'].flatten()

if i % 100 == 0 or i==1:
mse = mean_squared_error(Y_hat, Y)
print(f'Epoch:  {i}/{epochs} MSE: {mse}')

return Y_hat

n1 = 1   #input
n2 = 18  #hidden 1
n3 = 18  #hidden 2
n4 = 1   #output

X = np.linspace(0, 3, 300)

Y = np.exp(X) #ode solution

m = len(X)
A0 = X.reshape((n1, m))

epochs = 100000
a = 0.001  #learning rate

Y_hat = train(A0, Y, epochs, a, n1, n2, n3, n4)

plt.figure(figsize=(12, 8))
plt.plot(X, Y, label='Original', color='b')
plt.plot(X, Y_hat, label='Predicted', color='black', linewidth=2)
plt.title('PINN')
plt.xlabel('X')
plt.ylabel('Y')
plt.legend()
plt.grid()
plt.show()
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78993577/pinn-is-not-learning[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему мой ИИ в аккуратном Python не учится так, как ожидалось?

Последнее сообщение Anonymous « 03 янв 2024, 05:29
Добавлено в форуме Python

Anonymous » 03 янв 2024, 05:29 » в форуме Python

Я создал очень простую игру с игроком, который может двигаться только по оси X и должен уклоняться от случайных врагов, падающих с неба. Это была моя первая попытка создать ИИ в игре с использованием Neat-Python.

Вот игра:

def run_game(геномы,...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
03 янв 2024, 05:29
Проблема глубокого RL: потери уменьшаются, но агент не учится

Последнее сообщение Anonymous « 07 ноя 2024, 20:03
Добавлено в форуме Python

Anonymous » 07 ноя 2024, 20:03 » в форуме Python

Надеюсь, кто-нибудь сможет мне помочь. Я реализую базовый алгоритм градиента политики Vanilla для среды спортзала CartPole-v1 и не знаю, что делаю неправильно.
Что бы я ни пробовал, во время цикла обучения потери уменьшаются (так что модель на самом...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
07 ноя 2024, 20:03
Проблема глубокого RL: потери уменьшаются, но агент не учится

Последнее сообщение Anonymous « 08 ноя 2024, 19:07
Добавлено в форуме Python

Anonymous » 08 ноя 2024, 19:07 » в форуме Python

Надеюсь, кто-нибудь сможет мне помочь. Я реализую базовый алгоритм градиента политики Vanilla для среды спортзала CartPole-v1 и не знаю, что делаю неправильно.
Что бы я ни пробовал, во время цикла обучения потери уменьшаются (так что модель на самом...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
08 ноя 2024, 19:07
PPO постоянно учится ничего не делать в условиях сетчатого мира.

Последнее сообщение Anonymous « 03 янв 2025, 12:59
Добавлено в форуме Python

Anonymous » 03 янв 2025, 12:59 » в форуме Python

В настоящее время я пытаюсь создать собственную среду сетки с помощью PPO. Сетка 5x5, одна из ячеек — это склад, где запускается агент. Со временем элементы появляются в сетке случайным образом и остаются там в течение 15 временных шагов, прежде чем...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
03 янв 2025, 12:59
PPO постоянно учится ничего не делать в условиях сетчатого мира.

Последнее сообщение Anonymous « 03 янв 2025, 15:29
Добавлено в форуме Python

Anonymous » 03 янв 2025, 15:29 » в форуме Python

Я пытаюсь создать собственную среду сетки с помощью PPO. Сетка 5x5, одна из ячеек — это склад, где запускается агент. Со временем элементы появляются в сетке случайным образом и остаются там в течение 15 временных шагов, прежде чем снова исчезнуть....

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
03 янв 2025, 15:29

Вернуться в «Python»