Выход нейронной сети всегда сходится к тому же значению с пользовательскими потери косинусного угла

Выход нейронной сети всегда сходится к тому же значению с пользовательскими потери косинусного угла ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Выход нейронной сети всегда сходится к тому же значению с пользовательскими потери косинусного угла

Цитата

Сообщение Anonymous » 25 май 2025, 19:05

Для моего независимого исследовательского проекта в школе я использовал область формы вентилятора, чтобы нарисовать взаимосвязь между углом и значением COS, и поставил ее в качестве функции потери. Вот почему функция потери немного сложна. Но это может быть дифференцировано, и это не отрицательно, поэтому я подумал, что это работает должным образом.
, но выход модели всегда сходится к некоторому числу. Я дал штраф, уменьшил уровень нормализации, масштабировал вход через журнал, установил инициализацию модели, или также представил планировщика для решения этой проблемы. но результат был таким же.
Почему это происходит, и как это исправить?class Model(nn.Module):
def __init__(self):
super().__init__()
self.model = nn.Sequential(
nn.Linear(1, 128),
nn.LeakyReLU(negative_slope=0.01),
nn.LayerNorm(128),

nn.Linear(128, 512),
nn.LeakyReLU(),

nn.Linear(512, 512),
nn.LeakyReLU(),

nn.Linear(512, 128),
nn.LeakyReLU(),
nn.LayerNorm(128),

nn.Linear(128, 1),
nn.Sigmoid()
)
< /code>

loss_fuction < /p>
class Compute_fucs():
def __init__(self):
self.grid = torch.linspace(0, 1, steps=10000000, dtype=torch.float64)
self.scale = 1
def compute_circle(self, cos):
cos = cos.to('cuda')
starts = cos
xs = starts + (self.grid.to('cuda') * (1 - starts))
length = (self.grid[1]-self.grid[0])*(1 - starts)
length = length.to('cuda')
ys = torch.sqrt(torch.clamp(1 - xs**2, min = 1e-6))
result = length*ys
return result.sum(dim=1)

def compute_triangle(self, cos):
cos = cos.to('cuda')
return cos*torch.sqrt(torch.clamp(1 - cos**2,min = 1e-6))

def loss_fn(self, output, target,panerty):
cos = output

out1 = self.compute_circle(cos)
out2 = self.compute_triangle(cos)

output = 2*out1 + out2
target = target*(torch.pi / 180)

loss = torch.mean((target*self.scale - output*self.scale)**2)
return loss + panerty
< /code>

trainer < /p>
class Modeltrainer():
def __init__(self,model = None, opt = None, best_loss = None):
self.model = copy.deepcopy(model)
self._init_weights()
self.model = self.model.to('cuda')
self.opt = opt if opt is not None else torch.optim.Adam(model.parameters(), lr=0.001)
self.compute = Compute_fucs()
self.loss_fn = self.compute.loss_fn
self.best_loss = best_loss if best_loss is not None else 1e30
self.best_state = None
self.opt_best_state = None
self.scheduler = CyclicLR(self.opt,
base_lr=0.0001,
max_lr=0.006,
step_size_up=113,
mode='exp_range',
gamma=0.99994
)

def _init_weights(self):
for m in self.model.modules():
if isinstance(m, nn.Linear) and m.out_features != 1:
nn.init.kaiming_normal_(
m.weight,
a=0.01,
mode='fan_in',
nonlinearity='leaky_relu'
)
if m.bias is not None:
nn.init.constant_(m.bias, 0)
if isinstance(m, nn.Linear) and m.out_features == 1:
nn.init.xavier_uniform_(m.weight, gain=nn.init.calculate_gain('sigmoid'))
if m.bias is not None:
nn.init.constant_(m.bias, 0)

def is_decrease(self,y,x,creat_graph=None):
dy_dx = torch.autograd.grad(y.sum(), x,create_graph=creat_graph)[0]
dec = torch.tensor(0.0, dtype=torch.float64, device='cuda')
if (dy_dx > 0).any() == True:
dec += torch.sum(dy_dx[dy_dx > 0])

if (dy_dx < -1).any() == True:
dec += torch.sum(torch.abs(dy_dx[dy_dx < -1]))

return dec

def train(self,x,y,num_epochs):

self.best_state = copy.deepcopy(self.model.state_dict())
self.opt_best_state = copy.deepcopy(self.opt.state_dict())
finished = False
eval_loss = []
dataset = TensorDataset(x, y)
g = torch.Generator()
g.manual_seed(42)
train_loader = DataLoader(dataset, batch_size=8, shuffle=True, generator=g)
for epoch in range(num_epochs):

loop = tqdm(train_loader, desc=f"Epoch {epoch+1}/{num_epochs}",leave=False)
for x, y in loop:
x = x.to('cuda')
y = y.to('cuda')

self.opt.zero_grad()
output = self.model(x)
panerty = self.is_decrease(output,x,creat_graph=True)
loss = self.loss_fn(output, y, panerty)
loss.backward(retain_graph=True)
self.opt.step()

loop.set_postfix(loss=loss.item())
self.scheduler.step()
< /code>

train_model.py
< /blockquote>
data = torch.linspace(0, 90, steps=901, dtype=torch.float64)
data = data[:,None]
datax = torch.log(data+1).requires_grad_(True)
model = set.Model().double()
opt = torch.optim.Adam(model.parameters(), lr=0.001)
try:
trainer.train(datax,data,num_epochs=10**5)
finally:
torch.save( {'model_state_dict': trainer.best_state,
'optimizer_state_dict': trainer.opt_best_state,
'best_loss': trainer.best_loss}, './model.pth')
< /code>

Это коды, которые, как мне кажется, необходимы для воспроизведения проблемы. < /p>

Пример выхода < /p>
< /blockquote>
0.7720421077095195
0.7720421077352624
0.7720421077415953
0.772042107744354
0.7720421077458866
0.7720421077468598
.
.
.

Подробнее здесь: https://stackoverflow.com/questions/796 ... e-angle-lo

1748189154

Anonymous

 Для моего независимого исследовательского проекта в школе я использовал область формы вентилятора, чтобы нарисовать взаимосвязь между углом и значением COS, и поставил ее в качестве функции потери. Вот почему функция потери немного сложна. Но это может быть дифференцировано, и это не отрицательно, поэтому я подумал, что это работает должным образом.
, но выход модели всегда сходится к некоторому числу. Я дал штраф, уменьшил уровень нормализации, масштабировал вход через журнал, установил инициализацию модели, или также представил планировщика для решения этой проблемы. но результат был таким же.
Почему это происходит, и как это исправить?class Model(nn.Module):
def __init__(self):
super().__init__()
self.model = nn.Sequential(
nn.Linear(1, 128),
nn.LeakyReLU(negative_slope=0.01),
nn.LayerNorm(128),

nn.Linear(128, 512),
nn.LeakyReLU(),

nn.Linear(512, 512),
nn.LeakyReLU(),

nn.Linear(512, 128),
nn.LeakyReLU(),
nn.LayerNorm(128),

nn.Linear(128, 1),
nn.Sigmoid()
)
< /code>

loss_fuction < /p>
class Compute_fucs():
def __init__(self):
self.grid = torch.linspace(0, 1, steps=10000000, dtype=torch.float64)
self.scale = 1
def compute_circle(self, cos):
cos = cos.to('cuda')
starts = cos
xs = starts + (self.grid.to('cuda') * (1 - starts))
length = (self.grid[1]-self.grid[0])*(1 - starts)
length = length.to('cuda')
ys = torch.sqrt(torch.clamp(1 - xs**2, min = 1e-6))
result = length*ys
return result.sum(dim=1)

def compute_triangle(self, cos):
cos = cos.to('cuda')
return cos*torch.sqrt(torch.clamp(1 - cos**2,min = 1e-6))

def loss_fn(self, output, target,panerty):
cos = output

out1 = self.compute_circle(cos)
out2 = self.compute_triangle(cos)

output = 2*out1 + out2
target = target*(torch.pi / 180)

loss = torch.mean((target*self.scale - output*self.scale)**2)
return loss + panerty
< /code>

trainer < /p>
class Modeltrainer():
def __init__(self,model = None, opt = None, best_loss = None):
self.model = copy.deepcopy(model)
self._init_weights()
self.model = self.model.to('cuda')
self.opt = opt if opt is not None else torch.optim.Adam(model.parameters(), lr=0.001)
self.compute = Compute_fucs()
self.loss_fn = self.compute.loss_fn
self.best_loss = best_loss if best_loss is not None else 1e30
self.best_state = None
self.opt_best_state = None
self.scheduler = CyclicLR(self.opt,
base_lr=0.0001,
max_lr=0.006,
step_size_up=113,
mode='exp_range',
gamma=0.99994
)

def _init_weights(self):
for m in self.model.modules():
if isinstance(m, nn.Linear) and m.out_features != 1:
nn.init.kaiming_normal_(
m.weight,
a=0.01,
mode='fan_in',
nonlinearity='leaky_relu'
)
if m.bias is not None:
nn.init.constant_(m.bias, 0)
if isinstance(m, nn.Linear) and m.out_features == 1:
nn.init.xavier_uniform_(m.weight, gain=nn.init.calculate_gain('sigmoid'))
if m.bias is not None:
nn.init.constant_(m.bias, 0)

def is_decrease(self,y,x,creat_graph=None):
dy_dx = torch.autograd.grad(y.sum(), x,create_graph=creat_graph)[0]
dec = torch.tensor(0.0, dtype=torch.float64, device='cuda')
if (dy_dx > 0).any() == True:
dec += torch.sum(dy_dx[dy_dx > 0])

if (dy_dx < -1).any() == True:
dec += torch.sum(torch.abs(dy_dx[dy_dx <  -1]))

return dec

def train(self,x,y,num_epochs):

self.best_state = copy.deepcopy(self.model.state_dict())
self.opt_best_state = copy.deepcopy(self.opt.state_dict())
finished = False
eval_loss = []
dataset = TensorDataset(x, y)
g = torch.Generator()
g.manual_seed(42)
train_loader = DataLoader(dataset, batch_size=8, shuffle=True, generator=g)
for epoch in range(num_epochs):

loop = tqdm(train_loader, desc=f"Epoch {epoch+1}/{num_epochs}",leave=False)
for x, y in loop:
x = x.to('cuda')
y = y.to('cuda')

self.opt.zero_grad()
output = self.model(x)
panerty = self.is_decrease(output,x,creat_graph=True)
loss = self.loss_fn(output, y, panerty)
loss.backward(retain_graph=True)
self.opt.step()

loop.set_postfix(loss=loss.item())
self.scheduler.step()
< /code>


train_model.py
< /blockquote>
data = torch.linspace(0, 90, steps=901, dtype=torch.float64)
data = data[:,None]
datax = torch.log(data+1).requires_grad_(True)
model = set.Model().double()
opt = torch.optim.Adam(model.parameters(), lr=0.001)
try:
trainer.train(datax,data,num_epochs=10**5)
finally:
torch.save( {'model_state_dict': trainer.best_state,
'optimizer_state_dict': trainer.opt_best_state,
'best_loss': trainer.best_loss}, './model.pth')
< /code>

Это коды, которые, как мне кажется, необходимы для воспроизведения проблемы. < /p>

Пример выхода < /p>
< /blockquote>
0.7720421077095195
0.7720421077352624
0.7720421077415953
0.772042107744354
0.7720421077458866
0.7720421077468598
.
.
.
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79636830/neural-network-output-always-converges-to-same-value-with-custom-cosine-angle-lo[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Мои потери при тестировании увеличиваются, но потери поездов для нейронной сети уменьшаются. Что я должен делать?

Последнее сообщение Anonymous « 11 май 2024, 02:35
Добавлено в форуме Python

Anonymous » 11 май 2024, 02:35 » в форуме Python

Моя нейронная сеть
def buildModel(optimizer):
model = tf.keras.models.Sequential( )
model.compile(loss='categorical_crossentropy', optimizer=optimizer, metrics= )
return model

tf.keras.optimizers.legacy.Adam()

model = buildModel('adam')
history =...

0 Ответы

103 Просмотры

Последнее сообщение Anonymous
11 май 2024, 02:35
Отрицательные потери не уменьшаются в нейронной сети

Последнее сообщение Anonymous « 27 окт 2024, 19:10
Добавлено в форуме Python

Anonymous » 27 окт 2024, 19:10 » в форуме Python

У меня есть код нейронной сети, созданный на Python. Когда я проверяю убыток с его помощью, положительный убыток уменьшается, как и ожидалось, но отрицательный убыток увеличивается. Может ли кто-нибудь помочь мне определить, что я здесь делаю...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
27 окт 2024, 19:10
Выход, выход(), выход(0), die(), die(0) - Как выйти из скрипта

Последнее сообщение Anonymous « 28 ноя 2024, 19:56
Добавлено в форуме Php

Anonymous » 28 ноя 2024, 19:56 » в форуме Php

Я считаю, что все они (и даже die() или die(0)) идентичны. Если они не идентичны, что предпочтительнее для успешного выхода из сценария? Если они идентичны, существует ли какой-либо предпочтительный стандарт для обозначения успешного завершения...

0 Ответы

63 Просмотры

Последнее сообщение Anonymous
28 ноя 2024, 19:56
Эффект перехода начинается с ВЕРХНЕГО ЛЕВОГО угла, но нужно, чтобы он начинался с левого угла.

Последнее сообщение Anonymous « 28 май 2024, 22:40
Добавлено в форуме CSS

Anonymous » 28 май 2024, 22:40 » в форуме CSS

Эффект перехода начинается с ВЕРХНЕГО ЛЕВОГО угла, но нужно, чтобы он начинался с левого угла.
По сути, я пытаюсь сделать его похожим на небольшую полосу загрузки, которая загружается при наведении курсора на блок.

.buttonFrame {
position:...

0 Ответы

79 Просмотры

Последнее сообщение Anonymous
28 май 2024, 22:40
Ошибка при вычислении фазового угла с использованием графика углового угла.

Последнее сообщение Anonymous « 04 ноя 2024, 04:31
Добавлено в форуме Python

Anonymous » 04 ноя 2024, 04:31 » в форуме Python

Я пытаюсь вычислить фазовый угол между двумя временными рядами по двум известным сигналам (двум синусоидальным волнам) с фазой 24 градуса. Однако, когда я вычисляю фазовый угол между этими сигналами, я не получаю ожидаемого результата по кадрам (24...

0 Ответы

43 Просмотры

Последнее сообщение Anonymous
04 ноя 2024, 04:31

Вернуться в «Python»