Определение пользовательского слоя и пользовательских потерь на основе результатов всех слоев.

Определение пользовательского слоя и пользовательских потерь на основе результатов всех слоев. ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Определение пользовательского слоя и пользовательских потерь на основе результатов всех слоев.

Цитата

Сообщение Anonymous » 19 апр 2024, 09:31

Я пытаюсь реализовать нейронную сеть для декодирования зашумленного полученного сигнала. Каждый уровень моей нейронной сети выглядит следующим образом:
Один слой
Моя попытка:

Код: Выделить всё

class DetNet(tf.keras.Model):
def __init__(self, K, N, L, v_size, hl_size, res_alpha=0.9, log_loss=True):
super(DetNet, self).__init__()
self.K = K
self.N = N
self.L = L
self.v_size = v_size
self.hl_size = hl_size
self.res_alpha = res_alpha
self.log_loss = log_loss

self.layers_detnet = []
for i in range(L):
layer = DetNetLayer(K, v_size, hl_size, res_alpha, name=f'layer_{i}')
self.layers_detnet.append(layer)

def call(self, HY, HH, X, training=False):
S = [tf.zeros_like(X)]
V = [tf.zeros((tf.shape(HY)[0], self.v_size),dtype=tf.dtypes.as_dtype(HY.dtype))]
losses = []
bers = []

for i, layer in enumerate(self.layers_detnet):
Z = tf.concat([HY, S[-1], tf.linalg.matvec(HH, S[-1]), V[-1]], axis=-1)
S_next, V_next = layer(Z, training=training)
S.append(S_next)
V.append(V_next)

loss = tf.reduce_mean(tf.reduce_mean(tf.square(X - S[-1]), axis=-1) / tf.reduce_mean(tf.square(X - tf.squeeze(tf.linalg.solve(HH, tf.expand_dims(HY, 2)), axis=2)), axis=-1))
if self.log_loss:
loss *= tf.math.log(tf.cast(i + 1, tf.float32))
losses.append(loss)

ber = tf.reduce_mean(tf.cast(tf.not_equal(X, tf.sign(S[-1])), tf.float32))
bers.append(ber)

total_loss = tf.add_n(losses)
return total_loss, bers

class DetNetLayer(layers.Layer):
def __init__(self, K, v_size, hl_size, res_alpha, **kwargs):
super(DetNetLayer, self).__init__(**kwargs)
self.K = K
self.v_size = v_size
self.hl_size = hl_size
self.res_alpha = res_alpha

self.W1 = self.add_weight(shape=(3 * K + v_size, hl_size), initializer='glorot_uniform', trainable=True)
self.b1 = self.add_weight(shape=(hl_size,), initializer='zeros', trainable=True)
self.W2 = self.add_weight(shape=(hl_size, K), initializer='glorot_uniform', trainable=True)
self.b2 = self.add_weight(shape=(K,), initializer='zeros', trainable=True)
self.t = self.add_weight(shape=(), initializer=tf.constant_initializer(0.1), trainable=True)
self.W3 = self.add_weight(shape=(hl_size, v_size), initializer='glorot_uniform', trainable=True)
self.b3 = self.add_weight(shape=(v_size,), initializer='zeros', trainable=True)

def call(self, inputs, training=False):
Z = tf.nn.relu(tf.matmul(inputs, self.W1) + self.b1)
S_next = self.piecewise_linear_soft_sign(tf.matmul(Z, self.W2) + self.b2, self.t)
V_next = tf.matmul(Z, self.W3) + self.b3
if training:
return (1 - self.res_alpha) * S_next, (1 - self.res_alpha) * V_next
else:
return S_next, V_next

И мой цикл обучения (я использую tf.GradientTape):

Код: Выделить всё

for epoch in range(num_epochs):
epoch_loss = 0
for HY_, HH, X in train_dataset:
with tf.GradientTape() as tape:
loss, bers = detnet(HY_, HH, X, training=True)
gradients = tape.gradient(loss, detnet.trainable_variables)
optimizer.apply_gradients(zip(gradients, detnet.trainable_variables))
epoch_loss += loss.numpy()
temp.append(loss.numpy())
epoch_loss /= (num_train_samples // batch_size)
train_losses.append(epoch_loss)

# Evaluate on validation set
val_loss, _ = detnet(HY_val_, HH_val, X_val, training=True)
val_losses.append(val_loss.numpy())
print(f"Epoch {epoch + 1}, Training Loss: {epoch_loss}, Validation Loss: {val_losses[-1]}")

Есть ли какие-либо проблемы, описанные выше? Я не могу получить правильные BER в качестве бумаги, моя функция потерь насыщается до 1500, хотя я ожидаю, что она достигнет 500.

Подробнее здесь: https://stackoverflow.com/questions/783 ... all-layers

1713508291

Anonymous

Я пытаюсь реализовать нейронную сеть для декодирования зашумленного полученного сигнала. Каждый уровень моей нейронной сети выглядит следующим образом:
Один слой
Моя попытка:
[code]class DetNet(tf.keras.Model):
def __init__(self, K, N, L, v_size, hl_size, res_alpha=0.9, log_loss=True):
super(DetNet, self).__init__()
self.K = K
self.N = N
self.L = L
self.v_size = v_size
self.hl_size = hl_size
self.res_alpha = res_alpha
self.log_loss = log_loss

self.layers_detnet = []
for i in range(L):
layer = DetNetLayer(K, v_size, hl_size, res_alpha, name=f'layer_{i}')
self.layers_detnet.append(layer)

def call(self, HY, HH, X, training=False):
S = [tf.zeros_like(X)]
V = [tf.zeros((tf.shape(HY)[0], self.v_size),dtype=tf.dtypes.as_dtype(HY.dtype))]
losses = []
bers = []

for i, layer in enumerate(self.layers_detnet):
Z = tf.concat([HY, S[-1], tf.linalg.matvec(HH, S[-1]), V[-1]], axis=-1)
S_next, V_next = layer(Z, training=training)
S.append(S_next)
V.append(V_next)

loss = tf.reduce_mean(tf.reduce_mean(tf.square(X - S[-1]), axis=-1) / tf.reduce_mean(tf.square(X - tf.squeeze(tf.linalg.solve(HH, tf.expand_dims(HY, 2)), axis=2)), axis=-1))
if self.log_loss:
loss *= tf.math.log(tf.cast(i + 1, tf.float32))
losses.append(loss)

ber = tf.reduce_mean(tf.cast(tf.not_equal(X, tf.sign(S[-1])), tf.float32))
bers.append(ber)

total_loss = tf.add_n(losses)
return total_loss, bers

class DetNetLayer(layers.Layer):
def __init__(self, K, v_size, hl_size, res_alpha, **kwargs):
super(DetNetLayer, self).__init__(**kwargs)
self.K = K
self.v_size = v_size
self.hl_size = hl_size
self.res_alpha = res_alpha

self.W1 = self.add_weight(shape=(3 * K + v_size, hl_size), initializer='glorot_uniform', trainable=True)
self.b1 = self.add_weight(shape=(hl_size,), initializer='zeros', trainable=True)
self.W2 = self.add_weight(shape=(hl_size, K), initializer='glorot_uniform', trainable=True)
self.b2 = self.add_weight(shape=(K,), initializer='zeros', trainable=True)
self.t = self.add_weight(shape=(), initializer=tf.constant_initializer(0.1), trainable=True)
self.W3 = self.add_weight(shape=(hl_size, v_size), initializer='glorot_uniform', trainable=True)
self.b3 = self.add_weight(shape=(v_size,), initializer='zeros', trainable=True)

def call(self, inputs, training=False):
Z = tf.nn.relu(tf.matmul(inputs, self.W1) + self.b1)
S_next = self.piecewise_linear_soft_sign(tf.matmul(Z, self.W2) + self.b2, self.t)
V_next = tf.matmul(Z, self.W3) + self.b3
if training:
return (1 - self.res_alpha) * S_next, (1 - self.res_alpha) * V_next
else:
return S_next, V_next

[/code]
И мой цикл обучения (я использую tf.GradientTape):
[code]for epoch in range(num_epochs):
epoch_loss = 0
for HY_, HH, X in train_dataset:
with tf.GradientTape() as tape:
loss, bers = detnet(HY_, HH, X, training=True)
gradients = tape.gradient(loss, detnet.trainable_variables)
optimizer.apply_gradients(zip(gradients, detnet.trainable_variables))
epoch_loss += loss.numpy()
temp.append(loss.numpy())
epoch_loss /= (num_train_samples // batch_size)
train_losses.append(epoch_loss)

# Evaluate on validation set
val_loss, _ = detnet(HY_val_, HH_val, X_val, training=True)
val_losses.append(val_loss.numpy())
print(f"Epoch {epoch + 1}, Training Loss: {epoch_loss}, Validation Loss: {val_losses[-1]}")

[/code]
Есть ли какие-либо проблемы, описанные выше? Я не могу получить правильные BER в качестве бумаги, моя функция потерь насыщается до 1500, хотя я ожидаю, что она достигнет 500. 

Подробнее здесь: [url]https://stackoverflow.com/questions/78351705/defining-custom-layer-and-custom-loss-based-on-outputs-of-all-layers[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Несоответствие количества слоев при загрузке весов из файла. Модель ожидала 106 слоев, найдено 4 сохраненных слоя.

Последнее сообщение Anonymous « 28 сен 2024, 09:04
Добавлено в форуме Python

Anonymous » 28 сен 2024, 09:04 » в форуме Python

У меня есть эта сеть (из статьи SimClR):
base_model = tf.keras.applications.ResNet50(include_top=False, weights=None, input_shape=(224, 224, 3))
base_model.trainable = True
#inputs = Input((224, 224, 3))
inputs = Input((224, 224, 3))
h =...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
28 сен 2024, 09:04
Несоответствие количества слоев при загрузке весов из файла. Модель ожидала 106 слоев, найдено 4 сохраненных слоя.

Последнее сообщение Anonymous « 26 янв 2025, 10:04
Добавлено в форуме Python

Anonymous » 26 янв 2025, 10:04 » в форуме Python

У меня есть эта сеть (из бумаги simclr):
base_model = tf.keras.applications.ResNet50(include_top=False, weights=None, input_shape=(224, 224, 3))
base_model.trainable = True
#inputs = Input((224, 224, 3))
inputs = Input((224, 224, 3))
h =...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
26 янв 2025, 10:04
Несоответствие количества слоев при загрузке веса из файла. Модель ожидается 106 слоев, найдено 4 сохраненных слоя

Последнее сообщение Anonymous « 26 май 2025, 19:06
Добавлено в форуме Python

Anonymous » 26 май 2025, 19:06 » в форуме Python

У меня есть эта сеть (из бумаги simclr):
base_model = tf.keras.applications.ResNet50(include_top=False, weights=None, input_shape=(224, 224, 3))
base_model.trainable = True
#inputs = Input((224, 224, 3))
inputs = Input((224, 224, 3))
h =...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
26 май 2025, 19:06
Создание легенд для слоев (скрытие легенд неактивных слоев)

Последнее сообщение Anonymous « 23 янв 2025, 22:42
Добавлено в форуме Html

Anonymous » 23 янв 2025, 22:42 » в форуме Html

Я создаю карту, на которой должно быть семь базовых слоев. Легенд так много, что все они не могут поместиться на экране, поэтому необходимо добавить функцию карты, которая позволяет легендам появляться только при активации их базового слоя. На...

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
23 янв 2025, 22:42
Объединение пользовательской функции потерь с предопределенной функцией потерь (Dice и Focal) для обучения DeeplabV3Plus

Последнее сообщение Anonymous « 19 окт 2023, 10:37
Добавлено в форуме Python

Anonymous » 19 окт 2023, 10:37 » в форуме Python

Я обучаю DeeplabV3+ семантической сегментации изображений дистанционного зондирования. Я создаю модель после урока по keras ( ), и она отлично работает, когда я использую для обучения фокусную потерю (предустановленную в Keras/tf). Маски имеют...

0 Ответы

49 Просмотры

Последнее сообщение Anonymous
19 окт 2023, 10:37

Вернуться в «Python»