Как решить проблему увеличения функции стоимости вместо ее уменьшения

Как решить проблему увеличения функции стоимости вместо ее уменьшения ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как решить проблему увеличения функции стоимости вместо ее уменьшения

Цитата

Сообщение Anonymous » 19 сен 2024, 19:08

У меня есть образец сложной нейронной сети с одним слоем, который действует следующим образом:
Во-первых, у меня есть известная комплексная матрица размером N x N, Я извлек столбцы 1:4:N из этой матрицы, чтобы получить матрицу V размера N x N/4, я хочу умножить матрицу V на a общеизвестный вектор s, содержащий 1 и -1, размером N/4 x 1 такой, что y = Vs, где y будет иметь размер N x 1< /код>. Поэтому я хочу, чтобы последние N/4 элементов вектора y были нулями или близкими к нулю. Итак, я сначала вставил вектор s в нейронную сеть, а затем умножил его на матрицу V. Затем выполняется обучение для поиска лучших весов нейронного слоя, которые оптимизируют последние N/4 элементов вектора y.
Задача I обнаружено, что функция стоимости увеличивается во время обучения, а не убывает, а также результат после обучения: вектор y = VGs не содержит нулевых или близких к нулю значений в своем последнем N/ 4 элемента, G здесь представляет веса нейронной сети после обучения.
Вот код, который я написал:
import tensorflow as tf
from tensorflow.keras.layers import Dense, Input
from tensorflow.keras.models import Model
import numpy as np
from tensorflow.keras.optimizers import Adam

# Parameters
N = 64

class ComplexNormal(tf.keras.initializers.Initializer): #to build the complex NN
"""Complex normal initializer."""
def __call__(self, shape, dtype=None):
real_part = tf.random.normal(shape, stddev=0.5)
imag_part = tf.random.normal(shape, stddev=0.5)
return tf.dtypes.complex(real_part, imag_part)

#Generate the vector s
s_vector = tf.random.uniform(shape=(N//4,1), minval=0, maxval=2, dtype=tf.int32)
s_vector = tf.where(s_vector == 0, -1, 1) # Convert 0 to -1 and 1 stays 1
s_vector = tf.cast(s_vector, dtype=tf.complex64)

def Matrix_multiplication(x, N):
Vector_pilot = tf.convert_to_tensor(x, dtype=tf.complex64)
n = tf.range(N, dtype=tf.float32)
k = tf.reshape(n, (N, 1))

imaginary_part = 2 * np.pi * n * k / tf.cast(N, tf.float32) # Imaginary part for the V matrix
omega = tf.exp(tf.complex(0.0, imaginary_part)) # Complex exponential the matrix
Matrix_V = omega / tf.sqrt(tf.cast(N, tf.complex64)) # Normalize the matrix
pilot_ind = tf.range(0, N, delta=4, dtype=tf.int32) # Create pilot_ind array equivalent to [1:4:N] in MATLAB

V_matrix_selected = tf.gather(Matrix_V, pilot_ind, axis=1) # Extract columns 1:4:end
y_vector = tf.matmul(V_matrix_selected, Vector_pilot)
return y_vector

# Use the subcarrier into the model
input_data = Input(shape=(N//4,), dtype=tf.complex64)
layer_1 = Dense(N//4, activation='linear', kernel_initializer=ComplexNormal(), dtype=tf.complex64)(input_data) # The first layer

y2 = Matrix_multiplication(tf.transpose(layer_1), N) # Multiply the output with the maxtrix V

model = Model(inputs=input_data, outputs=layer_1)

UW = tf.reduce_mean(tf.abs(y2[-N//4:, :])) #Reduce the mean of the last N/4 elements of vector y2
model.add_loss(UW)

s_vector_repeated = tf.tile(tf.transpose(s_vector), [5000000,1]) #Generate the data with 5000000 training size
data = tf.convert_to_tensor(s_vector_repeated, dtype=tf.complex64)

model.compile(optimizer=Adam(lr=0.001))
model.fit(data, epochs=200, steps_per_epoch=1000, verbose=2)

Подробнее здесь: https://stackoverflow.com/questions/790 ... reasing-it

1726762095

Anonymous

У меня есть образец сложной нейронной сети с одним слоем, который действует следующим образом:
Во-первых, у меня есть известная комплексная матрица размером N x N, Я извлек столбцы 1:4:N из этой матрицы, чтобы получить матрицу V размера N x N/4, я хочу умножить матрицу V на a общеизвестный вектор s, содержащий 1 и -1, размером N/4 x 1 такой, что y = Vs, где y будет иметь размер N x 1< /код>. Поэтому я хочу, чтобы последние N/4 элементов вектора y были нулями или близкими к нулю. Итак, я сначала вставил вектор s в нейронную сеть, а затем умножил его на матрицу V. Затем выполняется обучение для поиска лучших весов нейронного слоя, которые оптимизируют последние N/4 элементов вектора y.
Задача I обнаружено, что функция стоимости увеличивается во время обучения, а не убывает, а также результат после обучения: вектор y = VGs не содержит нулевых или близких к нулю значений в своем последнем N/ 4 элемента, G здесь представляет веса нейронной сети после обучения.
Вот код, который я написал:
import tensorflow as tf
from tensorflow.keras.layers import Dense, Input
from tensorflow.keras.models import Model
import numpy as np
from tensorflow.keras.optimizers import Adam

# Parameters
N = 64

class ComplexNormal(tf.keras.initializers.Initializer):    #to build the complex NN
"""Complex normal initializer."""
def __call__(self, shape, dtype=None):
real_part = tf.random.normal(shape, stddev=0.5)
imag_part = tf.random.normal(shape, stddev=0.5)
return tf.dtypes.complex(real_part, imag_part)

#Generate the vector s
s_vector = tf.random.uniform(shape=(N//4,1), minval=0, maxval=2, dtype=tf.int32)
s_vector = tf.where(s_vector == 0, -1, 1)  # Convert 0 to -1 and 1 stays 1
s_vector = tf.cast(s_vector, dtype=tf.complex64)

def Matrix_multiplication(x, N):
Vector_pilot = tf.convert_to_tensor(x, dtype=tf.complex64)
n = tf.range(N, dtype=tf.float32)
k = tf.reshape(n, (N, 1))

imaginary_part = 2 * np.pi * n * k / tf.cast(N, tf.float32)  # Imaginary part for the V matrix
omega = tf.exp(tf.complex(0.0, imaginary_part))  # Complex exponential the matrix
Matrix_V = omega / tf.sqrt(tf.cast(N, tf.complex64))  # Normalize the  matrix
pilot_ind = tf.range(0, N, delta=4, dtype=tf.int32) # Create pilot_ind array equivalent to [1:4:N] in MATLAB

V_matrix_selected = tf.gather(Matrix_V, pilot_ind, axis=1)  # Extract columns 1:4:end
y_vector = tf.matmul(V_matrix_selected, Vector_pilot)
return y_vector

# Use the subcarrier into the model
input_data = Input(shape=(N//4,), dtype=tf.complex64)
layer_1 = Dense(N//4, activation='linear', kernel_initializer=ComplexNormal(), dtype=tf.complex64)(input_data)  # The first layer

y2 = Matrix_multiplication(tf.transpose(layer_1), N)    # Multiply the output with the maxtrix V

model = Model(inputs=input_data, outputs=layer_1)

UW = tf.reduce_mean(tf.abs(y2[-N//4:, :]))  #Reduce the mean of the last N/4 elements of vector y2
model.add_loss(UW)

s_vector_repeated = tf.tile(tf.transpose(s_vector), [5000000,1])  #Generate the data with 5000000 training size
data = tf.convert_to_tensor(s_vector_repeated, dtype=tf.complex64)

model.compile(optimizer=Adam(lr=0.001))
model.fit(data, epochs=200, steps_per_epoch=1000, verbose=2)
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79003501/how-to-solve-the-issue-of-increasing-the-cost-function-instead-of-decreasing-it[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Можете ли вы контролировать коэффициент увеличения/уменьшения изображений на веб-странице?

Последнее сообщение Anonymous « 31 дек 2023, 21:05
Добавлено в форуме CSS

Anonymous » 31 дек 2023, 21:05 » в форуме CSS

Итак, у меня есть два изображения одинакового исходного размера, отображаемые на веб-странице. Когда пользователь использует Ctrl и +/- для увеличения или уменьшения масштаба веб-страницы, я хочу, чтобы два изображения стали меньше/увеличены с...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
31 дек 2023, 21:05
Как сделать анимацию увеличения и уменьшения масштаба при нажатии жестом в SwiftUI?

Последнее сообщение Anonymous « 04 мар 2024, 10:05
Добавлено в форуме IOS

Anonymous » 04 мар 2024, 10:05 » в форуме IOS

Simple and regular approach to animate a bump effect for a button but not simple in SwiftUI.

I'm trying to change scale in tapGesture modifier, but it doesn't have any effect. I don't know how to make chain of animations, probably because SwiftUI...

0 Ответы

53 Просмотры

Последнее сообщение Anonymous
04 мар 2024, 10:05
Как получить значение увеличения и уменьшения в значениях элемента div с тем же именем и разделом div

Последнее сообщение Anonymous « 20 май 2024, 11:39
Добавлено в форуме Jquery

Anonymous » 20 май 2024, 11:39 » в форуме Jquery

Я нажимаю + до «35», затем нажимаю кнопку «Добавить». Я хочу, чтобы он напечатал результат: «35». Если я продолжу нажимать кнопку увеличения до «40», а затем снова нажму кнопку «Добавить», мне понадобится код для печати результата как «40».
Однако...

0 Ответы

33 Просмотры

Последнее сообщение Anonymous
20 май 2024, 11:39
Как получить следующий (предыдущий) элемент в std::list без увеличения (уменьшения) итератора?

Последнее сообщение Anonymous « 17 июл 2024, 11:50
Добавлено в форуме C++

Anonymous » 17 июл 2024, 11:50 » в форуме C++

Скажем, у меня есть std::list lst и некоторый std::list::iterator it для перебора списка. И в зависимости от значения it я хочу использовать его + 1 или - 1 в своем коде. Есть ли хороший способ сделать это, например next(), prev() (я не смог найти...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
17 июл 2024, 11:50
Как реализовать функцию увеличения/уменьшения масштаба в графическом интерфейсе CustomTkinter

Последнее сообщение Anonymous « 25 июл 2024, 08:02
Добавлено в форуме Python

Anonymous » 25 июл 2024, 08:02 » в форуме Python

Я пытаюсь добавить функцию увеличения/уменьшения масштаба в свой графический интерфейс customtkinter на Raspberry Pi. Из-за отсутствия встроенной поддержки масштабирования виджетов в customtkinter я изо всех сил пытаюсь этого добиться. Кто-нибудь...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
25 июл 2024, 08:02

Вернуться в «Python»