CGAN: потеря генератора и потеря дискриминатора условной генеративно-состязательной сети.

CGAN: потеря генератора и потеря дискриминатора условной генеративно-состязательной сети. ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

CGAN: потеря генератора и потеря дискриминатора условной генеративно-состязательной сети.

Цитата

Сообщение Anonymous » 16 май 2024, 09:21

Узнав, что gan можно использовать для генерации данных изображения, я захотел использовать gan для генерации данных массива. Поскольку данные моего массива имеют метки, я решил использовать cGAN для завершения этой работы.
Однако производительность потерь генератора и дискриминатора Cgan не очень идеальна. Когда я ранее генерировал другие подобные данные, кривая потерь генератора и кривая потерь дискриминатора имели тенденцию стабилизироваться около 0,69 после периода обучения. Как показано ниже.
Введите здесь описание изображения
Но моя текущая кривая выглядит вот так
введите здесь описание изображения
Я не понимаю, куда движется кривая, и не знаю, где сейчас оптимизировать.
Это мой код инициализации cgan

Код: Выделить всё

def __init__(self):
self.rows = 64
self.cols = 32
self.shape = (self.rows,self.cols)
self.num_classes = 28
self.latent_dim = 4096

self.generator = self.build_generator()
self.discriminator = self.build_discriminator()
self.discriminator.compile(loss=['binary_crossentropy'],optimizer=Adam(0.0001,0.1),metrics=['accuracy'])

noise = Input(shape(self.latent_dim,))
label = Input(shape(1,))
img = self.generator([noise,label])
self.discriminator.trainable = False
valid = self.discriminator([img,label])
self.combined = Model([noise,label],valid)
self.combined.compile(loss=['binary_crossentropy'],optimizer=Adam(0.0002,0.5),metrics=['accuracy'])

Это код сети моего генератора

Код: Выделить всё

    def build_generator(self):

model = Sequential()
model.add(Dense(512,input_dim = self.latent_dim))
model.add(LeakyReLU(alpha=0.05))
model.add(BatchNormalization(momentum=0.9))
model.add(Dense(512))
model.add(LeakyReLU(alpha=0.05))
model.add(BatchNormalization(momentum=0.9))
model.add(Dense(1024))
model.add(LeakyReLU(alpha=0.05))
model.add(BatchNormalization(momentum=0.9))
model.add(Dense(1024))
model.add(LeakyReLU(alpha=0.05))
model.add(BatchNormalization(momentum=0.9))
model.add(Dense(1024))
model.add(LeakyReLU(alpha=0.05))
model.add(BatchNormalization(momentum=0.9))
model.add(Dense(1024))
model.add(LeakyReLU(alpha=0.05))
model.add(BatchNormalization(momentum=0.9))

model.add(Dense(np.prod(self.shape), activation='tanh'))
model.add(Reshape(self.shape))
model.summary()

noise = Input(shape=(self.latent_dim,))
label = Input(shape=(1,), dtype='int32')

label_embedding = Flatten()(Embedding(self.num_classes, self.latent_dim)(label))

model_input = multiply([noise, label_embedding])

img = model(model_input)

return Model([noise, label], img)

Это код моей сети дискриминатора

Код: Выделить всё

    def build_discriminator(self):

model = Sequential()
model.add(Dense(256,input_dim=np.prod(self.shape)))
model.add(LeakyReLU(alpha=0.1))
model.add(Dense(256))
model.add(LeakyReLU(alpha=0.1))
model.add(Dropout(0.2))
model.add(Dense(256))
model.add(LeakyReLU(alpha=0.1))
model.add(Dropout(0.2))
model.add(Dense(256))
model.add(LeakyReLU(alpha=0.1))
model.add(Dropout(0.2))
model.add(Dense(256))
model.add(LeakyReLU(alpha=0.1))
model.add(Dropout(0.2))

model.add(Dense(1,activation='sigmoid'))

model.summary()

img = Input(shape=self.shape)
label = Input(shape=(1,),dtype='int32')

label_embedding = Flatten()(Embedding(self.num_classes,np.prod(self.shape))(label))
flat_img = Flatten()(img)

model_input = multiply([flat_img,label_embedding])

validity = model(model_input)
return Model([img,label],validity)

вот весь код Train

Код: Выделить всё

   def train(self,epochs,X_data,y_data,batch_size,sample_interval):

X_train = X_data
Y_train = y_data
Y_train = np.array(Y_train)
valid = np.ones((batch_size, 1))
fake = np.zeros((batch_size,  1))
d_loss_history = []
g_losses = []
for epoch in range(epochs):
idx = np.random.randint(0,X_train.shape[0],int(batch_size))
imgs,labels = X_train[idx],Y_train[idx]

noise = np.random.normal(0,1,(int(batch_size),self.latent_dim))
gen_imgs = self.generator.predict([noise,labels])

d_loss_real = self.discriminator.train_on_batch([imgs,labels],valid)
d_loss_fake = self.discriminator.train_on_batch([gen_imgs,labels],fake)
d_loss = 0.5*np.add(d_loss_real,d_loss_fake)
d_loss_history.append(d_loss[0])

noise = np.random.normal(0,1,(int(batch_size),self.latent_dim))
possible_values = np.arange(1, 28)
sampled_label = np.random.choice(possible_values, size=batch_size)
sampled_label = sampled_label.reshape(batch_size, 1)
g_loss = self.combined.train_on_batch([noise,sampled_label],valid)

g_losses.append(g_loss[0])
print("%d [D loss:%f,acc:%.2f%%][G loss:%f]" % (epoch,float(d_loss[0]),float(100*d_loss[1]),float(g_loss[0])))
plt.plot(d_loss_history, label='Discriminator Loss',color=(223/255, 122/255, 94/255))
plt.plot(g_losses, label='Generator Loss',color=(130/255, 178/255, 154/255))
plt.legend()
plt.xlabel('Epoch',fontsize = 12)
plt.ylabel('Loss',fontsize = 12)
plt.show()

Поэтому, если кто-нибудь может помочь мне оптимизировать эту сетевую модель для достижения стабильной ситуации, я был бы очень признателен, или если у вас есть какие-либо другие идеи после просмотра моей проблемы, поделитесь ими с я.

Подробнее здесь: https://stackoverflow.com/questions/784 ... ve-adversa

1715840481

Anonymous

Узнав, что gan можно использовать для генерации данных изображения, я захотел использовать gan для генерации данных массива. Поскольку данные моего массива имеют метки, я решил использовать cGAN для завершения этой работы.
Однако производительность потерь генератора и дискриминатора Cgan не очень идеальна. Когда я ранее генерировал другие подобные данные, кривая потерь генератора и кривая потерь дискриминатора имели тенденцию стабилизироваться около 0,69 после периода обучения.  Как показано ниже.
Введите здесь описание изображения
Но моя текущая кривая выглядит вот так
введите здесь описание изображения
Я не понимаю, куда движется кривая, и не знаю, где сейчас оптимизировать.
Это мой код инициализации cgan
[code]def __init__(self):
self.rows = 64
self.cols = 32
self.shape = (self.rows,self.cols)
self.num_classes = 28
self.latent_dim = 4096

self.generator = self.build_generator()
self.discriminator = self.build_discriminator()
self.discriminator.compile(loss=['binary_crossentropy'],optimizer=Adam(0.0001,0.1),metrics=['accuracy'])

noise = Input(shape(self.latent_dim,))
label = Input(shape(1,))
img = self.generator([noise,label])
self.discriminator.trainable = False
valid = self.discriminator([img,label])
self.combined = Model([noise,label],valid)
self.combined.compile(loss=['binary_crossentropy'],optimizer=Adam(0.0002,0.5),metrics=['accuracy'])
[/code]
Это код сети моего генератора
[code]    def build_generator(self):

model = Sequential()
model.add(Dense(512,input_dim = self.latent_dim))
model.add(LeakyReLU(alpha=0.05))
model.add(BatchNormalization(momentum=0.9))
model.add(Dense(512))
model.add(LeakyReLU(alpha=0.05))
model.add(BatchNormalization(momentum=0.9))
model.add(Dense(1024))
model.add(LeakyReLU(alpha=0.05))
model.add(BatchNormalization(momentum=0.9))
model.add(Dense(1024))
model.add(LeakyReLU(alpha=0.05))
model.add(BatchNormalization(momentum=0.9))
model.add(Dense(1024))
model.add(LeakyReLU(alpha=0.05))
model.add(BatchNormalization(momentum=0.9))
model.add(Dense(1024))
model.add(LeakyReLU(alpha=0.05))
model.add(BatchNormalization(momentum=0.9))

model.add(Dense(np.prod(self.shape), activation='tanh'))
model.add(Reshape(self.shape))
model.summary()

noise = Input(shape=(self.latent_dim,))
label = Input(shape=(1,), dtype='int32')

label_embedding = Flatten()(Embedding(self.num_classes, self.latent_dim)(label))

model_input = multiply([noise, label_embedding])

img = model(model_input)

return Model([noise, label], img)
[/code]
Это код моей сети дискриминатора
[code]    def build_discriminator(self):

model = Sequential()
model.add(Dense(256,input_dim=np.prod(self.shape)))
model.add(LeakyReLU(alpha=0.1))
model.add(Dense(256))
model.add(LeakyReLU(alpha=0.1))
model.add(Dropout(0.2))
model.add(Dense(256))
model.add(LeakyReLU(alpha=0.1))
model.add(Dropout(0.2))
model.add(Dense(256))
model.add(LeakyReLU(alpha=0.1))
model.add(Dropout(0.2))
model.add(Dense(256))
model.add(LeakyReLU(alpha=0.1))
model.add(Dropout(0.2))

model.add(Dense(1,activation='sigmoid'))

model.summary()

img = Input(shape=self.shape)
label = Input(shape=(1,),dtype='int32')

label_embedding = Flatten()(Embedding(self.num_classes,np.prod(self.shape))(label))
flat_img = Flatten()(img)

model_input = multiply([flat_img,label_embedding])

validity = model(model_input)
return Model([img,label],validity)
[/code]
вот весь код Train
[code]   def train(self,epochs,X_data,y_data,batch_size,sample_interval):

X_train = X_data
Y_train = y_data
Y_train = np.array(Y_train)
valid = np.ones((batch_size, 1))
fake = np.zeros((batch_size,  1))
d_loss_history = []
g_losses = []
for epoch in range(epochs):
idx = np.random.randint(0,X_train.shape[0],int(batch_size))
imgs,labels = X_train[idx],Y_train[idx]

noise = np.random.normal(0,1,(int(batch_size),self.latent_dim))
gen_imgs = self.generator.predict([noise,labels])

d_loss_real = self.discriminator.train_on_batch([imgs,labels],valid)
d_loss_fake = self.discriminator.train_on_batch([gen_imgs,labels],fake)
d_loss = 0.5*np.add(d_loss_real,d_loss_fake)
d_loss_history.append(d_loss[0])

noise = np.random.normal(0,1,(int(batch_size),self.latent_dim))
possible_values = np.arange(1, 28)
sampled_label = np.random.choice(possible_values, size=batch_size)
sampled_label = sampled_label.reshape(batch_size, 1)
g_loss = self.combined.train_on_batch([noise,sampled_label],valid)

g_losses.append(g_loss[0])
print("%d [D loss:%f,acc:%.2f%%][G loss:%f]" % (epoch,float(d_loss[0]),float(100*d_loss[1]),float(g_loss[0])))
plt.plot(d_loss_history, label='Discriminator Loss',color=(223/255, 122/255, 94/255))
plt.plot(g_losses, label='Generator Loss',color=(130/255, 178/255, 154/255))
plt.legend()
plt.xlabel('Epoch',fontsize = 12)
plt.ylabel('Loss',fontsize = 12)
plt.show()
[/code]
Поэтому, если кто-нибудь может помочь мне оптимизировать эту сетевую модель для достижения стабильной ситуации, я был бы очень признателен, или если у вас есть какие-либо другие идеи после просмотра моей проблемы, поделитесь ими с я. 

Подробнее здесь: [url]https://stackoverflow.com/questions/78487897/cganthe-generator-loss-and-discriminator-loss-of-conditional-generative-adversa[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

В моем коде CGAN есть ошибка. Ошибка: набор данных не указан.

Последнее сообщение Anonymous « 26 ноя 2024, 10:05
Добавлено в форуме Python

Anonymous » 26 ноя 2024, 10:05 » в форуме Python

PS C:\Users\abhis\Downloads\CGAN-regression-master> & C:/Users/abhis/AppData/Local/Programs/Python/Python311/python.exe c:/Users/abhis/Downloads/CGAN-regression-master/main.py
Traceback (most recent call last):
File...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
26 ноя 2024, 10:05
Как сопоставить выходную форму генератора и входной формы дискриминатора в GAN?

Последнее сообщение Anonymous « 09 авг 2025, 09:34
Добавлено в форуме Python

Anonymous » 09 авг 2025, 09:34 » в форуме Python

Я работаю над своей первой моделью Gans, я следил за официальной документацией Tensorflow, используя набор данных MNIST. Я запускаю это гладко. Я пытался заменить MNIST своим собственным набором данных, я подготовил его, чтобы соответствовать тому...

0 Ответы

0 Просмотры

Последнее сообщение Anonymous
09 авг 2025, 09:34
Потеря дискриминатора для CycleGAN застряла на уровне 0,0

Последнее сообщение Anonymous « 10 янв 2025, 02:15
Добавлено в форуме Python

Anonymous » 10 янв 2025, 02:15 » в форуме Python

В настоящее время я тренируюсь с BD-Cycle GAN, модифицированной версией Mol-Cycle GAN. Я не изменял какой-либо код, но мне нужно было загрузить папку utils и файл Environment.yml из репозитория ( При запуске файла train.py с параметрами по умолчанию...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
10 янв 2025, 02:15
Потеря дискриминатора для CycleGAN застряла на уровне 0,0

Последнее сообщение Anonymous « 10 янв 2025, 14:08
Добавлено в форуме Python

Anonymous » 10 янв 2025, 14:08 » в форуме Python

В настоящее время я тренируюсь с BD-Cycle GAN, модифицированной версией Mol-Cycle GAN. Я не изменял какой-либо код, но мне нужно было загрузить папку utils и файл Environment.yml из репозитория Mol-Cycle GAN. При запуске файла train.py с параметрами...

0 Ответы

40 Просмотры

Последнее сообщение Anonymous
10 янв 2025, 14:08
Разница в показателях производительности с clang — использование генератора Ninja и генератора Visual Studio

Последнее сообщение Anonymous « 07 ноя 2024, 08:59
Добавлено в форуме C++

Anonymous » 07 ноя 2024, 08:59 » в форуме C++

Недавно я пытался поэкспериментировать, создав одно и то же приложение в Clang с помощью генератора ninja и генератора Visual Studio с использованием cmake. Замечено, что Ninja Generator дает явное преимущество с точки зрения производительности по...

0 Ответы

34 Просмотры

Последнее сообщение Anonymous
07 ноя 2024, 08:59

Вернуться в «Python»