Преобразование весов и модели тензорного потока в pytorch (модифицированная эффективная сеть)

Преобразование весов и модели тензорного потока в pytorch (модифицированная эффективная сеть) ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Преобразование весов и модели тензорного потока в pytorch (модифицированная эффективная сеть)

Цитата

Сообщение Anonymous » 11 окт 2024, 03:46

Существует модифицированная модель TF effectnetnet, которую я пытаюсь смоделировать в pytorch. Я внес изменения в архитектуру модели в pytorch, сбросил веса модели TF и загрузил их обратно в новую модель pytorch. Сброс весов в TF осуществляется с помощью этого кода:

Код: Выделить всё

model = tf.saved_model.load(model_path)
ws = []
for i in range(len(model.variables)):
ws.append((i, model.variables[i].name, model.variables[i].numpy()))

with open("manually_dumped_contentnet_weights.pkl", "wb") as ofile:
pickle.dump(ws, ofile)

Формы весов в pytorch, кажется, соответствуют архитектуре и импортированным весам (после необходимых преобразований между conv2d и conv2d по глубине). Я могу запустить модель без каких-либо ошибок. Но вывод сильно отличается от вывода модели TF.
Я заметил, что в коде TF модель загружается не напрямую, а в сеансе tf:

Код: Выделить всё

with Session(graph=Graph(), config=ConfigProto(allow_soft_placement=True, log_device_placement=False)) as sess:
saved_model.loader.load(sess, [saved_model.tag_constants.SERVING], model_path)
patch_feature, patch_label = sess.run(output_nodes,feed_dict={input_node: patch})

Теперь мне интересно, была ли моя первоначальная попытка сбросить вес модели неправильной. Или, если я что-то упустил.
При загрузке данных я выполнил транспозиции (3,2,0,1) для conv2d и (2,3,0,1 ) для conv2d по глубине:

Код: Выделить всё

def reload_conv2d(layer, weights):
### weights is a tuple, where each element has consists of a truple: (1) an index number, (2) name of the layer the weights were dumped from in TF, and (3) the weights
count = 0
if (
"/conv2d/kernel" not in weights[0][1]
and "/conv2d_1/kernel" not in weights[0][1]
and "depthwise_conv2d/depthwise_kernel" not in weights[0][1]
and "final_conv2d/final_conv2d" not in weights[0][1]
):
raise ValueError(
f"need to have conv2d/kernel on the first index but got {weights[0][1]}"
)
transpose_shape = (2,3,0,1) if "depthwise" in weights[0][1] else (3, 2, 0, 1)
transposed_weights = torch.from_numpy(weights[0][2].transpose(transpose_shape[0], transpose_shape[1], transpose_shape[2], transpose_shape[3]))
layer.weight.data = transposed_weights
count += 1
if layer.bias is not None or layer.bias:
if (
"/conv2d/bias" not in weights[1][1]
and "/conv2d_1/bias" not in weights[1][1]
):
raise ValueError(
f"need to have conv2d/bias on the second index but got {weights[1][1]}"
)
layer.bias.data = (
torch.from_numpy(weights[1][2])
if type(weights[1][2]) == np.ndarray
else torch.from_numpy(weights[1][2])
)
count += 1
return layer, count

Я не знаю, почему на одном и том же входе модели pytorch и TF дают совершенно разные результаты. То ли от сброса веса, то ли от весовой нагрузки... а может, от изменения архитектуры модели? Тот факт, что входной вес TF (после изменения модели и транспонирования) был загружен нормально, и я могу без проблем запустить модель, не помогает в ее отладке.

Подробнее здесь: https://stackoverflow.com/questions/790 ... ficientnet

1728607596

Anonymous

Существует модифицированная модель TF effectnetnet, которую я пытаюсь смоделировать в pytorch. Я внес изменения в архитектуру модели в pytorch, сбросил веса модели TF и загрузил их обратно в новую модель pytorch. Сброс весов в TF осуществляется с помощью этого кода:
[code]model = tf.saved_model.load(model_path)
ws = []
for i in range(len(model.variables)):
ws.append((i, model.variables[i].name, model.variables[i].numpy()))

with open("manually_dumped_contentnet_weights.pkl", "wb") as ofile:
pickle.dump(ws, ofile)
[/code]
Формы весов в pytorch, кажется, соответствуют архитектуре и импортированным весам (после необходимых преобразований между conv2d и conv2d по глубине). Я могу запустить модель без каких-либо ошибок. Но вывод сильно отличается от вывода модели TF.
Я заметил, что в коде TF модель загружается не напрямую, а в сеансе tf:
[code]with Session(graph=Graph(), config=ConfigProto(allow_soft_placement=True, log_device_placement=False)) as sess:
saved_model.loader.load(sess, [saved_model.tag_constants.SERVING], model_path)
patch_feature, patch_label = sess.run(output_nodes,feed_dict={input_node: patch})
[/code]
Теперь мне интересно, была ли моя первоначальная попытка сбросить вес модели неправильной. Или, если я что-то упустил.
При загрузке данных я выполнил транспозиции (3,2,0,1) для conv2d и (2,3,0,1 ) для conv2d по глубине:
[code]def reload_conv2d(layer, weights):
### weights is a tuple, where each element has consists of a truple: (1) an index number, (2) name of the layer the weights were dumped from in TF, and (3) the weights
count = 0
if (
"/conv2d/kernel" not in weights[0][1]
and "/conv2d_1/kernel" not in weights[0][1]
and "depthwise_conv2d/depthwise_kernel" not in weights[0][1]
and "final_conv2d/final_conv2d" not in weights[0][1]
):
raise ValueError(
f"need to have conv2d/kernel on the first index but got {weights[0][1]}"
)
transpose_shape = (2,3,0,1) if "depthwise" in weights[0][1] else (3, 2, 0, 1)
transposed_weights = torch.from_numpy(weights[0][2].transpose(transpose_shape[0], transpose_shape[1], transpose_shape[2], transpose_shape[3]))
layer.weight.data = transposed_weights
count += 1
if layer.bias is not None or layer.bias:
if (
"/conv2d/bias" not in weights[1][1]
and "/conv2d_1/bias" not in weights[1][1]
):
raise ValueError(
f"need to have conv2d/bias on the second index but got {weights[1][1]}"
)
layer.bias.data = (
torch.from_numpy(weights[1][2])
if type(weights[1][2]) == np.ndarray
else torch.from_numpy(weights[1][2])
)
count += 1
return layer, count
[/code]
Я не знаю, почему на одном и том же входе модели pytorch и TF дают совершенно разные результаты. То ли от сброса веса, то ли от весовой нагрузки... а может, от изменения архитектуры модели? Тот факт, что входной вес TF (после изменения модели и транспонирования) был загружен нормально, и я могу без проблем запустить модель, не помогает в ее отладке. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79076436/converting-tensorflow-weights-and-model-to-pytorch-modified-efficientnet[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как рассчитать нейронную сеть для разных весов и входных данных параллельно в pytorch?

Последнее сообщение Anonymous « 12 янв 2025, 21:00
Добавлено в форуме Python

Anonymous » 12 янв 2025, 21:00 » в форуме Python

Я работаю с машинным обучением, используя pytorch.
Есть класс, реализующий нейронную сеть, унаследованную от nn.Module. Реализована некоторая сетевая структура.
В списке хранятся различные параметры (веса, смещения):
parameters = [ , ..., ] . Также...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
12 янв 2025, 21:00
Как рассчитать нейронную сеть для разных весов и входных данных параллельно в pytorch?

Последнее сообщение Anonymous « 12 янв 2025, 22:41
Добавлено в форуме Python

Anonymous » 12 янв 2025, 22:41 » в форуме Python

Я работаю с машинным обучением, используя pytorch.
Есть класс, реализующий нейронную сеть, унаследованную от nn.Module. Реализована некоторая сетевая структура.
В списке хранятся различные параметры (веса, смещения):
parameters = [ , ..., ] . Также...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
12 янв 2025, 22:41
Преобразование весов модели из старой версии кераса в pytorch

Последнее сообщение Anonymous « 30 мар 2025, 23:08
Добавлено в форуме Python

Anonymous » 30 мар 2025, 23:08 » в форуме Python

Я хочу перенести предварительные веса из старого проекта на GitHub: Оригинальный код модели Keras:
def get_keras_autoencoder(self, input_size=256, nb_filter=96, k_size=5):

input_img = Input(shape=(1, input_size, input_size))

conv1 =...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
30 мар 2025, 23:08
Использование тензорного потока и PyTorch В одной среде Python Внутри приложения pyqt6

Последнее сообщение Anonymous « 20 сен 2024, 08:57
Добавлено в форуме Python

Anonymous » 20 сен 2024, 08:57 » в форуме Python

Я пытался выполнить выводы нейронной сети, используя TensorFlow и PyTorch в одной и той же среде Python внутри приложения PyQt6. Моя цель — сделать так, чтобы обе библиотеки беспрепятственно делали выводы внутри приложения. Однако я столкнулся с...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
20 сен 2024, 08:57
Использование тензорного потока и PyTorch В одной среде Python Внутри приложения pyqt6

Последнее сообщение Anonymous « 20 сен 2024, 10:43
Добавлено в форуме Python

Anonymous » 20 сен 2024, 10:43 » в форуме Python

Я пытался выполнить выводы нейронной сети, используя TensorFlow и PyTorch в одной и той же среде Python внутри приложения PyQt6. Моя цель — сделать так, чтобы обе библиотеки беспрепятственно делали выводы внутри приложения. Однако я столкнулся с...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
20 сен 2024, 10:43

Вернуться в «Python»