Обратная задача/плато функции потерь нейронной сети автоэнкодера для приложений с высокой точностью

Обратная задача/плато функции потерь нейронной сети автоэнкодера для приложений с высокой точностью ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Обратная задача/плато функции потерь нейронной сети автоэнкодера для приложений с высокой точностью

Цитата

Сообщение Anonymous » 07 окт 2024, 20:50

Этот вопрос частично унаследован от кривой переоценки предыдущего вопроса, аппроксимирующей формулу дисперсии Шотта для стеклянного материала, так что при наличии только двух значений n_e и V_e регрессия может соответствовать кривой, которая предсказывает 6 коэффициентов формулы Шотта (лямбда — длина волны в микрометрах):

В этом вопросе добрые господа указали на мою ошибку, и программа смогла подогнать кривую. Однако после некоторых экспериментов подобранная кривая оказалась недостаточно точной. Например, при n_e = 1,7899 и V_e = 48, используя предсказанные 6 коэффициентов для восстановления дисперсии, вычисленное n_e составило около 1,8 и V_e > около 33, слишком неточно для оптического моделирования.
Затем я решил попробовать нейронную сеть предсказать 6 коэффициентов.
Для расчета n_e можно использовать 6 коэффициентов, установив лямбду равной 546,07 нм, а V_e можно рассчитать по двум другим длинам волн, используя определение:

Где:

Код: Выделить всё

lambda_e = 0.54607  # e-line (546.07 nm)
lambda_Fp = 0.47999  # F'-line (479.99 nm)
lambda_Cp = 0.64385  # C'-line (643.85 nm)

Эта связь делает задачу обратной, аналогичной автокодировщику. Поэтому я включил в этот процесс формулу Шотта:

Код: Выделить всё

def schott_dispersion(A, lam):
A0, A1, A2, A3, A4, A5 = A[:, 0], A[:, 1], A[:, 2], A[:, 3], A[:, 4], A[:, 5]
n_squared = A0 + A1* lam + A2 * lam**(-2) + A3 * lam**(-4) + A4 * lam**(-6) + A5 * lam**(-8)

n_squared = tf.clip_by_value(n_squared, clip_value_min=1e-6, clip_value_max=tf.float32.max)

return tf.sqrt(n_squared)

И используйте формулу Шотта для настройки функции потерь:

Код: Выделить всё

def custom_loss(y_true, y_pred):

# Split y_true into x_true (n_e and V_e) and the actual coefficients
n_e_true = y_true[:, 0]  # Refractive index n_e
V_e_true = y_true[:, 1]  # Abbe number V_e
schott_true = y_true[:, 2:]  # True Schott coefficients

# Calculate refractive indices for e, F' and C' lines
n_e_pred = schott_dispersion(y_pred, lambda_e)
n_F_pred = schott_dispersion(y_pred, lambda_Fp)
n_C_pred = schott_dispersion(y_pred, lambda_Cp)

# Calculate predicted Abbe number V_e
epsilon = 1e-6  # Small value to prevent division by zero
V_e_pred = (n_e_pred - 1) / (tf.abs(n_F_pred - n_C_pred) + epsilon)

# Compute the loss
loss_n_e = tf.square(n_e_true - n_e_pred)
loss_V_e = tf.square(V_e_true - V_e_pred)

total_loss = tf.reduce_mean(loss_n_e + loss_V_e)
return total_loss

В конце используйте эту функцию потерь для обучения модели:

Код: Выделить всё

def build_model():
model = models.Sequential()
model.add(layers.Dense(64, activation='relu', input_shape=(2,)))  # Input: (n_e, V_e)
model.add(layers.Dense(256, activation='relu'))
model.add(layers.Dropout(0.1))
model.add(layers.Dense(128, activation='relu', kernel_regularizer=regularizers.l2(0.0001)))
model.add(layers.Dense(6))  # Output: (y1, y2, y3, y4, y5, y6)
return model

scaler_X = StandardScaler()

X_train = input_data.values
y_train = concat.values

X_train_scaled = scaler_X.fit_transform(X_train)

model = build_model()
optimizer = tf.keras.optimizers.Adam(learning_rate=0.0001, clipvalue=1.0)
model.compile(optimizer=optimizer, loss=custom_loss, run_eagerly=True)

lr_scheduler = tf.keras.callbacks.ReduceLROnPlateau(monitor='loss', factor=0.5, patience=5, min_lr=1e-6)
history = model.fit(X_train_scaled, y_train, epochs=100, batch_size=32)

и запустите обучение.
Однако потери колеблются в районе 3000-

Код: Выделить всё

300,000

и так и не смог сойтись, итоговое предсказание крайне неточно и совершенно непригодно для использования. Но, учитывая мой довольно ограниченный опыт, я не уверен, какая часть вызывает проблему. Есть ли способ улучшить обучение?

Приложение
Данные обучения (таблица CSV) ссылка здесь.
Для чтения данных используется следующий код:

Код: Выделить всё

df = pd.read_csv(path)
input_data = df[['n_e', 'V_e']].dropna()
concat =  df[['n_e', 'V_e', 'A0', 'A1', 'A2', 'A3', 'A4', 'A5']].dropna()

Я также подозреваю, что сама цель ненадежна или недостижима. Материалом, который вызвал все эти вопросы, является стекло с n_e=1,7899 и V_e=48, описанное в патенте FR1233449. Я считаю, что это специальное стекло, изготовленное в середине 90-х годов в фабрике Leica для объектива Summilux 35mm f/1.4. И в библиотеке, насчитывающей более 3000 современных очков, ни у одного нет такого параметра, может быть, он слишком особенный?
Это получился такой длинный пост... Благодарю всех за помощь и мнение, даже просто прочитав это.

Подробнее здесь: https://stackoverflow.com/questions/790 ... -high-accu

1728323457

Anonymous

Этот вопрос частично унаследован от кривой переоценки предыдущего вопроса, аппроксимирующей формулу дисперсии Шотта для стеклянного материала, так что при наличии только двух значений n_e и V_e регрессия может соответствовать кривой, которая предсказывает 6 коэффициентов формулы Шотта (лямбда — длина волны в микрометрах):
[img]https://i.sstatic.net/iBGIUTj8. png[/img]

В этом вопросе добрые господа указали на мою ошибку, и программа смогла подогнать кривую. Однако после некоторых экспериментов подобранная кривая оказалась недостаточно точной. Например, при n_e = 1,7899 и V_e = 48, используя предсказанные 6 коэффициентов для восстановления дисперсии, вычисленное n_e составило около 1,8 и V_e > около 33, слишком неточно для оптического моделирования.
Затем я решил попробовать нейронную сеть предсказать 6 коэффициентов.
Для расчета n_e можно использовать 6 коэффициентов, установив лямбду равной 546,07 нм, а V_e можно рассчитать по двум другим длинам волн, используя определение:
[img]https://i.sstatic.net/rdeT80kZ.png[/img]

Где:
[code]lambda_e = 0.54607  # e-line (546.07 nm)
lambda_Fp = 0.47999  # F'-line (479.99 nm)
lambda_Cp = 0.64385  # C'-line (643.85 nm)
[/code]
Эта связь делает задачу обратной, аналогичной автокодировщику. Поэтому я включил в этот процесс формулу Шотта:
[code]def schott_dispersion(A, lam):
A0, A1, A2, A3, A4, A5 = A[:, 0], A[:, 1], A[:, 2], A[:, 3], A[:, 4], A[:, 5]
n_squared = A0 + A1* lam + A2 * lam**(-2) + A3 * lam**(-4) + A4 * lam**(-6) + A5 * lam**(-8)

n_squared = tf.clip_by_value(n_squared, clip_value_min=1e-6, clip_value_max=tf.float32.max)

return tf.sqrt(n_squared)
[/code]
И используйте формулу Шотта для настройки функции потерь:
[code]def custom_loss(y_true, y_pred):

# Split y_true into x_true (n_e and V_e) and the actual coefficients
n_e_true = y_true[:, 0]  # Refractive index n_e
V_e_true = y_true[:, 1]  # Abbe number V_e
schott_true = y_true[:, 2:]  # True Schott coefficients

# Calculate refractive indices for e, F' and C' lines
n_e_pred = schott_dispersion(y_pred, lambda_e)
n_F_pred = schott_dispersion(y_pred, lambda_Fp)
n_C_pred = schott_dispersion(y_pred, lambda_Cp)

# Calculate predicted Abbe number V_e
epsilon = 1e-6  # Small value to prevent division by zero
V_e_pred = (n_e_pred - 1) / (tf.abs(n_F_pred - n_C_pred) + epsilon)

# Compute the loss
loss_n_e = tf.square(n_e_true - n_e_pred)
loss_V_e = tf.square(V_e_true - V_e_pred)

total_loss = tf.reduce_mean(loss_n_e + loss_V_e)
return total_loss
[/code]
В конце используйте эту функцию потерь для обучения модели:
[code]def build_model():
model = models.Sequential()
model.add(layers.Dense(64, activation='relu', input_shape=(2,)))  # Input: (n_e, V_e)
model.add(layers.Dense(256, activation='relu'))
model.add(layers.Dropout(0.1))
model.add(layers.Dense(128, activation='relu', kernel_regularizer=regularizers.l2(0.0001)))
model.add(layers.Dense(6))  # Output: (y1, y2, y3, y4, y5, y6)
return model

scaler_X = StandardScaler()

X_train = input_data.values
y_train = concat.values

X_train_scaled = scaler_X.fit_transform(X_train)

model = build_model()
optimizer = tf.keras.optimizers.Adam(learning_rate=0.0001, clipvalue=1.0)
model.compile(optimizer=optimizer, loss=custom_loss, run_eagerly=True)

lr_scheduler = tf.keras.callbacks.ReduceLROnPlateau(monitor='loss', factor=0.5, patience=5, min_lr=1e-6)
history = model.fit(X_train_scaled, y_train, epochs=100, batch_size=32)
[/code]
и запустите обучение.
Однако потери колеблются в районе 3000-[code]300,000[/code] и так и не смог сойтись, итоговое предсказание крайне неточно и совершенно непригодно для использования. Но, учитывая мой довольно ограниченный опыт, я не уверен, какая часть вызывает проблему. Есть ли способ улучшить обучение?

Приложение
Данные обучения (таблица CSV) ссылка здесь.
Для чтения данных используется следующий код:
[code]df = pd.read_csv(path)
input_data = df[['n_e', 'V_e']].dropna()
concat =  df[['n_e', 'V_e', 'A0', 'A1', 'A2', 'A3', 'A4', 'A5']].dropna()
[/code]
Я также подозреваю, что сама цель ненадежна или недостижима. Материалом, который вызвал все эти вопросы, является стекло с n_e=1,7899 и V_e=48, описанное в патенте FR1233449.  Я считаю, что это специальное стекло, изготовленное в середине 90-х годов в фабрике Leica для объектива Summilux 35mm f/1.4. И в библиотеке, насчитывающей более 3000 современных очков, ни у одного нет такого параметра, может быть, он слишком особенный?
Это получился такой длинный пост... Благодарю всех за помощь и мнение, даже просто прочитав это. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79063019/inverse-problem-autoencoder-neural-network-loss-function-plateau-for-high-accu[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Объединение пользовательской функции потерь с предопределенной функцией потерь (Dice и Focal) для обучения DeeplabV3Plus

Последнее сообщение Anonymous « 19 окт 2023, 10:37
Добавлено в форуме Python

Anonymous » 19 окт 2023, 10:37 » в форуме Python

Я обучаю DeeplabV3+ семантической сегментации изображений дистанционного зондирования. Я создаю модель после урока по keras ( ), и она отлично работает, когда я использую для обучения фокусную потерю (предустановленную в Keras/tf). Маски имеют...

0 Ответы

50 Просмотры

Последнее сообщение Anonymous
19 окт 2023, 10:37
Как интегрировать функцию с высокой точностью

Последнее сообщение Гость « 29 фев 2024, 08:52
Добавлено в форуме Python

Гость » 29 фев 2024, 08:52 » в форуме Python

Я пытаюсь интегрировать произведение функций sin и cos. Результаты, которые я получаю, совпадают, когда речь идет об относительно больших числах, таких как мощность e-02....e-04. Тем не менее, дробные числа, составляющие степень е-11.....е-32,...

0 Ответы

14 Просмотры

Последнее сообщение Гость
29 фев 2024, 08:52
Лучший способ заснуть или сделать паузу в Unity с высокой точностью времени

Последнее сообщение Anonymous « 05 ноя 2024, 07:09
Добавлено в форуме C#

Anonymous » 05 ноя 2024, 07:09 » в форуме C#

Я работаю над проектом Unity, где мне нужно добиться высокоточного управления временем для цикла отображения и обработки кадров. В частности, мне нужно, чтобы временной интервал между кадрами был как можно более постоянным, с возможностью...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
05 ноя 2024, 07:09
Лучший способ заснуть или сделать паузу в Unity с высокой точностью времени

Последнее сообщение Anonymous « 05 ноя 2024, 10:49
Добавлено в форуме C#

Anonymous » 05 ноя 2024, 10:49 » в форуме C#

Я работаю над проектом Unity, где мне нужно добиться высокоточного управления временем для цикла отображения и обработки кадров. В частности, мне нужно, чтобы временной интервал между кадрами был как можно более постоянным, с возможностью...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
05 ноя 2024, 10:49
Эффективно импортировать большие файлы Excel в PostgreSQL с высокой точностью

Последнее сообщение Anonymous « 02 июн 2025, 10:00
Добавлено в форуме Python

Anonymous » 02 июн 2025, 10:00 » в форуме Python

Я создаю утилиту для импорта данных из файлов Excel в базу данных PostgreSQL.
Мои основные цели:
Высокая точность - убедитесь, что все записи правильно проповедуют и хранятся без потери данных или коррупции. /> Я открыт для использования любого...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
02 июн 2025, 10:00

Вернуться в «Python»