Маски для внимания в отношении данных временных рядов с керас -фанкционированным API

Маски для внимания в отношении данных временных рядов с керас -фанкционированным API ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Маски для внимания в отношении данных временных рядов с керас -фанкционированным API

Цитата

Сообщение Anonymous » 17 фев 2025, 19:32

В настоящее время я пытаюсь изучить влияние маскировки внимания на модель трансформатора, обученную классификации данных временных рядов. Моя модель работает до сих пор и дает мне производительность Okish, но когда я пытаюсь замаскировать внимание всех слоев мультиголовства в моей модели, производительность остается прежней, что вполне не то, что я ожидаю.
Моя модель (на основе учебника Keras): < /p>

Код: Выделить всё

def build(params: dict, input_shape:tuple) -> keras.Model:

#input_dim = 1
sequence_size = params["sequence_size"]
n_classes = params["n_classes"]
encoder_blocks = params["encoder_blocks"]
n_heads = params["encoder_heads"]
encolder_mlp = params["mlp_dim"]
conv_filters = params["conv_filters"]
encoder_dropout = params["encoder_dropout"]
mlp_dropout = params["mlp_dropout"]
learning_rate = params["learning_rate"]

inputs = keras.Input(shape=input_shape, name="sequence_input")
mask = keras.Input(shape=(sequence_size, sequence_size), name="mask_input")

x = inputs + SinePositionEncoding()(inputs)

for _ in range(encoder_blocks):
x = transformer_encoder(x, head_size=sequence_size, num_heads=n_heads, con_filters=conv_filters, attention_mask=mask, dropout=encoder_dropout, seed=SEED)
#x, _ = EncoderLayer(d_model=n_heads*5, num_heads= n_heads, dff=conv_filters, rate=encoder_dropout)(x, mask=mask)

x = layers.GlobalAveragePooling1D(data_format="channels_last")(x)
x = layers.Dense(encolder_mlp, activation="relu")(x)
x = layers.Dropout(mlp_dropout, seed=SEED)(x)

outputs = layers.Dense(n_classes, activation="softmax")(x)

model =  keras.Model(inputs=[inputs, mask], outputs=outputs)

model.compile(
loss="categorical_crossentropy",
optimizer=keras.optimizers.Adam(learning_rate=learning_rate),
metrics=["categorical_accuracy", "f1_score"],
run_eagerly=False
)

return model

с моим трансформатором_кодером

Код: Выделить всё

def transformer_encoder(inputs:np.ndarray, head_size:int, num_heads:int, con_filters:int, attention_mask, dropout=0, seed=42):

x, att = layers.MultiHeadAttention(
key_dim=head_size, num_heads=num_heads, dropout=dropout, seed=seed)(inputs, inputs, attention_mask=tf.ones((sequence_size, sequence_size), dtype=bool), return_attention_scores=True ,training=True)
tf.print(att)
#print(f"output: {x}")
#x, _ = MultiHeadAttention(d_model=num_heads*5, num_heads=num_heads)(inputs, inputs, inputs, attention_mask)
print(x)
x = layers.Dropout(dropout, seed=seed)(x)
x = layers.LayerNormalization(epsilon=1e-6)(x)
res = x + inputs

x = layers.Conv1D(filters=con_filters, kernel_size=1, activation="relu")(res)
x = layers.Dropout(dropout, seed=seed)(x)
x = layers.Conv1D(filters=inputs.shape[-1], kernel_size=1)(x)
x = layers.LayerNormalization(epsilon=1e-6)(x)

return x + res

До сих пор я пытался передать маску с каждым вводом и маскируя все внимание с tf.zeros ((sequence_size, sequence_size), dytpe = bool . Я также Пытался изменить форму масок, но не повезло.
Кто -нибудь, кто знает ответ?

Подробнее здесь: https://stackoverflow.com/questions/794 ... tional-api

1739809977

Anonymous

 В настоящее время я пытаюсь изучить влияние маскировки внимания на модель трансформатора, обученную классификации данных временных рядов. Моя модель работает до сих пор и дает мне производительность Okish, но когда я пытаюсь замаскировать внимание всех слоев мультиголовства  в моей модели, производительность остается прежней, что вполне не то, что я ожидаю. 
Моя модель (на основе учебника Keras): < /p>
[code]def build(params: dict, input_shape:tuple) -> keras.Model:

#input_dim = 1
sequence_size = params["sequence_size"]
n_classes = params["n_classes"]
encoder_blocks = params["encoder_blocks"]
n_heads = params["encoder_heads"]
encolder_mlp = params["mlp_dim"]
conv_filters = params["conv_filters"]
encoder_dropout = params["encoder_dropout"]
mlp_dropout = params["mlp_dropout"]
learning_rate = params["learning_rate"]

inputs = keras.Input(shape=input_shape, name="sequence_input")
mask = keras.Input(shape=(sequence_size, sequence_size), name="mask_input")

x = inputs + SinePositionEncoding()(inputs)

for _ in range(encoder_blocks):
x = transformer_encoder(x, head_size=sequence_size, num_heads=n_heads, con_filters=conv_filters, attention_mask=mask, dropout=encoder_dropout, seed=SEED)
#x, _ = EncoderLayer(d_model=n_heads*5, num_heads= n_heads, dff=conv_filters, rate=encoder_dropout)(x, mask=mask)

x = layers.GlobalAveragePooling1D(data_format="channels_last")(x)
x = layers.Dense(encolder_mlp, activation="relu")(x)
x = layers.Dropout(mlp_dropout, seed=SEED)(x)

outputs = layers.Dense(n_classes, activation="softmax")(x)

model =  keras.Model(inputs=[inputs, mask], outputs=outputs)

model.compile(
loss="categorical_crossentropy",
optimizer=keras.optimizers.Adam(learning_rate=learning_rate),
metrics=["categorical_accuracy", "f1_score"],
run_eagerly=False
)

return model

[/code]
с моим трансформатором_кодером 
[code]def transformer_encoder(inputs:np.ndarray, head_size:int, num_heads:int, con_filters:int, attention_mask, dropout=0, seed=42):

x, att = layers.MultiHeadAttention(
key_dim=head_size, num_heads=num_heads, dropout=dropout, seed=seed)(inputs, inputs, attention_mask=tf.ones((sequence_size, sequence_size), dtype=bool), return_attention_scores=True ,training=True)
tf.print(att)
#print(f"output: {x}")
#x, _ = MultiHeadAttention(d_model=num_heads*5, num_heads=num_heads)(inputs, inputs, inputs, attention_mask)
print(x)
x = layers.Dropout(dropout, seed=seed)(x)
x = layers.LayerNormalization(epsilon=1e-6)(x)
res = x + inputs

x = layers.Conv1D(filters=con_filters, kernel_size=1, activation="relu")(res)
x = layers.Dropout(dropout, seed=seed)(x)
x = layers.Conv1D(filters=inputs.shape[-1], kernel_size=1)(x)
x = layers.LayerNormalization(epsilon=1e-6)(x)

return x + res
[/code]
До сих пор я пытался передать маску с каждым вводом и маскируя все внимание с tf.zeros ((sequence_size, sequence_size), dytpe = bool . Я также Пытался изменить форму масок, но не повезло.
Кто -нибудь, кто знает ответ?  

Подробнее здесь: [url]https://stackoverflow.com/questions/79446041/attention-masks-on-time-series-data-with-keras-funktional-api[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Классификация временных рядов с использованием запаздывающих данных и экзогенных переменных временных рядов для исследов

Последнее сообщение Anonymous « 26 сен 2024, 17:36
Добавлено в форуме Python

Anonymous » 26 сен 2024, 17:36 » в форуме Python

У меня есть следующий кадр данных pandas
import pandas as pd
pd.DataFrame({
'region': ,
'week': ,
'rain': ,
'clouds':
})

region week rain clouds
0 1 1 1 1
1 1 2 1 1
2 1 3 0 0
3 1 4 1 0
4 2 1 1 0
5 2 2 1 0
6 2 3 1 1
7 2 4 1 0
8 3 1 1 1
9 3 2 0 0...

0 Ответы

52 Просмотры

Последнее сообщение Anonymous
26 сен 2024, 17:36
Удаление ложно заполненных рядов в данных временных рядов в пандах

Последнее сообщение Anonymous « 20 фев 2025, 18:38
Добавлено в форуме Python

Anonymous » 20 фев 2025, 18:38 » в форуме Python

У меня есть 1-минутные данные временных рядов с столбцами событий и продолжительности. Иногда события не случаются какое -то время, но последнее событие заполняется вперед, пока не произойдет следующее событие. Мы знаем, сколько минут каждые событие...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
20 фев 2025, 18:38
Уровень внимания Keras не возвращает оценки внимания

Последнее сообщение Anonymous « 24 дек 2024, 13:08
Добавлено в форуме Python

Anonymous » 24 дек 2024, 13:08 » в форуме Python

Я использую keras=3.7.0 и пытаюсь реализовать собственный блок Temporal Convolutional Attention Network (TCAN). Хотя уровень внимания работает в автономном тестовом примере, я столкнулся с проблемой при его интеграции в мою пользовательскую модель....

0 Ответы

44 Просмотры

Последнее сообщение Anonymous
24 дек 2024, 13:08
Проблема с объединением наборов данных временных рядов для согласованных временных интервалов

Последнее сообщение Anonymous « 10 янв 2025, 18:52
Добавлено в форуме Python

Anonymous » 10 янв 2025, 18:52 » в форуме Python

В настоящее время я работаю над проектом, в котором мне нужно сначала объединить два набора данных:
Первый набор данных содержит данные о погоде с 30-минутными интервалами. Второй набор данных содержит данные минутного уровня с фотоэлектрическим...

0 Ответы

32 Просмотры

Последнее сообщение Anonymous
10 янв 2025, 18:52
Проблема с объединением наборов данных временных рядов для согласованных временных интервалов

Последнее сообщение Anonymous « 10 янв 2025, 19:48
Добавлено в форуме Python

Anonymous » 10 янв 2025, 19:48 » в форуме Python

В настоящее время я работаю над проектом, в котором мне нужно сначала объединить два набора данных:
Первый набор данных содержит данные о погоде с 30-минутными интервалами. Второй набор данных содержит данные минутного уровня с фотоэлектрическим...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
10 янв 2025, 19:48

Вернуться в «Python»