TransformerEncoder дает худшую производительность, если длина последовательности во время обучения отличается от вывода.

TransformerEncoder дает худшую производительность, если длина последовательности во время обучения отличается от вывода. ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

TransformerEncoder дает худшую производительность, если длина последовательности во время обучения отличается от вывода.

Цитата

Сообщение Anonymous » 30 ноя 2024, 16:01

Дано (это 600 будет использоваться для вывода):

Код: Выделить всё
```
X_infer
```
тензор формы (num_window, window_len) -> (1, 600)
Код: Выделить всё
```
y_infer
```
тензор в форме (num_window, window_len) -> (1, 600)

Размер словаря:

Код: Выделить всё
```
X
```
: 128 (амплитуда)
Код: Выделить всё
```
y
```
: 5 (Цветовая метка)

Выполнениескользящего_окна из источника, возвращает (это 180 будет использоваться во время обучение):

Код: Выделить всё
```
X_train
```
тензор формы (num_window, window_len) -> (471, 180)
Код: Выделить всё
```
y_train
```
тензор в форме (num_window, window_len) -> (471, 180)

Поезд:

Код: Выделить всё

model = instantiate_untrained_model(seq_len=180)
model.fit(X_train, y_train)

Сохранить (только веса):

Код: Выделить всё

model.save_weights('trained.weights.h5')

Вывод с разницей seq_len:

Код: Выделить всё

# 600
model = instantiate_untrained_model(seq_len=600) # entire array
model.load_weights('trained.weights.h5') # No error
y_pred_600 = model.predict(X_infer)

# 180
model = instantiate_untrained_model(seq_len=180) # windowed array
model.load_weights('trained.weights.h5')
y_pred_180 = model.predict(X_train)

Построение прогноза y_pred_180 и его основная истина:
[img]https:/ /i.sstatic.net/0kHa9JlC.png[/img]

Построение прогноза y_pred_600 и его основная истина:

Хотя это сигнал, но вы можете считать эту проблему именованной Распознавание объектов.
А вот модель keras:

Код: Выделить всё

  SEQ_LEN=seq_len
VOCAB_SIZE=128
EMBEDD_DIM=128

encoder_inputs = Input(shape=(SEQ_LEN,), name="encoder_inputs", dtype=np.uint8)
token_embeddings = Embedding(input_dim=VOCAB_SIZE, output_dim=EMBEDD_DIM)(encoder_inputs)
position_encodings = SinePositionEncoding()(token_embeddings)

# this line adds up the embeddings and fixes the problem
embeddings = token_embeddings + position_encodings

encoder_outputs = TransformerEncoder(intermediate_dim=EMBEDD_DIM*4, num_heads=2, dropout=0.05)(inputs=embeddings)

# Output layer for vocabulary size of 5
output_predictions = Dense(units=5, activation=None)(encoder_outputs)

# Final model
model = Model(encoder_inputs, output_predictions, name="transformer_encoder")

Я ожидаю, что во время вывода модель преобразователя сможет принимать произвольную длину последовательности с хорошей производительностью?
Почему это произошло? Есть ли связь с SinePositionEncoding или чем-то еще? Модель не является гибкой и ненадежной, она обеспечивает хорошую производительность только тогда, когда длина последовательности равна 180 вместо произвольной длины? Как я могу решить эту проблему?

Подробнее здесь: https://stackoverflow.com/questions/792 ... ing-traini

1732971682

Anonymous

Дано (это 600 будет использоваться для вывода):
[list]
[*][code]X_infer[/code] тензор формы (num_window, window_len) -> (1, 600)
[*][code]y_infer[/code] тензор в форме (num_window, window_len) -> (1, 600)
[/list]
Размер словаря:
[list]
[*][code]X[/code]: 128 (амплитуда)
[*][code]y[/code]: 5 (Цветовая метка)
[/list]
Выполнениескользящего_окна из источника, возвращает (это 180 будет использоваться во время обучение):
[list]
[*][code]X_train[/code] тензор формы (num_window, window_len) -> (471, 180)
[*][code]y_train[/code] тензор в форме (num_window, window_len) -> (471, 180)
[/list]
Поезд:
[code]model = instantiate_untrained_model(seq_len=180)
model.fit(X_train, y_train)
[/code]
Сохранить (только веса):
[code]model.save_weights('trained.weights.h5')
[/code]
Вывод с разницей seq_len:
[code]# 600
model = instantiate_untrained_model(seq_len=600) # entire array
model.load_weights('trained.weights.h5') # No error
y_pred_600 = model.predict(X_infer)

# 180
model = instantiate_untrained_model(seq_len=180) # windowed array
model.load_weights('trained.weights.h5')
y_pred_180 = model.predict(X_train)
[/code]
Построение прогноза y_pred_180 и его основная истина:
[img]https:/ /i.sstatic.net/0kHa9JlC.png[/img]

Построение прогноза y_pred_600 и его основная истина:
[img]https://i.sstatic.net/jtE4fEvF.png[/img]

Хотя это сигнал, но вы можете считать эту проблему именованной Распознавание объектов.
А вот модель keras:
[code]  SEQ_LEN=seq_len
VOCAB_SIZE=128
EMBEDD_DIM=128

encoder_inputs = Input(shape=(SEQ_LEN,), name="encoder_inputs", dtype=np.uint8)
token_embeddings = Embedding(input_dim=VOCAB_SIZE, output_dim=EMBEDD_DIM)(encoder_inputs)
position_encodings = SinePositionEncoding()(token_embeddings)

# this line adds up the embeddings and fixes the problem
embeddings = token_embeddings + position_encodings

encoder_outputs = TransformerEncoder(intermediate_dim=EMBEDD_DIM*4, num_heads=2, dropout=0.05)(inputs=embeddings)

# Output layer for vocabulary size of 5
output_predictions = Dense(units=5, activation=None)(encoder_outputs)

# Final model
model = Model(encoder_inputs, output_predictions, name="transformer_encoder")
[/code]
[b]Я ожидаю, что во время вывода модель преобразователя сможет принимать произвольную длину последовательности с хорошей производительностью?[/b]
Почему это произошло? Есть ли связь с SinePositionEncoding или чем-то еще? Модель не является гибкой и ненадежной, она обеспечивает хорошую производительность только тогда, когда длина последовательности равна 180 вместо произвольной длины? Как я могу решить эту проблему? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79239577/transformerencoder-give-worse-performance-when-the-sequence-length-during-traini[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему длина сегмента TCP не отличается в одной и той же последовательности TCP при использовании сетевой карты Exanic X

Последнее сообщение Anonymous « 05 янв 2024, 08:17
Добавлено в форуме C++

Anonymous » 05 янв 2024, 08:17 » в форуме C++

Ниже приводится описание моей проблемы. Я использовал один сетевой адаптер Cisco Nexus SmartNIC K35-S (ранее Exanic X10 NIC) для зеркалирования данных TCP и анализа этих пакетов. Процесс получения данных кадра от сетевого адаптера X10 находится в...

0 Ответы

81 Просмотры

Последнее сообщение Anonymous
05 янв 2024, 08:17
Трансформатор кодер-декодер хорошая производительность обучения, плохая производительность авторегрессии

Последнее сообщение Anonymous « 22 июн 2024, 00:55
Добавлено в форуме Python

Anonymous » 22 июн 2024, 00:55 » в форуме Python

Я работаю над полной моделью преобразователя кодер-декодер для синтеза речи из сигналов ЭЭГ. В частности, для окна ЭЭГ-активности длиной x=100 я прогнозирую окно длиной x=100 мел-спектрограмм. ЭЭГ и мел-спектрограммы выровнены по времени, с общими...

0 Ответы

96 Просмотры

Последнее сообщение Anonymous
22 июн 2024, 00:55
«Ошибка: длина («-2») должна быть неотрицательным значением. (Параметр «длина») Фактическое значение было -2». но если я

Последнее сообщение Anonymous « 09 дек 2024, 07:45
Добавлено в форуме C#

Anonymous » 09 дек 2024, 07:45 » в форуме C#

FileInfo fileInfo = новый FileInfo(filePath);
строка DirectoryName = fileInfo.DirectoryName;
строка outputFileName = Path.GetFileNameWithoutExtension(fileInfo.Name) + «_wrapped» + fileInfo.Extension;
строка outputFilePath =...

0 Ответы

32 Просмотры

Последнее сообщение Anonymous
09 дек 2024, 07:45
«Ошибка: длина («-2») должна быть неотрицательным значением. (Параметр «длина») Фактическое значение было -2». но если я

Последнее сообщение Anonymous « 09 дек 2024, 09:03
Добавлено в форуме C#

Anonymous » 09 дек 2024, 09:03 » в форуме C#

FileInfo fileInfo = new FileInfo(filePath);
string directoryName = fileInfo.DirectoryName;
string outputFileName = Path.GetFileNameWithoutExtension(fileInfo.Name) + _wrapped + fileInfo.Extension;
string outputFilePath = Path.Combine(directoryName,...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
09 дек 2024, 09:03
«Ошибка: длина («-2») должна быть неотрицательным значением. (Параметр «длина») Фактическое значение было -2». но если я

Последнее сообщение Anonymous « 09 дек 2024, 10:13
Добавлено в форуме C#

Anonymous » 09 дек 2024, 10:13 » в форуме C#

public static void ReadExcelFile(string filePath)
{
try
{
// Validate file existence
if (!File.Exists(filePath))
{
throw new FileNotFoundException( The specified Excel file was not found. , filePath);
}
public static void ReadExcelFile(string...

0 Ответы

36 Просмотры

Последнее сообщение Anonymous
09 дек 2024, 10:13

Вернуться в «Python»