Реализация двоичной классификации для LSTM и вывода линейного слоя

Реализация двоичной классификации для LSTM и вывода линейного слоя ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Реализация двоичной классификации для LSTM и вывода линейного слоя

Цитата

Сообщение Anonymous » 31 мар 2024, 05:41

Я работаю над разработкой модели пробуждающего слова для моего помощника с искусственным интеллектом. Архитектура моей модели включает в себя уровень LSTM для обработки аудиоданных, за которым следует линейный уровень. Однако я столкнулся с неожиданной формой выходных данных линейного слоя, что вызывает путаницу.
После передачи выходных данных LSTM (форма: 4, 32, 32) на линейный слой Я ожидал выходной формы (4, 32, 1). Однако фактическая форма вывода равна (4, 32, 1).
В моей задаче двоичной классификации я стремлюсь различать два класса: 0 для «не просыпаться» и 1. для «разбуди ИИ». Размер моего пакета равен 32, и я ожидал, что выходные данные будут иметь форму (32, 1), чтобы представлять один прогноз для каждого аудиовхода MFCC.
Может ли кто-нибудь посоветовать правильную конфигурацию линейный слой или какие-либо этапы обработки, необходимые для достижения желаемой выходной формы (32, 1)? Будем очень признательны за любые идеи или примеры кода. Ниже приведен код моей модели для справки:

Код: Выделить всё

class LSTMWakeWord(nn.Module):
def __init__(self,input_size,hidden_size,num_layers,dropout,bidirectional,num_of_classes, device='cpu'):
super(LSTMWakeWord, self).__init__()
self.input_size = input_size
self.hidden_size = hidden_size
self.num_layers = num_layers
self.device = device
self.bidirectional = bidirectional
self.directions = 2 if bidirectional else 1

self.lstm = nn.LSTM(input_size=input_size,
hidden_size = hidden_size,
num_layers = num_layers,
dropout=dropout,
bidirectional=bidirectional,
batch_first=True)
self.layernorm = nn.LayerNorm(input_size)

self.classifier = nn.Linear(hidden_size , num_of_classes)

def _init_hidden(self,batch_size):
n, d, hs = self.num_layers, self.directions, self.hidden_size
return (torch.zeros(n * d, batch_size, hs).to(self.device),
torch.zeros(n * d, batch_size, hs).to(self.device))

def forward(self,x):
# the values with e+xxx are gone. so it normalizes the values
x = self.layernorm(x)
# x shape ->  feature(n_mfcc),batch,seq_len(time)
hidden = self._init_hidden(x.size()[0])
out, (hn, cn) = self.lstm(x, hidden)
print("hn "+str(hn.shape))# directions∗num_layers, batch, hidden_size
#print("out " + str(out.shape))# batch, seq_len, direction(2 or 1)*hidden_size
out = self.classifier(hn)
print("out2 " + str(out.shape))

return out

Я был бы очень признателен за любую информацию или рекомендации о том, как обрабатывать выходные данные линейного слоя для двоичной классификации.

Подробнее здесь: https://stackoverflow.com/questions/715 ... yer-output

1711852881

Anonymous

Я работаю над разработкой модели пробуждающего слова для моего помощника с искусственным интеллектом. Архитектура моей модели включает в себя уровень LSTM для обработки аудиоданных, за которым следует линейный уровень. Однако я столкнулся с неожиданной формой выходных данных линейного слоя, что вызывает путаницу.
После передачи выходных данных LSTM (форма: 4, 32, 32) на линейный слой Я ожидал выходной формы (4, 32, 1). Однако фактическая форма вывода равна (4, 32, 1).
В моей задаче двоичной классификации я стремлюсь различать два класса: 0 для «не просыпаться» и 1. для «разбуди ИИ». Размер моего пакета равен 32, и я ожидал, что выходные данные будут иметь форму (32, 1), чтобы представлять один прогноз для каждого аудиовхода MFCC.
Может ли кто-нибудь посоветовать правильную конфигурацию линейный слой или какие-либо этапы обработки, необходимые для достижения желаемой выходной формы (32, 1)? Будем очень признательны за любые идеи или примеры кода. Ниже приведен код моей модели для справки:
[code]class LSTMWakeWord(nn.Module):
def __init__(self,input_size,hidden_size,num_layers,dropout,bidirectional,num_of_classes, device='cpu'):
super(LSTMWakeWord, self).__init__()
self.input_size = input_size
self.hidden_size = hidden_size
self.num_layers = num_layers
self.device = device
self.bidirectional = bidirectional
self.directions = 2 if bidirectional else 1

self.lstm = nn.LSTM(input_size=input_size,
hidden_size = hidden_size,
num_layers = num_layers,
dropout=dropout,
bidirectional=bidirectional,
batch_first=True)
self.layernorm = nn.LayerNorm(input_size)

self.classifier = nn.Linear(hidden_size , num_of_classes)

def _init_hidden(self,batch_size):
n, d, hs = self.num_layers, self.directions, self.hidden_size
return (torch.zeros(n * d, batch_size, hs).to(self.device),
torch.zeros(n * d, batch_size, hs).to(self.device))

def forward(self,x):
# the values with e+xxx are gone. so it normalizes the values
x = self.layernorm(x)
# x shape ->  feature(n_mfcc),batch,seq_len(time)
hidden = self._init_hidden(x.size()[0])
out, (hn, cn) = self.lstm(x, hidden)
print("hn "+str(hn.shape))# directions∗num_layers, batch, hidden_size
#print("out " + str(out.shape))# batch, seq_len, direction(2 or 1)*hidden_size
out = self.classifier(hn)
print("out2 " + str(out.shape))

return out
[/code]
Я был бы очень признателен за любую информацию или рекомендации о том, как обрабатывать выходные данные линейного слоя для двоичной классификации.
 

Подробнее здесь: [url]https://stackoverflow.com/questions/71565894/implementing-binary-classification-for-lstm-and-linear-layer-output[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Построить модель двоичной классификации с помощью LSTM

Последнее сообщение Anonymous « 17 окт 2024, 13:45
Добавлено в форуме Python

Anonymous » 17 окт 2024, 13:45 » в форуме Python

У меня есть набор данных в формате csv с 49 столбцами, некоторые из них являются строками, а некоторые — целыми числами.
Я добавил новый столбец для использования в качестве метки под названием «входные данные». с соответствующей меткой 0 и 1.
Вот...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
17 окт 2024, 13:45
Что делает Keras, когда количество входных данных слоя LSTM больше или меньше количества ячеек LSTM в этом слое?

Последнее сообщение Anonymous « 04 ноя 2024, 15:21
Добавлено в форуме Python

Anonymous » 04 ноя 2024, 15:21 » в форуме Python

Пожалуйста, посмотрите код Python ниже. Я оставил комментарии в коде, где, по моему мнению, требуется акцент на информации.

import keras
import numpy

def build_model():
model = keras.models.Sequential()
model.add(keras.layers.LSTM(3, input_shape...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
04 ноя 2024, 15:21
Я хотел бы использовать модель двоичной классификации тензорного потока для вывода прогнозов для всего набора данных.

Последнее сообщение Anonymous « 18 сен 2024, 03:00
Добавлено в форуме Python

Anonymous » 18 сен 2024, 03:00 » в форуме Python

Извиняюсь, если это глупый вопрос, однако я новичок в Tensorflow. Я построил модель, которая прогнозирует, будет ли клиент звонить снова, на основе параметров звонка. Я хотел бы использовать эту модель на регулярной основе с вызовами в этот день,...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
18 сен 2024, 03:00
Регрессия PyTorch LSTM: взять только последнее выходное значение или взять все выходные значения LSTM?

Последнее сообщение Anonymous « 17 окт 2024, 19:02
Добавлено в форуме Python

Anonymous » 17 окт 2024, 19:02 » в форуме Python

Я пытаюсь обучить свою первую регрессионную модель LSTM на основе данных о глобальной средней температуре. Температура доступна для каждого месяца, начиная с 1 января 1850 года.
Из того, что я узнал в Интернете, я ввожу 12 месяцев подряд в LSTM и...

0 Ответы

35 Просмотры

Последнее сообщение Anonymous
17 окт 2024, 19:02
Какое правило знать, сколько ячеек LSTM и сколько единиц в каждой ячейке LSTM вам нужны в керах?

Последнее сообщение Anonymous « 07 апр 2025, 23:32
Добавлено в форуме Python

Anonymous » 07 апр 2025, 23:32 » в форуме Python

Я знаю, что ячейка LSTM имеет несколько ANN внутри.

Но при определении скрытого слоя для той же проблемы я видел, как некоторые люди используют только 1 ячейку LSTM, а другие используют 2, 3 LSTM, подобные этой -

model = Sequential()...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
07 апр 2025, 23:32

Вернуться в «Python»