Как обучить модель МО прогнозировать диагноз на основе данных ЭКГ и ее особенностей? ⇐ Python
Как обучить модель МО прогнозировать диагноз на основе данных ЭКГ и ее особенностей?
Поэтому мне нужно обучить модель, чтобы она могла считывать данные сигнала ЭКГ и извлеченные функции, а также иметь возможность прогнозировать состояние сердца пациента, а также предсказывать, будет ли у человека такое заболевание в будущем. База данных представляет собой крупномасштабную базу данных электрокардиограмм в 12 отведениях для исследования аритмии на Physionet. Я начал с обработки данных через несколько фильтров, чтобы избавиться от артефактов, а затем использовал библиотеку извлечения признаков NeuroKit 2.0 для извлечения признаков, а затем заполнил недостающие данные с помощью алгоритмов прогнозирования. И, наконец, поместите все это в словарь, содержащий 25 пунктов на каждого пациента.
25 элементов следующие: временные метки пиков P,Q,R,S,T (в мс), начало зубцов P,R,T, смещение зубцов P,R,T, продолжительность сегментов PR и ST. , интервалы ST, QT, RR и QRS, а также амплитуды пиков P, Q, R, S и T, за этим следует частота сердечных сокращений и, наконец, диагноз.
Все эти данные затем преобразуются в фрейм данных, который в конечном итоге преобразуется в файл CSV, где столбцы представляют собой функции, а количество строк варьируется в зависимости от человека, поскольку количество пиков на человека зависит от состояния его сердца. Таким образом, у каждого пациента есть свой CSV-файл
Проблема в том, что когда я пытаюсь передать эти данные в свою модель обучения, я постоянно получаю эту ошибку:
ValueError: количество данных неоднозначно: Размеры x: 12, 10, 10, 10, 9, 9, 8, 9, 11, 9, 12, 9, 9, 18, 9, 9, 9, 9, 9, 23, 12, 10, 13, 11. , 9, 9, 13, 9, 12, 10, 15, 17 размеры: 12, 10, 10, 10, 9, 9, 8, 9, 11, 9, 12, 9, 9, 18, 9, 9, 9, 9, 9, 23, 12, 10, 13, 11. , 9, 9, 13, 9, 12, 10, 15, 17 Убедитесь, что все массивы содержат одинаковое количество образцов. И я думаю, мне следует дополнить данные, но я чувствую, что это изменит мои результаты, поскольку количество пиков необходимо для определения диагноза.
Набор дат рассчитан на 12 отведений, но для простоты пока я выбрал только одно отведение и пациентов, у которых есть один диагноз.
Я подумал, что, возможно, я мог бы создать один CSV-файл, в котором каждая строка будет относиться к одному пациенту. и каждый столбец представляет собой функцию, и каждая ячейка содержит список заданных значений. нравится
Пациент P-пики Кью-Пики И т. д. 1 [554, 1580, 2588, 3636, 4704, 5746, 6804, 7862, 8904] [692, 1674, 2720, 3768, 4794, 5878, 6936, 7954, 8994] ... 2 ... ... ...
Но я получаю ошибки при вводе списков в качестве обучающих данных. Так что я не знаю, что делать
Поэтому мне нужно обучить модель, чтобы она могла считывать данные сигнала ЭКГ и извлеченные функции, а также иметь возможность прогнозировать состояние сердца пациента, а также предсказывать, будет ли у человека такое заболевание в будущем. База данных представляет собой крупномасштабную базу данных электрокардиограмм в 12 отведениях для исследования аритмии на Physionet. Я начал с обработки данных через несколько фильтров, чтобы избавиться от артефактов, а затем использовал библиотеку извлечения признаков NeuroKit 2.0 для извлечения признаков, а затем заполнил недостающие данные с помощью алгоритмов прогнозирования. И, наконец, поместите все это в словарь, содержащий 25 пунктов на каждого пациента.
25 элементов следующие: временные метки пиков P,Q,R,S,T (в мс), начало зубцов P,R,T, смещение зубцов P,R,T, продолжительность сегментов PR и ST. , интервалы ST, QT, RR и QRS, а также амплитуды пиков P, Q, R, S и T, за этим следует частота сердечных сокращений и, наконец, диагноз.
Все эти данные затем преобразуются в фрейм данных, который в конечном итоге преобразуется в файл CSV, где столбцы представляют собой функции, а количество строк варьируется в зависимости от человека, поскольку количество пиков на человека зависит от состояния его сердца. Таким образом, у каждого пациента есть свой CSV-файл
Проблема в том, что когда я пытаюсь передать эти данные в свою модель обучения, я постоянно получаю эту ошибку:
ValueError: количество данных неоднозначно: Размеры x: 12, 10, 10, 10, 9, 9, 8, 9, 11, 9, 12, 9, 9, 18, 9, 9, 9, 9, 9, 23, 12, 10, 13, 11. , 9, 9, 13, 9, 12, 10, 15, 17 размеры: 12, 10, 10, 10, 9, 9, 8, 9, 11, 9, 12, 9, 9, 18, 9, 9, 9, 9, 9, 23, 12, 10, 13, 11. , 9, 9, 13, 9, 12, 10, 15, 17 Убедитесь, что все массивы содержат одинаковое количество образцов. И я думаю, мне следует дополнить данные, но я чувствую, что это изменит мои результаты, поскольку количество пиков необходимо для определения диагноза.
Набор дат рассчитан на 12 отведений, но для простоты пока я выбрал только одно отведение и пациентов, у которых есть один диагноз.
Я подумал, что, возможно, я мог бы создать один CSV-файл, в котором каждая строка будет относиться к одному пациенту. и каждый столбец представляет собой функцию, и каждая ячейка содержит список заданных значений. нравится
Пациент P-пики Кью-Пики И т. д. 1 [554, 1580, 2588, 3636, 4704, 5746, 6804, 7862, 8904] [692, 1674, 2720, 3768, 4794, 5878, 6936, 7954, 8994] ... 2 ... ... ...
Но я получаю ошибки при вводе списков в качестве обучающих данных. Так что я не знаю, что делать
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Интерполировать сердечные сокращения по ЭКГ на основе временных меток r-пик
Anonymous » » в форуме Python - 0 Ответы
- 16 Просмотры
-
Последнее сообщение Anonymous
-
-
-
Detectron2 - Извлечение особенностей области на пороге обнаружения объекта.
Anonymous » » в форуме Python - 0 Ответы
- 7 Просмотры
-
Последнее сообщение Anonymous
-