Внедрение рейтинга F1, IOU и Dice ScorePython

Программы на Python
Ответить
Anonymous
 Внедрение рейтинга F1, IOU и Dice Score

Сообщение Anonymous »

В этой статье предлагается гибридная модель сегментации медицинских изображений CNN — трансформер для одновременной сегментации органов и поражений на медицинских изображениях. Их модель имеет две выходные ветви: одну для вывода маски органа, а другую для вывода маски поражения. Теперь они описывают процесс тестирования следующим образом:

Чтобы сравнить эффективность нашего подхода с современными
подходами использовались следующие метрики оценки: показатель F1 (F1-S), показатель Dice (DS), показатель пересечения через объединение (IoU) и
HD95, которые определяются следующим образом:
Изображение



Изображение

где TP — истинно положительные значения, T N — истинно отрицательные значения, F P — это ложные
положительные результаты, а FN — это ложные отрицательные результаты, все они связаны с классами
сегментации тестовых изображений. Оценка Dice — это макро
метрика, которая рассчитывается для N тестовых изображений следующим образом:
[img]https:// i.sstatic.net/AJvkURd8.png[/img]
где TPi, FPi и FNi — истинные положительные значения, истинные отрицательные значения и ложные значения. Положительные и ложные
Отрицательные значения для i-го изображения соответственно.

Я не понимаю, как реализовать эти метрики (исключая HD95), как показано здесь. Насколько я понимаю, чтобы вычислить TP, FP и FN для f1-показателя и IoU, мне нужно агрегировать эти три величины (TP, FP и FN) по всем выборкам в тестовом наборе для два выхода (поражение и орган), а агрегация представляет собой операцию суммы. Например, чтобы вычислить TP, мне нужно вычислить его для каждого результата каждого образца и просуммировать этот TP. Затем повторите это для расчета TP для каждого образца аналогичным образом, а затем сложите все эти TP, чтобы получить общий TP. Затем я делаю то же самое для FP и FN и подставляю их в формулы. Я не уверен, правильно ли я понимаю или нет. Для оценки Dice мне нужно рассчитать ее для каждого результата отдельно, а затем усреднить их? Я не уверен в этом, поэтому я обратился к GitHub для этой статьи. Здесь определяется модель, а также кодирование процедуры тестирования. Используемый фреймворк — PyTorch. У меня нет никаких знаний о PyTorch, поэтому я до сих пор не могу понять, как были реализованы эти метрики, и, следовательно, я не могу подтвердить, правильно ли мое понимание или нет, и мне нужно как можно скорее воспроизвести эту процедуру тестирования. Поэтому, пожалуйста, кто-нибудь может объяснить логику, используемую для реализации этих показателей. Заранее спасибо.

Подробнее здесь: https://stackoverflow.com/questions/793 ... dice-score
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»