Внедрение рейтинга F1, IOU и Dice Score

Внедрение рейтинга F1, IOU и Dice Score ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Цитата

Сообщение Anonymous » 16 янв 2025, 06:18

В этой статье предлагается гибридная модель сегментации медицинских изображений CNN — трансформер для одновременной сегментации органов и поражений на медицинских изображениях. Их модель имеет две выходные ветви: одну для вывода маски органа, а другую для вывода маски поражения. Теперь они описывают процесс тестирования следующим образом:

Чтобы сравнить эффективность нашего подхода с современными
подходами использовались следующие метрики оценки: показатель F1 (F1-S), показатель Dice (DS), показатель пересечения через объединение (IoU) и
HD95, которые определяются следующим образом:

где TP — истинно положительные значения, T N — истинно отрицательные значения, F P — это ложные
положительные результаты, а FN — это ложные отрицательные результаты, все они связаны с классами
сегментации тестовых изображений. Оценка Dice — это макро
метрика, которая рассчитывается для N тестовых изображений следующим образом:
[img]https:// i.sstatic.net/AJvkURd8.png[/img]
где TPi, FPi и FNi — истинные положительные значения, истинные отрицательные значения и ложные значения. Положительные и ложные
Отрицательные значения для i-го изображения соответственно.

Я не понимаю, как реализовать эти метрики (исключая HD95), как показано здесь. Насколько я понимаю, чтобы вычислить TP, FP и FN для f1-показателя и IoU, мне нужно агрегировать эти три величины (TP, FP и FN) по всем выборкам в тестовом наборе для два выхода (поражение и орган), а агрегация представляет собой операцию суммы. Например, чтобы вычислить TP, мне нужно вычислить его для каждого результата каждого образца и просуммировать этот TP. Затем повторите это для расчета TP для каждого образца аналогичным образом, а затем сложите все эти TP, чтобы получить общий TP. Затем я делаю то же самое для FP и FN и подставляю их в формулы. Я не уверен, правильно ли я понимаю или нет. Для оценки Dice мне нужно рассчитать ее для каждого результата отдельно, а затем усреднить их? Я не уверен в этом, поэтому я обратился к GitHub для этой статьи. Здесь определяется модель, а также кодирование процедуры тестирования. Используемый фреймворк — PyTorch. У меня нет никаких знаний о PyTorch, поэтому я до сих пор не могу понять, как были реализованы эти метрики, и, следовательно, я не могу подтвердить, правильно ли мое понимание или нет, и мне нужно как можно скорее воспроизвести эту процедуру тестирования. Поэтому, пожалуйста, кто-нибудь может объяснить логику, используемую для реализации этих показателей. Заранее спасибо.

Подробнее здесь: https://stackoverflow.com/questions/793 ... dice-score

1736997513

Anonymous

В этой статье предлагается гибридная модель сегментации медицинских изображений CNN — трансформер для одновременной сегментации органов и поражений на медицинских изображениях. Их модель имеет две выходные ветви: одну для вывода маски органа, а другую для вывода маски поражения. Теперь они описывают процесс тестирования следующим образом:

Чтобы сравнить эффективность нашего подхода с современными
подходами использовались следующие метрики оценки: показатель F1 (F1-S), показатель Dice (DS), показатель пересечения через объединение (IoU) и
HD95, которые определяются следующим образом:
[img]https://i.sstatic.net/lnUW339F.png[/img]



[img]https://i.sstatic.net/53lIhglH.png[/img]

где TP — истинно положительные значения, T N — истинно отрицательные значения, F P — это ложные
положительные результаты, а FN — это ложные отрицательные результаты, все они связаны с классами
сегментации тестовых изображений. Оценка Dice — это макро
метрика, которая рассчитывается для N тестовых изображений следующим образом:
[img]https:// i.sstatic.net/AJvkURd8.png[/img]
где TPi, FPi и FNi — истинные положительные значения, истинные отрицательные значения и ложные значения. Положительные и ложные
Отрицательные значения для i-го изображения соответственно.

Я не понимаю, как реализовать эти метрики (исключая HD95), как показано здесь. Насколько я понимаю, чтобы вычислить TP, FP и FN для f1-показателя и IoU, мне нужно агрегировать эти три величины (TP, FP и FN) по всем выборкам в тестовом наборе для два выхода (поражение и орган), а агрегация представляет собой операцию суммы. Например, чтобы вычислить TP, мне нужно вычислить его для каждого результата каждого образца и просуммировать этот TP. Затем повторите это для расчета TP для каждого образца аналогичным образом, а затем сложите все эти TP, чтобы получить общий TP. Затем я делаю то же самое для FP и FN и подставляю их в формулы. Я не уверен, правильно ли я понимаю или нет. Для оценки Dice мне нужно рассчитать ее для каждого результата отдельно, а затем усреднить их? Я не уверен в этом, поэтому я обратился к GitHub для этой статьи. Здесь определяется модель, а также кодирование процедуры тестирования. Используемый фреймворк — PyTorch. У меня нет никаких знаний о PyTorch, поэтому я до сих пор не могу понять, как были реализованы эти метрики, и, следовательно, я не могу подтвердить, правильно ли мое понимание или нет, и мне нужно как можно скорее воспроизвести эту процедуру тестирования. Поэтому, пожалуйста, кто-нибудь может объяснить логику, используемую для реализации этих показателей.  Заранее спасибо. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79359767/implementation-of-f1-score-iou-and-dice-score[/url]