Ограниченная кластеризация: обеспечение соблюдения минимального размера кластера в иерархической кластеризации

Ограниченная кластеризация: обеспечение соблюдения минимального размера кластера в иерархической кластеризации ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Ограниченная кластеризация: обеспечение соблюдения минимального размера кластера в иерархической кластеризации

Цитата

Сообщение Anonymous » 19 фев 2025, 10:12

У меня есть 1000x1000 Jensen-Shannon (JS) Матрица , представляющая парные расстояния между 1000 генов . Я хочу объединить эти гены , используя иерархическую кластеризацию со средней связью . Тем не менее, я сталкиваюсь с проблемой, в которой некоторые кластеры содержат очень мало генов (что в порядке), но эти гены оказываются очень маленькими генами с очень небольшим количеством пар оснований (всего). < /P>
Я хочу обеспечить соблюдение ограничения : каждый кластер должен иметь как минимум 50 000 бабочек, объединенных в своих генах. У меня есть отдельный фрейм данных, который содержит: < /p>
import pandas as pd

gene_df = pd.DataFrame({
'gene_name': gene_names, # List of gene names
'num_bp': bp_counts # Number of bp per gene
})
< /code>
Вопросы: < /strong> < /h3>

Есть ли лучший способ обеспечить соблюдение этого ограничения Во время кластеризации, а не после обработки? кластеризация ?>

Подробнее здесь: https://stackoverflow.com/questions/794 ... -clusterin

1739949159

Anonymous

 У меня есть [b] 1000x1000 Jensen-Shannon (JS) Матрица [/b], представляющая парные расстояния между [b] 1000 генов [/b]. Я хочу [b] объединить эти гены [/b], используя [b] иерархическую кластеризацию со средней связью [/b]. Тем не менее, я сталкиваюсь с проблемой, в которой некоторые кластеры содержат очень мало генов (что в порядке), но эти гены оказываются очень маленькими генами с очень небольшим количеством пар оснований (всего). < /P>
Я хочу [b] обеспечить соблюдение ограничения [/b]: каждый кластер должен иметь как минимум [b] 50 000 бабочек, объединенных [/b] в своих генах. У меня есть отдельный фрейм данных, который содержит: < /p>
import pandas as pd

gene_df = pd.DataFrame({
'gene_name': gene_names,  # List of gene names
'num_bp': bp_counts  # Number of bp per gene
})
< /code>
 [b] Вопросы: < /strong> < /h3>

 Есть ли лучший способ обеспечить соблюдение этого ограничения  Во время [/b] кластеризации, а не после обработки? кластеризация ?> 

Подробнее здесь: [url]https://stackoverflow.com/questions/79450475/constrained-clustering-enforcing-minimum-cluster-size-in-hierarchical-clusterin[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Используйте очередь приоритетов для выполнения иерархической кластеризации без импорта кучиq

Последнее сообщение Anonymous « 30 ноя 2024, 18:15
Добавлено в форуме Python

Anonymous » 30 ноя 2024, 18:15 » в форуме Python

Я использую очередь приоритетов для иерархической кластеризации (не могу импортировать heapq) и хочу использовать метод полной ссылки, но я не знаю, в чем проблема моего кода, причина далеко не в чем Я ожидал... кстати, данные, которые я использую...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
30 ноя 2024, 18:15
Дендрограмма иерархической кластеризации с использованием Python

Последнее сообщение Anonymous « 12 дек 2024, 22:53
Добавлено в форуме Python

Anonymous » 12 дек 2024, 22:53 » в форуме Python

Теория графов и интеллектуальный анализ данных — две области информатики, в которых я пока новичок, поэтому извините за мои базовые знания.

Меня попросили построить дендрограмму иерархически кластеризованного графа.
Вводные данные, которые мне были...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
12 дек 2024, 22:53
Используя K-Means для кластеризации документов, должна ли кластеризация осуществляться по косинусному сходству или по ве

Последнее сообщение Anonymous « 05 ноя 2024, 23:15
Добавлено в форуме Php

Anonymous » 05 ноя 2024, 23:15 » в форуме Php

Извиняюсь, если ответ на этот вопрос очевиден, пожалуйста, будьте добры, я здесь впервые :-)
Я был бы благодарен, если бы кто-нибудь подсказал мне, как это сделать. соответствующая структура входных данных для k-средних. Я работаю над магистерской...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
05 ноя 2024, 23:15
Обеспечение соблюдения меток меток matplotlib не шире осей

Последнее сообщение Anonymous « 15 ноя 2024, 17:51
Добавлено в форуме Python

Anonymous » 15 ноя 2024, 17:51 » в форуме Python

Мне нужно построить очень компактный график с общей осью Y, используя matplotlib. Чтобы было компактно и аккуратно, у меня не будет wspace. С моими данными это выглядит хорошо.
Но метки x перекрываются, что делает их нечитаемыми.
Есть ли способ...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
15 ноя 2024, 17:51
Обеспечение соблюдения ограничения сравнения в универсальных параметрах Enum

Последнее сообщение Anonymous « 26 ноя 2024, 01:16
Добавлено в форуме C#

Anonymous » 26 ноя 2024, 01:16 » в форуме C#

Я попытался использовать ограничения сравнения для общих параметров Enum следующим образом:
public abstract class StateMachine {...}

public abstract class StateMachine:
StateMachine
where TState: struct, Enum
where TCommand: struct, Enum
{
public...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
26 ноя 2024, 01:16

Вернуться в «Python»