У меня есть 1000x1000 Jensen-Shannon (JS) Матрица , представляющая парные расстояния между 1000 генов . Я хочу объединить эти гены , используя иерархическую кластеризацию со средней связью . Тем не менее, я сталкиваюсь с проблемой, в которой некоторые кластеры содержат очень мало генов (что в порядке), но эти гены оказываются очень маленькими генами с очень небольшим количеством пар оснований (всего). < /P>
Я хочу обеспечить соблюдение ограничения : каждый кластер должен иметь как минимум 50 000 бабочек, объединенных в своих генах. У меня есть отдельный фрейм данных, который содержит: < /p>
import pandas as pd
gene_df = pd.DataFrame({
'gene_name': gene_names, # List of gene names
'num_bp': bp_counts # Number of bp per gene
})
< /code>
Вопросы: < /strong> < /h3>
Есть ли лучший способ обеспечить соблюдение этого ограничения Во время кластеризации, а не после обработки? кластеризация ?>
Подробнее здесь: https://stackoverflow.com/questions/794 ... -clusterin
Ограниченная кластеризация: обеспечение соблюдения минимального размера кластера в иерархической кластеризации ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Обеспечение соблюдения ограничения сравнения в универсальных параметрах Enum
Anonymous » » в форуме C# - 0 Ответы
- 15 Просмотры
-
Последнее сообщение Anonymous
-