Ограниченная кластеризация: обеспечение соблюдения минимального размера кластера в иерархической кластеризацииPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Ограниченная кластеризация: обеспечение соблюдения минимального размера кластера в иерархической кластеризации

Сообщение Anonymous »

У меня есть 1000x1000 Jensen-Shannon (JS) Матрица , представляющая парные расстояния между 1000 генов . Я хочу объединить эти гены , используя иерархическую кластеризацию со средней связью . Тем не менее, я сталкиваюсь с проблемой, в которой некоторые кластеры содержат очень мало генов (что в порядке), но эти гены оказываются очень маленькими генами с очень небольшим количеством пар оснований (всего). < /P>
Я хочу обеспечить соблюдение ограничения : каждый кластер должен иметь как минимум 50 000 бабочек, объединенных в своих генах. У меня есть отдельный фрейм данных, который содержит: < /p>
import pandas as pd

gene_df = pd.DataFrame({
'gene_name': gene_names, # List of gene names
'num_bp': bp_counts # Number of bp per gene
})
< /code>
Вопросы: < /strong> < /h3>

Есть ли лучший способ обеспечить соблюдение этого ограничения Во время
кластеризации, а не после обработки? кластеризация ?>

Подробнее здесь: https://stackoverflow.com/questions/794 ... -clusterin
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»