Генерация перекрывающихся пробелов-кмеров из строк ⇐ Python
-
Anonymous
Генерация перекрывающихся пробелов-кмеров из строк
У меня есть строка типа HDHDJDUEUEUD, из которой я хотел бы составить все кмеры с пробелами с заданными k и m (числом максимального разрыва между ними).
Например, для k=3 и m =2 у нас есть две подпоследовательности длиной три, разделенные пробелом (может быть представлен как период) длиной 0, 1 или 2, например:
HDHDJD, HDH.JDU, HDH..DUE, DHDJDU и т. д.
Как это можно сделать эффективно? У меня есть список из более чем 1 миллиона последовательностей, над которыми нужно выполнить эту операцию.
У меня есть строка типа HDHDJDUEUEUD, из которой я хотел бы составить все кмеры с пробелами с заданными k и m (числом максимального разрыва между ними).
Например, для k=3 и m =2 у нас есть две подпоследовательности длиной три, разделенные пробелом (может быть представлен как период) длиной 0, 1 или 2, например:
HDHDJD, HDH.JDU, HDH..DUE, DHDJDU и т. д.
Как это можно сделать эффективно? У меня есть список из более чем 1 миллиона последовательностей, над которыми нужно выполнить эту операцию.
Мобильная версия