Сортировка, слияние и дедуплирование больших файлов TXT на HPC? - Цифровое Кемерово

Сортировка, слияние и дедуплирование больших файлов TXT на HPC? ⇐ Linux

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Сортировка, слияние и дедуплирование больших файлов TXT на HPC?

Цитата

Сообщение Anonymous » 11 фев 2025, 02:32

Я ищу несколько советов
Я в настоящее время создаю базу данных KMER и хочу слияние/сортировку и взять строки Uniq от 47 sample.txt.gz, которые составляют 16 ГБ каждый, что был бы самым быстрым способом сделать это. < /p>
Я сейчас запускаю это: < /p>
zcat *.merged.kmers.txt.gz | sort --parallel=48 --buffer-size= 1400G | uniq | gzip > all_unique_kmers.txt.gz
< /code>
Я запускал его в смятении, но я хотел знать, какие параметры и что бы сделали кто -то другой, это работало 4 дня !!!! < /p>
< P> 47 образцов, 16 ГБ сжата, 80 ГБ несжатую,
слияние, сортировка, дедупликация
Пожалуйста, помогите мне ...

Подробнее здесь: https://stackoverflow.com/questions/794 ... les-on-hpc

1739230360

Anonymous

 Я ищу несколько советов 
Я в настоящее время создаю базу данных KMER и хочу слияние/сортировку и взять строки Uniq от 47 sample.txt.gz, которые составляют 16 ГБ каждый, что был бы самым быстрым способом сделать это. < /p>
Я сейчас запускаю это: < /p>
zcat *.merged.kmers.txt.gz | sort --parallel=48 --buffer-size= 1400G | uniq | gzip > all_unique_kmers.txt.gz
< /code>
Я запускал его в смятении, но я хотел знать, какие параметры и что бы сделали кто -то другой, это работало 4 дня !!!! < /p>
< P> 47 образцов, 16 ГБ сжата, 80 ГБ несжатую, 
слияние, сортировка, дедупликация 
Пожалуйста, помогите мне ...  

Подробнее здесь: [url]https://stackoverflow.com/questions/79428544/sorting-merging-and-deduplicating-large-txt-files-on-hpc[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Linux»