Почему я могу прочитать файл (gVCF) с помощью панд, но не с помощью поляров?Python

Программы на Python
Anonymous
 Почему я могу прочитать файл (gVCF) с помощью панд, но не с помощью поляров?

Сообщение Anonymous »

У меня есть CSV (или, скорее, TSV), который я получил в результате удаления заголовка из gVCF с помощью

Код: Выделить всё

bcftools view foo.g.vcf -H > foo.g.vcf.csv
Голова дает мне это, так что пока все выглядит так, как ожидалось

Код: Выделить всё

chr1H   1       .       T            0       .       END=1000        GT:GQ:MIN_DP:PL 0/0:1:0:0,0,0
chr1H   1001    .       T            0       .       END=1707        GT:GQ:MIN_DP:PL 0/0:1:0:0,0,0
chr1H   1708    .       C            0       .       END=1763        GT:GQ:MIN_DP:PL 0/0:6:2:0,6,59
chr1H   1764    .       T            0       .       END=2000        GT:GQ:MIN_DP:PL 0/0:1:0:0,0,0
chr1H   2001    .       A            0       .       END=3000        GT:GQ:MIN_DP:PL 0/0:1:0:0,0,0
chr1H   3001    .       G            0       .       END=4000        GT:GQ:MIN_DP:PL 0/0:1:0:0,0,0
chr1H   4001    .       T            0       .       END=5000        GT:GQ:MIN_DP:PL 0/0:1:0:0,0,0
chr1H   5001    .       T            0       .       END=6000        GT:GQ:MIN_DP:PL 0/0:1:0:0,0,0
chr1H   6001    .       A            0       .       END=7000        GT:GQ:MIN_DP:PL 0/0:1:0:0,0,0
chr1H   7001    .       G            0       .       END=8000        GT:GQ:MIN_DP:PL 0/0:1:0:0,0,0
Когда я знаю, попробуйте прочитать файл как фрейм данных в блокноте Jupyter, вот так

Код: Выделить всё

import polars as pl

df = pl.read_csv("foo.g.vcf.csv", has_header=False,
new_columns=["CHROM", "POS", "ID", "REF", "ALT", "QUAL", "FILTER", "INFO", "FORMAT", "SAMPLE"],
separator="\t")
Я получаю ошибку вычислений «Исходная ошибка: оставшиеся байты не пусты». Однако когда я это делаю,

Код: Выделить всё

import pandas as pd
import polars as pl

df = pd.read_csv("foo.g.vcf.csv", header=None, sep="\t",
names=["CHROM", "POS", "ID", "REF", "ALT", "QUAL", "FILTER", "INFO", "FORMAT", "SAMPLE"])
df = pl.DataFrame(df)
все работает так, как задумано.
Почему я могу без проблем читать с помощью pandas и конвертировать в поляры, но не могу читать с помощью поляров напрямую?
Другой VCF, с которым я хочу сравнить, который я удалил таким же образом, работает с полярами.>

Подробнее здесь: https://stackoverflow.com/questions/795 ... ith-polars

Вернуться в «Python»