Я только начал изучать Python, но для моего текущего задания мне нужно проанализировать и визуализировать массу данных. Эти данные хранятся в файлах .csv, которые впоследствии объединяются друг в друга. Это приводит к тому, что подмножества данных повторяются по постоянному значению 'n'.
Теперь, как мне манипулировать этим, чтобы, например, у меня был простой файл .csv длиной 200 строк с 2 интересующие столбцы, а новое «подмножество» данных начинается после каждых 40 строк.
Как мне построить это с помощью цикла for, поскольку я не смог найти ничего относительно этот. Значение x будет одинаковым для всех подмножеств, но значения y будут разными, так что смогу ли я перебрать i для набора размера n = 40 и не придется вручную определять
этот набор 1 = 1-40, set 2 = 41-80 и т. д.
РЕДАКТИРОВАТЬ
Мне удалось заставить это работать, однако данные не отображаются на графике, поскольку они отображаются как «numpy.ndarray».
import pandas as pd
import glob
import os
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
x = df['kxd'].dropna().to_numpy()
y1 = df['S3'].dropna().to_numpy()
y2 = df['S7'].dropna().to_numpy()
length = 41
n = 5
#Additional colors
colors = plt.cm.jet(np.linspace(0,1,n))
colors1=sns.color_palette("rocket",n) #personal fav
colors2=sns.color_palette("crest",n) #also nice
for i in range(n):
start = 1+length*i
end = 41+length*i
index = [range(start,end,1)]
xi = x[index]
y2i = y2[index]
fig = plt.figure(1, figsize=(6, 6))
plt.plot(xi, y2i, color=colors)
Подробнее здесь: https://stackoverflow.com/questions/790 ... n-order-to
Перебирайте строки, чтобы получить повторяющиеся наборы данных в большом файле .csv и отобразить результаты. ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение