Перебирайте строки, чтобы получить повторяющиеся наборы данных в большом файле .csv и отобразить результаты.

Перебирайте строки, чтобы получить повторяющиеся наборы данных в большом файле .csv и отобразить результаты. ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Перебирайте строки, чтобы получить повторяющиеся наборы данных в большом файле .csv и отобразить результаты.

Цитата

Сообщение Anonymous » 23 сен 2024, 13:00

Я только начал изучать Python, но для моего текущего задания мне нужно проанализировать и визуализировать массу данных. Эти данные хранятся в файлах .csv, которые впоследствии объединяются друг в друга. Это приводит к тому, что подмножества данных повторяются по постоянному значению 'n'.
Теперь, как мне манипулировать этим, чтобы, например, у меня был простой файл .csv длиной 200 строк с 2 интересующие столбцы, а новое «подмножество» данных начинается после каждых 40 строк.
Как мне построить это с помощью цикла for, поскольку я не смог найти ничего относительно этот. Значение x будет одинаковым для всех подмножеств, но значения y будут разными, так что смогу ли я перебрать i для набора размера n = 40 и не придется вручную определять
этот набор 1 = 1-40, set 2 = 41-80 и т. д.
РЕДАКТИРОВАТЬ
Мне удалось заставить это работать, однако данные не отображаются на графике, поскольку они отображаются как «numpy.ndarray».
import pandas as pd
import glob
import os
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns

x = df['kxd'].dropna().to_numpy()
y1 = df['S3'].dropna().to_numpy()
y2 = df['S7'].dropna().to_numpy()

length = 41
n = 5

#Additional colors
colors = plt.cm.jet(np.linspace(0,1,n))
colors1=sns.color_palette("rocket",n) #personal fav
colors2=sns.color_palette("crest",n) #also nice

for i in range(n):
start = 1+length*i
end = 41+length*i
index = [range(start,end,1)]
xi = x[index]
y2i = y2[index]
fig = plt.figure(1, figsize=(6, 6))
plt.plot(xi, y2i, color=colors)

Подробнее здесь: https://stackoverflow.com/questions/790 ... n-order-to

1727085614

Anonymous

Я только начал изучать Python, но для моего текущего задания мне нужно проанализировать и визуализировать массу данных. Эти данные хранятся в файлах .csv, которые впоследствии объединяются друг в друга. Это приводит к тому, что подмножества данных повторяются по постоянному значению 'n'.
Теперь, как мне манипулировать этим, чтобы, например, у меня был простой файл .csv длиной 200 строк с 2 интересующие столбцы, а новое «подмножество» данных начинается после каждых 40 строк.
Как мне построить это с помощью цикла for, поскольку я не смог найти ничего относительно этот. Значение x будет одинаковым для всех подмножеств, но значения y будут разными, так что смогу ли я перебрать i для набора размера n = 40 и не придется вручную определять
этот набор 1 = 1-40, set 2 = 41-80 и т. д.
РЕДАКТИРОВАТЬ
Мне удалось заставить это работать, однако данные не отображаются на графике, поскольку они отображаются как «numpy.ndarray».
import pandas as pd
import glob
import os
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns

x = df['kxd'].dropna().to_numpy()
y1 = df['S3'].dropna().to_numpy()
y2 = df['S7'].dropna().to_numpy()

length = 41
n = 5

#Additional colors
colors = plt.cm.jet(np.linspace(0,1,n))
colors1=sns.color_palette("rocket",n) #personal fav
colors2=sns.color_palette("crest",n) #also nice

for i in range(n):
start = 1+length*i
end = 41+length*i
index = [range(start,end,1)]
xi = x[index]
y2i = y2[index]
fig = plt.figure(1, figsize=(6, 6))
plt.plot(xi, y2i, color=colors[i])
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79013979/iterate-over-rows-to-get-repeating-datasets-within-a-large-csv-file-in-order-to[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как изолировать проблемный текст в большом файле CSV с Python

Последнее сообщение Anonymous « 13 фев 2025, 19:04
Добавлено в форуме Python

Anonymous » 13 фев 2025, 19:04 » в форуме Python

Я довольно новичок с Python и анализом текста в целом ... работаю над проектом для класса. Я читаю в куче бесплатного текста из файлов .csv, которые поступили из Excel. Есть более 200 000 строк. df .fillna('').apply(str)
df .str.replace(r , ,...

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
13 фев 2025, 19:04
Читать и изменить только имена столбцов в очень большом файле CSV или Parquet, хранящихся в S3

Последнее сообщение Anonymous « 17 июл 2025, 21:07
Добавлено в форуме Python

Anonymous » 17 июл 2025, 21:07 » в форуме Python

У меня очень большой файл CSV или Parquet, хранящийся в AWS S3, я хочу переименовать несколько столбцов, однако я не хочу читать весь файл, потому что он очень большой (несколько туберкулеза), поэтому мне нужно будет загружать весь файл, а затем...

0 Ответы

50 Просмотры

Последнее сообщение Anonymous
17 июл 2025, 21:07
Как наборы и наборы сравнений работают в Python?

Последнее сообщение Anonymous « 29 июл 2025, 00:21
Добавлено в форуме Python

Anonymous » 29 июл 2025, 00:21 » в форуме Python

Я изучаю Python, исходящий из некоторого опыта на уровне начинающих с Java. Все это имеет смысл по большей части, но одно из упражнений заставило меня задуматься, что на самом деле происходит в Python.
import string

def ispangram(str1,...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
29 июл 2025, 00:21
Как наборы и наборы сравнений работают в Python? [дублировать]

Последнее сообщение Anonymous « 29 июл 2025, 01:34
Добавлено в форуме Python

Anonymous » 29 июл 2025, 01:34 » в форуме Python

Я изучаю Python, исходящий из некоторого опыта на уровне начинающих с Java. Все это имеет смысл по большей части, но одно из упражнений заставило меня задуматься, что на самом деле происходит в Python.
import string

def ispangram(str1,...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
29 июл 2025, 01:34
Перебирайте содержимое потока в методе, пока не будет найден непустой список. Весенний WebFLux

Последнее сообщение Anonymous « 14 май 2024, 21:18
Добавлено в форуме JAVA

Anonymous » 14 май 2024, 21:18 » в форуме JAVA

У меня возникли трудности с поднятием этой проблемы, поскольку я не нашел варианта использования, похожего на мой, я только начинаю использовать WebFLux.
У меня есть метод getIdEntrevista, который возвращает Flux со списком из 'id'.
Метод:
public...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
14 май 2024, 21:18

Вернуться в «Python»