Как получить среднее значение, если это значение встречается в данных как минимум трижды? (Питон)

Как получить среднее значение, если это значение встречается в данных как минимум трижды? (Питон) ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как получить среднее значение, если это значение встречается в данных как минимум трижды? (Питон)

Цитата

Сообщение Anonymous » 23 окт 2024, 15:12

У меня есть фрейм данных, в котором на основе появления значения в столбце «hit_num» мне нужно получить среднее значение столбца «баллы». Ниже приведен пример случайных данных, которые я создал для этого вопроса:

Код: Выделить всё

# set random seed for reproducibility
np.random.seed(42)

# crate random pandas dataframe
df = pd.DataFrame({'hit_num': np.random.randint(1,5,20),
'score': np.random.randint(1, 500, 20),
})
df.sort_values(by='hit_num')

Таким образом, если значение встречается как минимум три раза в столбце hit_num. Мне нужно создать новый фрейм данных со значением hit_num и средним значением оценок.
Пример данных, которые я сгенерировал для создания идеи
Таким образом, hit_num 1 следует пропустить, hit_num 2 должен получить среднее значение 4 балла и hit_num 3 должны получить среднее значение 7 баллов.
Я пытался работать с np.mean() или со средним значением pandas, но понял, что это просто даст среднее значение всей колонны. Затем я искал конкретный столбец/строку. Здесь, в stackoverflow, я нашел кое-что, что показало, как получить среднее значение определенных комбинаций столбца и строки:

Код: Выделить всё

df[['b', 'c']].iloc[[2,4]].mean(axis=0)

но это было для заранее заданной комбинации строк и столбцов, и мне нужно, чтобы она работала случайным образом.
Поэтому я подумал, что мне нужно что-то вроде цикла, чтобы сначала указать hit_num > 3, а затем the middle()?
Однако я здесь застрял (до сих пор не уверен, стоит ли вообще делать это вот так):

Код: Выделить всё

for hits in df:
if df['hit_num'].value_counts() < 3:
continue
elif df['hit_num'].value_counts() => 3:
df.mean()

Но я не могу понять, как сказать: взять среднее значение столбцов «оценка», а, например, только тех, у которых hit_num 2.

Подробнее здесь: https://stackoverflow.com/questions/791 ... -in-the-da

1729685573

Anonymous

У меня есть фрейм данных, в котором на основе появления значения в столбце «hit_num» мне нужно получить среднее значение столбца «баллы». Ниже приведен пример случайных данных, которые я создал для этого вопроса:
[code]# set random seed for reproducibility
np.random.seed(42)

# crate random pandas dataframe
df = pd.DataFrame({'hit_num': np.random.randint(1,5,20),
'score': np.random.randint(1, 500, 20),
})
df.sort_values(by='hit_num')
[/code]
Таким образом, если значение встречается как минимум три раза в столбце hit_num. Мне нужно создать новый фрейм данных со значением hit_num и средним значением оценок.
Пример данных, которые я сгенерировал для создания идеи
Таким образом, hit_num 1 следует пропустить, hit_num 2 должен получить среднее значение 4 балла и hit_num 3 должны получить среднее значение 7 баллов.
Я пытался работать с np.mean() или со средним значением pandas, но понял, что это просто даст среднее значение всей колонны. Затем я искал конкретный столбец/строку. Здесь, в stackoverflow, я нашел кое-что, что показало, как получить среднее значение определенных комбинаций столбца и строки:
[code]df[['b', 'c']].iloc[[2,4]].mean(axis=0)
[/code]
но это было для заранее заданной комбинации строк и столбцов, и мне нужно, чтобы она работала случайным образом.
Поэтому я подумал, что мне нужно что-то вроде цикла, чтобы сначала указать hit_num > 3, а затем the middle()?
Однако я здесь застрял (до сих пор не уверен, стоит ли вообще делать это вот так):
[code]for hits in df:
if df['hit_num'].value_counts() < 3:
continue
elif df['hit_num'].value_counts() => 3:
df.mean()
[/code]
Но я не могу понять, как сказать: взять среднее значение столбцов «оценка», а, например, только тех, у которых hit_num 2. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79117812/how-to-obtain-the-mean-value-when-the-value-occurs-at-least-triplicate-in-the-da[/url]