Как запросить MultiIndex по MultiIndex и выбрать «лучшую» строку? - Цифровое Кемерово

Как запросить MultiIndex по MultiIndex и выбрать «лучшую» строку? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как запросить MultiIndex по MultiIndex и выбрать «лучшую» строку?

Цитата

Сообщение Anonymous » 02 авг 2024, 22:37

Скажем, у меня есть MultiIndex от MultiIndex DataFrame, аналогичный созданному здесь:
import pandas as pd

data_frame_rows = pd.MultiIndex.from_arrays([[], [], []], names=("car", "engine", "wheels"))
data_frame_columns = pd.MultiIndex.from_arrays([[], [], []], names=("group", "subgroup", "details"))
data_frame = pd.DataFrame(index=data_frame_rows, columns=data_frame_columns)

for car in ("mustang", "corvette", "civic"):
for engine in ("normal", "supercharged"):
for wheels in ("normal", "wide"):
data_frame.loc[(car, engine, wheels), ("cost", "", "money ($)")] = int(random() * 100)
data_frame.loc[(car, engine, wheels), ("cost", "", "maintenance (minutes)")] = int(random() * 60)

percent_win = random()
recommended = percent_win >= 0.8
data_frame.loc[(car, engine, wheels), ("race", "f1", "win %")] = percent_win
data_frame.loc[(car, engine, wheels), ("race", "f1", "recommended")] = recommended

percent_win = random()
recommended = percent_win >= 0.8
data_frame.loc[(car, engine, wheels), ("race", "indy", "win %")] = percent_win
data_frame.loc[(car, engine, wheels), ("race", "indy", "recommended")] = recommended

percent_win = random()
recommended = percent_win >= 0.8
data_frame.loc[(car, engine, wheels), ("race", "lemans", "win %")] = percent_win
data_frame.loc[(car, engine, wheels), ("race", "lemans", "recommended")] = recommended

Это будет выглядеть примерно так:
group cost race
subgroup f1 indy lemans
details money ($) maintenance (minutes) win % recommended win % recommended win % recommended
car engine wheels
mustang normal normal 3.0 33.0 0.664754 False 0.584689 False 0.629107 False
wide 39.0 30.0 0.143568 False 0.339405 False 0.531536 False
supercharged normal 65.0 59.0 0.270161 False 0.682142 False 0.953301 True
wide 92.0 12.0 0.403246 False 0.801241 True 0.991273 True
corvette normal normal 72.0 46.0 0.361436 False 0.981196 True 0.352499 False
wide 19.0 2.0 0.303950 False 0.578942 False 0.802201 True
supercharged normal 15.0 29.0 0.148742 False 0.305060 False 0.144883 False
wide 59.0 38.0 0.102707 False 0.364228 False 0.602490 False
civic normal normal 51.0 14.0 0.726772 False 0.930073 True 0.218876 False
wide 66.0 7.0 0.530214 False 0.051396 False 0.240695 False
supercharged normal 55.0 52.0 0.939180 True 0.614061 False 0.589519 False
wide 74.0 28.0 0.595012 False 0.240609 False 0.539910 False

Теперь я хочу найти все строки, в которых данная конфигурация автомобиля рекомендована хотя бы для 1 гонки. Если конкретный автомобиль рекомендуется использовать более чем в одной гонке, я хочу выбрать конфигурацию, которая имеет наибольший процент шансов на победу в любой гонке.
Я читал это несколько раз и хоть убей, я не могу этого понять.
Я пробовал что-то вроде:
data_frame[(data_frame.loc[:,idx["race",:,"recommended"]]==True)]

Но это, похоже, не фильтрует строки, а просто устанавливает значение NaN или True
group cost race
subgroup f1 indy lemans
details money ($) maintenance (minutes) win % recommended win % recommended win % recommended
car engine wheels
mustang normal normal NaN NaN NaN NaN NaN NaN NaN NaN
wide NaN NaN NaN NaN NaN NaN NaN NaN
supercharged normal NaN NaN NaN NaN NaN NaN NaN True
wide NaN NaN NaN NaN NaN True NaN True
corvette normal normal NaN NaN NaN NaN NaN True NaN NaN
wide NaN NaN NaN NaN NaN NaN NaN True
supercharged normal NaN NaN NaN NaN NaN NaN NaN NaN
wide NaN NaN NaN NaN NaN NaN NaN NaN
civic normal normal NaN NaN NaN NaN NaN True NaN NaN
wide NaN NaN NaN NaN NaN NaN NaN NaN
supercharged normal NaN NaN NaN True NaN NaN NaN NaN
wide NaN NaN NaN NaN NaN NaN NaN NaN

Подробнее здесь: https://stackoverflow.com/questions/788 ... e-best-row

Реклама

1722627469

Anonymous

Скажем, у меня есть MultiIndex от MultiIndex DataFrame, аналогичный созданному здесь:
import pandas as pd

data_frame_rows = pd.MultiIndex.from_arrays([[], [], []], names=("car", "engine", "wheels"))
data_frame_columns = pd.MultiIndex.from_arrays([[], [], []], names=("group", "subgroup", "details"))
data_frame = pd.DataFrame(index=data_frame_rows, columns=data_frame_columns)

for car in ("mustang", "corvette", "civic"):
for engine in ("normal", "supercharged"):
for wheels in ("normal", "wide"):
data_frame.loc[(car, engine, wheels), ("cost", "", "money ($)")] = int(random() * 100)
data_frame.loc[(car, engine, wheels), ("cost", "", "maintenance (minutes)")] = int(random() * 60)

percent_win = random()
recommended = percent_win >= 0.8
data_frame.loc[(car, engine, wheels), ("race", "f1", "win %")] = percent_win
data_frame.loc[(car, engine, wheels), ("race", "f1", "recommended")] = recommended

percent_win = random()
recommended = percent_win >= 0.8
data_frame.loc[(car, engine, wheels), ("race", "indy", "win %")] = percent_win
data_frame.loc[(car, engine, wheels), ("race", "indy", "recommended")] = recommended

percent_win = random()
recommended = percent_win >= 0.8
data_frame.loc[(car, engine, wheels), ("race", "lemans", "win %")] = percent_win
data_frame.loc[(car, engine, wheels), ("race", "lemans", "recommended")] = recommended

Это будет выглядеть примерно так:
group                             cost                            race
subgroup                                                            f1                  indy                lemans
details                      money ($) maintenance (minutes)     win % recommended     win % recommended     win % recommended
car      engine       wheels
mustang  normal       normal       3.0                  33.0  0.664754       False  0.584689       False  0.629107       False
wide        39.0                  30.0  0.143568       False  0.339405       False  0.531536       False
supercharged normal      65.0                  59.0  0.270161       False  0.682142       False  0.953301        True
wide        92.0                  12.0  0.403246       False  0.801241        True  0.991273        True
corvette normal       normal      72.0                  46.0  0.361436       False  0.981196        True  0.352499       False
wide        19.0                   2.0  0.303950       False  0.578942       False  0.802201        True
supercharged normal      15.0                  29.0  0.148742       False  0.305060       False  0.144883       False
wide        59.0                  38.0  0.102707       False  0.364228       False  0.602490       False
civic    normal       normal      51.0                  14.0  0.726772       False  0.930073        True  0.218876       False
wide        66.0                   7.0  0.530214       False  0.051396       False  0.240695       False
supercharged normal      55.0                  52.0  0.939180        True  0.614061       False  0.589519       False
wide        74.0                  28.0  0.595012       False  0.240609       False  0.539910       False

Теперь я хочу найти все строки, в которых данная конфигурация автомобиля рекомендована хотя бы для 1 гонки.  Если конкретный автомобиль рекомендуется использовать более чем в одной гонке, я хочу выбрать конфигурацию, которая имеет наибольший процент шансов на победу в любой гонке.
Я читал это несколько раз и хоть убей, я не могу этого понять.
Я пробовал что-то вроде:
data_frame[(data_frame.loc[:,idx["race",:,"recommended"]]==True)]

Но это, похоже, не фильтрует строки, а просто устанавливает значение NaN или True
group                             cost                        race
subgroup                                                        f1              indy             lemans
details                      money ($) maintenance (minutes) win % recommended win % recommended  win % recommended
car      engine       wheels
mustang  normal       normal       NaN                   NaN   NaN         NaN   NaN         NaN    NaN         NaN
wide         NaN                   NaN   NaN         NaN   NaN         NaN    NaN         NaN
supercharged normal       NaN                   NaN   NaN         NaN   NaN         NaN    NaN        True
wide         NaN                   NaN   NaN         NaN   NaN        True    NaN        True
corvette normal       normal       NaN                   NaN   NaN         NaN   NaN        True    NaN         NaN
wide         NaN                   NaN   NaN         NaN   NaN         NaN    NaN        True
supercharged normal       NaN                   NaN   NaN         NaN   NaN         NaN    NaN         NaN
wide         NaN                   NaN   NaN         NaN   NaN         NaN    NaN         NaN
civic    normal       normal       NaN                   NaN   NaN         NaN   NaN        True    NaN         NaN
wide         NaN                   NaN   NaN         NaN   NaN         NaN    NaN         NaN
supercharged normal       NaN                   NaN   NaN        True   NaN         NaN    NaN         NaN
wide         NaN                   NaN   NaN         NaN   NaN         NaN    NaN         NaN
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78827002/how-to-query-a-multiindex-by-multiindex-and-choose-the-best-row[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как запросить MultiIndex по MultiIndex и выбрать «лучшую» строку?

Последнее сообщение Anonymous « 03 авг 2024, 02:27
Добавлено в форуме Python

Anonymous » 03 авг 2024, 02:27 » в форуме Python

Скажем, у меня есть MultiIndex от MultiIndex DataFrame, аналогичный тому, который сгенерирован здесь (в реальном случае список рас является динамическим и заранее неизвестен):
import random

import pandas as pd

random.seed(1)

data_frame_rows =...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
03 авг 2024, 02:27
Ищу лучшую функцию в моей игре в понг

Последнее сообщение Anonymous « 22 июн 2024, 22:05
Добавлено в форуме C#

Anonymous » 22 июн 2024, 22:05 » в форуме C#

Недавно я начал изучать Unity, и для своей первой игры я выбрал понг, и в эту игру можно играть, но у меня есть логическая проблема с мячом, и когда он ударяется о боковые стенки, угол удара не имеет значения, он всегда приходит назад под тем же...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
22 июн 2024, 22:05
Почему этот SIMD-код не показывает лучшую производительность?

Последнее сообщение Anonymous « 26 июн 2024, 17:21
Добавлено в форуме C++

Anonymous » 26 июн 2024, 17:21 » в форуме C++

Я написал простой код для проверки производительности и настройки данных:
#include
#include
#include
#include

unsigned t0, t1;

struct VAL
{
union
{
float val ;
__m128 val_simd;
};
};

int main()
{
unsigned t0, t1;
double time;
VAL *a, *b, *c;...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
26 июн 2024, 17:21
Tensorflow: можно сохранить лучшую модель только при наличии val_acc, пропуская

Последнее сообщение Anonymous « 04 июл 2024, 01:42
Добавлено в форуме Python

Anonymous » 04 июл 2024, 01:42 » в форуме Python

У меня проблема с tf.callbacks.ModelChekpoint. Как вы можете видеть в моем файле журнала, предупреждение всегда появляется перед последней итерацией, где вычисляется val_acc. Поэтому Modelcheckpoint никогда не находит val_acc
Epoch 1/30
1/8 - ETA:...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
04 июл 2024, 01:42
Как я могу оптимизировать процесс, чтобы найти лучшую четырехстороннюю форму, содержащую мою маску?

Последнее сообщение Anonymous « 16 июл 2024, 14:54
Добавлено в форуме C++

Anonymous » 16 июл 2024, 14:54 » в форуме C++

В настоящее время я работаю над проектом, в котором мне нужно распознавать бильярдный стол и бильярдные шары по видеокадру.
Затем мне нужно воссоздать состояние игры в 2D-мини-изображении. -map, и для этого мне нужны края игрового поля бильярдного...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
16 июл 2024, 14:54

Вернуться в «Python»

Programmiererforum