Как запросить MultiIndex по MultiIndex и выбрать «лучшую» строку? - Цифровое Кемерово

Как запросить MultiIndex по MultiIndex и выбрать «лучшую» строку? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Как запросить MultiIndex по MultiIndex и выбрать «лучшую» строку?

Цитата

Сообщение Anonymous » 03 авг 2024, 02:27

Скажем, у меня есть MultiIndex от MultiIndex DataFrame, аналогичный тому, который сгенерирован здесь (в реальном случае список рас является динамическим и заранее неизвестен):< /p>
import random

import pandas as pd

random.seed(1)

data_frame_rows = pd.MultiIndex.from_arrays([[], [], []], names=("car", "engine", "wheels"))
data_frame_columns = pd.MultiIndex.from_arrays([[], [], []], names=("group", "subgroup", "details"))
data_frame = pd.DataFrame(index=data_frame_rows, columns=data_frame_columns)

for car in ("mustang", "corvette", "civic"):
for engine in ("normal", "supercharged"):
for wheels in ("normal", "wide"):
data_frame.loc[(car, engine, wheels), ("cost", "", "money ($)")] = int(random.random() * 100)
data_frame.loc[(car, engine, wheels), ("cost", "", "maintenance (minutes)")] = int(random.random() * 60)

for race in ("f1", "indy", "lemans"):
percent_win = random.random()
recommended = percent_win >= 0.8
data_frame.loc[(car, engine, wheels), ("race", race, "win %")] = percent_win
data_frame.loc[(car, engine, wheels), ("race", race, "recommended")] = recommended

Это будет выглядеть примерно так:
group cost race
subgroup f1 indy lemans
details money ($) maintenance (minutes) win % recommended win % recommended win % recommended
car engine wheels
mustang normal normal 13.0 50.0 0.763775 False 0.255069 False 0.495435 False
wide 44.0 39.0 0.788723 False 0.093860 False 0.028347 False
supercharged normal 83.0 25.0 0.762280 False 0.002106 False 0.445387 False
wide 72.0 13.0 0.945271 True 0.901427 True 0.030590 False
corvette normal normal 2.0 32.0 0.939149 True 0.381204 False 0.216599 False
wide 42.0 1.0 0.221692 False 0.437888 False 0.495812 False
supercharged normal 23.0 13.0 0.218781 False 0.459603 False 0.289782 False
wide 2.0 50.0 0.556454 False 0.642294 False 0.185906 False
civic normal normal 99.0 51.0 0.120890 False 0.332695 False 0.721484 False
wide 71.0 56.0 0.422107 False 0.830036 True 0.670306 False
supercharged normal 30.0 35.0 0.882479 True 0.846197 True 0.505284 False
wide 58.0 2.0 0.242740 False 0.797404 False 0.414314 False

Теперь я хочу найти все строки, в которых конкретная конфигурация автомобиля (комбинация двигателя и колес) является «лучшей» конфигурацией для этого автомобиля. Например, в данном случае у Civic есть две рекомендуемые конфигурации, а у Civic с наддувом двигателем и обычными колесами самый высокий шанс на победу в гонке (88% в гонке f1). Все остальные автомобили/конфигурации, которые не рекомендуются для участия в каких-либо гонках или имеют меньшие шансы на победу в какой-либо гонке, я хочу отфильтровать. Мустанг и корвет имеют по одной конфигурации, рекомендованной для любой гонки, поэтому я бы выбрал именно эти конфигурации для этих двух автомобилей.
Итак, Конечным результатом будет каждый автомобиль, указанный не более одного раза, с лучшей конфигурацией. Если у автомобиля нет рекомендуемых конфигураций, я хочу получить их полностью.
Я читал это несколько раз и, хоть убей, не могу в этом разобраться.
В качестве отправной точки для получения рекомендуемых строк я попробовал что-то вроде:
data_frame[(data_frame.loc[:,idx["race",:,"recommended"]]==True)]

Но это, похоже, не фильтрует строки, а просто устанавливает значение NaN или True
group cost race
subgroup f1 indy lemans
details money ($) maintenance (minutes) win % recommended win % recommended win % recommended
car engine wheels
mustang normal normal NaN NaN NaN NaN NaN NaN NaN NaN
wide NaN NaN NaN NaN NaN NaN NaN NaN
supercharged normal NaN NaN NaN NaN NaN NaN NaN NaN
wide NaN NaN NaN True NaN True NaN NaN
corvette normal normal NaN NaN NaN True NaN NaN NaN NaN
wide NaN NaN NaN NaN NaN NaN NaN NaN
supercharged normal NaN NaN NaN NaN NaN NaN NaN NaN
wide NaN NaN NaN NaN NaN NaN NaN NaN
civic normal normal NaN NaN NaN NaN NaN NaN NaN NaN
wide NaN NaN NaN NaN NaN True NaN NaN
supercharged normal NaN NaN NaN True NaN True NaN NaN
wide NaN NaN NaN NaN NaN NaN NaN NaN

Подробнее здесь: https://stackoverflow.com/questions/788 ... e-best-row

Реклама

1722641226

Anonymous

Скажем, у меня есть MultiIndex от MultiIndex DataFrame, аналогичный тому, который сгенерирован здесь (в реальном случае список рас является динамическим и заранее неизвестен):< /p>
import random

import pandas as pd

random.seed(1)

data_frame_rows = pd.MultiIndex.from_arrays([[], [], []], names=("car", "engine", "wheels"))
data_frame_columns = pd.MultiIndex.from_arrays([[], [], []], names=("group", "subgroup", "details"))
data_frame = pd.DataFrame(index=data_frame_rows, columns=data_frame_columns)

for car in ("mustang", "corvette", "civic"):
for engine in ("normal", "supercharged"):
for wheels in ("normal", "wide"):
data_frame.loc[(car, engine, wheels), ("cost", "", "money ($)")] = int(random.random() * 100)
data_frame.loc[(car, engine, wheels), ("cost", "", "maintenance (minutes)")] = int(random.random() * 60)

for race in ("f1", "indy", "lemans"):
percent_win = random.random()
recommended = percent_win >= 0.8
data_frame.loc[(car, engine, wheels), ("race", race, "win %")] = percent_win
data_frame.loc[(car, engine, wheels), ("race", race, "recommended")] = recommended

Это будет выглядеть примерно так:
group                             cost                            race
subgroup                                                            f1                  indy                lemans
details                      money ($) maintenance (minutes)     win % recommended     win % recommended     win % recommended
car      engine       wheels
mustang  normal       normal      13.0                  50.0  0.763775       False  0.255069       False  0.495435       False
wide        44.0                  39.0  0.788723       False  0.093860       False  0.028347       False
supercharged normal      83.0                  25.0  0.762280       False  0.002106       False  0.445387       False
wide        72.0                  13.0  0.945271        True  0.901427        True  0.030590       False
corvette normal       normal       2.0                  32.0  0.939149        True  0.381204       False  0.216599       False
wide        42.0                   1.0  0.221692       False  0.437888       False  0.495812       False
supercharged normal      23.0                  13.0  0.218781       False  0.459603       False  0.289782       False
wide         2.0                  50.0  0.556454       False  0.642294       False  0.185906       False
civic    normal       normal      99.0                  51.0  0.120890       False  0.332695       False  0.721484       False
wide        71.0                  56.0  0.422107       False  0.830036        True  0.670306       False
supercharged normal      30.0                  35.0  0.882479        True  0.846197        True  0.505284       False
wide        58.0                   2.0  0.242740       False  0.797404       False  0.414314       False

Теперь я хочу найти все строки, в которых конкретная конфигурация автомобиля (комбинация двигателя и колес) является «лучшей» конфигурацией для этого автомобиля. Например, в данном случае у Civic есть две рекомендуемые конфигурации, а у Civic с наддувом двигателем и обычными колесами самый высокий шанс на победу в гонке (88% в гонке f1). Все остальные автомобили/конфигурации, которые не рекомендуются для участия в каких-либо гонках или имеют меньшие шансы на победу в какой-либо гонке, я хочу отфильтровать. Мустанг и корвет имеют по одной конфигурации, рекомендованной для любой гонки, поэтому я бы выбрал именно эти конфигурации для этих двух автомобилей.
Итак, Конечным результатом будет каждый автомобиль, указанный не более одного раза, с лучшей конфигурацией.  Если у автомобиля нет рекомендуемых конфигураций, я хочу получить их полностью.
Я читал это несколько раз и, хоть убей, не могу в этом разобраться.
В качестве отправной точки для получения рекомендуемых строк я попробовал что-то вроде:
data_frame[(data_frame.loc[:,idx["race",:,"recommended"]]==True)]

Но это, похоже, не фильтрует строки, а просто устанавливает значение NaN или True
group                             cost                        race
subgroup                                                        f1              indy             lemans
details                      money ($) maintenance (minutes) win % recommended win % recommended  win % recommended
car      engine       wheels
mustang  normal       normal       NaN                   NaN   NaN         NaN   NaN         NaN    NaN         NaN
wide         NaN                   NaN   NaN         NaN   NaN         NaN    NaN         NaN
supercharged normal       NaN                   NaN   NaN         NaN   NaN         NaN    NaN         NaN
wide         NaN                   NaN   NaN        True   NaN        True    NaN         NaN
corvette normal       normal       NaN                   NaN   NaN        True   NaN         NaN    NaN         NaN
wide         NaN                   NaN   NaN         NaN   NaN         NaN    NaN         NaN
supercharged normal       NaN                   NaN   NaN         NaN   NaN         NaN    NaN         NaN
wide         NaN                   NaN   NaN         NaN   NaN         NaN    NaN         NaN
civic    normal       normal       NaN                   NaN   NaN         NaN   NaN         NaN    NaN         NaN
wide         NaN                   NaN   NaN         NaN   NaN        True    NaN         NaN
supercharged normal       NaN                   NaN   NaN        True   NaN        True    NaN         NaN
wide         NaN                   NaN   NaN         NaN   NaN         NaN    NaN         NaN
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78827002/how-to-query-a-multiindex-by-multiindex-and-choose-the-best-row[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как запросить MultiIndex по MultiIndex и выбрать «лучшую» строку?

Последнее сообщение Anonymous « 02 авг 2024, 22:37
Добавлено в форуме Python

Anonymous » 02 авг 2024, 22:37 » в форуме Python

Скажем, у меня есть MultiIndex от MultiIndex DataFrame, аналогичный созданному здесь:
import pandas as pd

data_frame_rows = pd.MultiIndex.from_arrays([[], [], []], names=( car , engine , wheels ))
data_frame_columns = pd.MultiIndex.from_arrays([[],...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
02 авг 2024, 22:37
Ищу лучшую функцию в моей игре в понг

Последнее сообщение Anonymous « 22 июн 2024, 22:05
Добавлено в форуме C#

Anonymous » 22 июн 2024, 22:05 » в форуме C#

Недавно я начал изучать Unity, и для своей первой игры я выбрал понг, и в эту игру можно играть, но у меня есть логическая проблема с мячом, и когда он ударяется о боковые стенки, угол удара не имеет значения, он всегда приходит назад под тем же...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
22 июн 2024, 22:05
Почему этот SIMD-код не показывает лучшую производительность?

Последнее сообщение Anonymous « 26 июн 2024, 17:21
Добавлено в форуме C++

Anonymous » 26 июн 2024, 17:21 » в форуме C++

Я написал простой код для проверки производительности и настройки данных:
#include
#include
#include
#include

unsigned t0, t1;

struct VAL
{
union
{
float val ;
__m128 val_simd;
};
};

int main()
{
unsigned t0, t1;
double time;
VAL *a, *b, *c;...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
26 июн 2024, 17:21
Tensorflow: можно сохранить лучшую модель только при наличии val_acc, пропуская

Последнее сообщение Anonymous « 04 июл 2024, 01:42
Добавлено в форуме Python

Anonymous » 04 июл 2024, 01:42 » в форуме Python

У меня проблема с tf.callbacks.ModelChekpoint. Как вы можете видеть в моем файле журнала, предупреждение всегда появляется перед последней итерацией, где вычисляется val_acc. Поэтому Modelcheckpoint никогда не находит val_acc
Epoch 1/30
1/8 - ETA:...

0 Ответы

28 Просмотры

Последнее сообщение Anonymous
04 июл 2024, 01:42
Как я могу оптимизировать процесс, чтобы найти лучшую четырехстороннюю форму, содержащую мою маску?

Последнее сообщение Anonymous « 16 июл 2024, 14:54
Добавлено в форуме C++

Anonymous » 16 июл 2024, 14:54 » в форуме C++

В настоящее время я работаю над проектом, в котором мне нужно распознавать бильярдный стол и бильярдные шары по видеокадру.
Затем мне нужно воссоздать состояние игры в 2D-мини-изображении. -map, и для этого мне нужны края игрового поля бильярдного...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
16 июл 2024, 14:54

Вернуться в «Python»

Programmiererforum