Кадр данных pandas в качестве таблицы поиска для другого кадра данных другой длины

Кадр данных pandas в качестве таблицы поиска для другого кадра данных другой длины ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Кадр данных pandas в качестве таблицы поиска для другого кадра данных другой длины

Цитата

Сообщение Anonymous » 30 окт 2024, 15:15

У меня есть небольшой фрейм данных pandas, содержащий данные всего из нескольких строк и трех столбцов:

Код: Выделить всё

import pandas as pd
df_size = pd.DataFrame([[0.510,0.450,0.540],
[0.899,0.820,1.150],
[1.745,1.587,2.020],
[2.020,1.745,2.405],
], columns=['diameter_mean', 'diameter_min','diameter_max'])

второй фрейм данных содержит (гораздо длинную) таблицу поиска:

Код: Выделить всё

df_lookup = pd.DataFrame([[0.450,0.021548],
[0.510,0.021791],
[0.540,0.022038],
[0.565,0.022289],
[0.695,0.022545],
[0.720,0.034321],
[0.770,1.292340],
[0.820,1.296070],
[0.899,1.302340],
[1.150,2.311770],
[1.361,3.325140],
[1.587,4.144621],
[1.745,3.498933],
[2.020,3.512665],
[2.405,3.610773],
], columns=['diameter', 'SMS'])

Означает, что не для какой-либо записи таблицы поиска может существовать точка данных в df_size.
На основе df_lookup['diameter']
На основе df_lookup['diameter']
code> Я хочу автоматически найти соответствующие значения SMS для всех трех столбцов df_size['diameter_mean'], df_size['diameter_min'] и df_size['diameter_max'] и добавить найденные значения в виде трех новых столбцов ['SMS'], ['SMS_min'], ['SMS_max'] в кадр данных набора данных 'df_size'.
Я попытался создать три новые столбцы со слиянием, но это вызывает, как и ожидалось, ошибку valueError:

Код: Выделить всё

df_size['SMS'] = df_size.merge(df_lookup, left_on='diameter_mean', right_on='diameter')
df_size['SMS_min'] = df_size.merge(df_lookup, left_on='diameter_min', right_on='diameter')
df_size['SMS_max'] = df_size.merge(df_lookup, left_on='diameter_max', right_on='diameter')

из-за нескольких столбцов, которым будет присвоено одно значение для всех трех строк кода.
В качестве альтернативы я пробовал решения с применением и с картой, но кажется, что я что-то упускаю (здесь пример только для столбца диаметра_среднего):

Код: Выделить всё

df_size['SMS'].apply(lambda df_lookup.SMS: df_lookup['diameter'][(df_size['diameter_mean'])].values[0])

вызывает ошибку ключа.
Назначенный df_size будет выглядеть так:

Код: Выделить всё

df_size
'diameter_mean' 'diameter_min' 'diameter_max' 'SMS'     'SMS_min'    'SMS_max'
0.510           0.450           0.540         0.021791  0.021548     0.022038
0.899           0.820           1.150         1.302340  1.296070     2.311770
1.745           1.587           2.020         3.498933  4.144621     3.512665
2.020           1.745           2.405         3.512665  3.498933     3.610773

Необходимо ли, чтобы оба фрейма данных имели строго монотонное поведение с точки зрения параметра поиска (= диаметра)?

Подробнее здесь: https://stackoverflow.com/questions/791 ... ent-length

1730290536

Anonymous

У меня есть небольшой фрейм данных pandas, содержащий данные всего из нескольких строк и трех столбцов:
[code]import pandas as pd
df_size = pd.DataFrame([[0.510,0.450,0.540],
[0.899,0.820,1.150],
[1.745,1.587,2.020],
[2.020,1.745,2.405],
], columns=['diameter_mean', 'diameter_min','diameter_max'])
[/code]
второй фрейм данных содержит (гораздо длинную) таблицу поиска:
[code]df_lookup = pd.DataFrame([[0.450,0.021548],
[0.510,0.021791],
[0.540,0.022038],
[0.565,0.022289],
[0.695,0.022545],
[0.720,0.034321],
[0.770,1.292340],
[0.820,1.296070],
[0.899,1.302340],
[1.150,2.311770],
[1.361,3.325140],
[1.587,4.144621],
[1.745,3.498933],
[2.020,3.512665],
[2.405,3.610773],
], columns=['diameter', 'SMS'])
[/code]
Означает, что не для какой-либо записи таблицы поиска может существовать точка данных в df_size.
На основе df_lookup['diameter']
На основе df_lookup['diameter']
code> Я хочу автоматически найти соответствующие значения SMS для всех трех столбцов df_size['diameter_mean'], df_size['diameter_min'] и df_size['diameter_max'] и добавить найденные значения в виде трех новых столбцов ['SMS'], ['SMS_min'], ['SMS_max'] в кадр данных набора данных 'df_size'.
Я попытался создать три новые столбцы со слиянием, но это вызывает, как и ожидалось, ошибку valueError:
[code]df_size['SMS'] = df_size.merge(df_lookup, left_on='diameter_mean', right_on='diameter')
df_size['SMS_min'] = df_size.merge(df_lookup, left_on='diameter_min', right_on='diameter')
df_size['SMS_max'] = df_size.merge(df_lookup, left_on='diameter_max', right_on='diameter')
[/code]
из-за нескольких столбцов, которым будет присвоено одно значение для всех трех строк кода.
В качестве альтернативы я пробовал решения с применением и с картой, но кажется, что я что-то упускаю (здесь пример только для столбца диаметра_среднего):
[code]df_size['SMS'].apply(lambda df_lookup.SMS: df_lookup['diameter'][(df_size['diameter_mean'])].values[0])
[/code]
вызывает ошибку ключа.
Назначенный df_size будет выглядеть так:
[code]df_size
'diameter_mean' 'diameter_min' 'diameter_max' 'SMS'     'SMS_min'    'SMS_max'
0.510           0.450           0.540         0.021791  0.021548     0.022038
0.899           0.820           1.150         1.302340  1.296070     2.311770
1.745           1.587           2.020         3.498933  4.144621     3.512665
2.020           1.745           2.405         3.512665  3.498933     3.610773
[/code]
Необходимо ли, чтобы оба фрейма данных имели строго монотонное поведение с точки зрения параметра поиска (= диаметра)? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79141044/pandas-dataframe-as-lookup-table-for-another-dataframe-of-a-different-length[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Кадр данных pandas в качестве таблицы поиска для другого кадра данных другой длины

Последнее сообщение Anonymous « 30 окт 2024, 15:08
Добавлено в форуме Python

Anonymous » 30 окт 2024, 15:08 » в форуме Python

У меня есть небольшой фрейм данных pandas, содержащий данные всего из нескольких строк и трех столбцов:
import pandas as pd
df_size = pd.DataFrame([ ,
,
,
,
], columns= )

второй фрейм данных содержит (гораздо длинную) таблицу поиска:...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
30 окт 2024, 15:08
Кадр данных pandas в качестве таблицы поиска для другого кадра данных другой длины

Последнее сообщение Anonymous « 30 окт 2024, 16:41
Добавлено в форуме Python

Anonymous » 30 окт 2024, 16:41 » в форуме Python

У меня есть небольшой фрейм данных pandas, содержащий данные всего из нескольких строк и трех столбцов:
import pandas as pd
df_size = pd.DataFrame([ ,
,
,
,
], columns= )

второй фрейм данных содержит (гораздо длинную) таблицу поиска:...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
30 окт 2024, 16:41
Pandas DataFrame в качестве таблицы поиска для другого отдела обработки данных другой длины

Последнее сообщение Anonymous « 07 июн 2025, 21:52
Добавлено в форуме Python

Anonymous » 07 июн 2025, 21:52 » в форуме Python

У меня есть небольшой пандас, содержащий данные, содержащие только несколько строк и три столбца:
import pandas as pd
df_size = pd.DataFrame([ ,
,
,
,
], columns= )

Второй DataFrame содержит (намного длиннее) таблицу поиска:
df_lookup =...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
07 июн 2025, 21:52
Pandas: как преобразовать кадр данных M*N в кадр данных (M*N)*1

Последнее сообщение Anonymous « 28 фев 2024, 13:37
Добавлено в форуме Python

Anonymous » 28 фев 2024, 13:37 » в форуме Python

Предположим, у меня есть кадр данных размером 2*3:
df = pd.DataFrame({'A': , 'B': , 'C': }) А Б С 0 1 3 5 1 2 4 6 Мне интересно, как преобразовать df в кадр данных (2*3)*1, который имеет следующую форму? Я пробовал pd.DataFrame.explode() и...

0 Ответы

86 Просмотры

Последнее сообщение Anonymous
28 фев 2024, 13:37
Ошибка NonExistentTimeError при преобразовании кадра данных pandas в кадр данных pyspark

Последнее сообщение Anonymous « 09 окт 2024, 19:57
Добавлено в форуме Python

Anonymous » 09 окт 2024, 19:57 » в форуме Python

Я запрашиваю базу данных в InfluxDB. В базе данных есть дата в формате отметки времени. С помощью этого кода я делаю запрос
query = f select * from {measurement} where time > '2021-03-28T02:02:58Z' AND time 2 spark_df =...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
09 окт 2024, 19:57

Вернуться в «Python»