Почему не выдается предупреждение об индексации серии значений со слишком длинной последовательностью bool? - Цифровое Кемерово

Почему не выдается предупреждение об индексации серии значений со слишком длинной последовательностью bool? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Почему не выдается предупреждение об индексации серии значений со слишком длинной последовательностью bool?

Цитата

Сообщение Anonymous » 01 июл 2024, 18:52

У меня есть следующий код:

Код: Выделить всё

import pandas as pd

series_source = pd.Series([1, 2, 3, 4], dtype=int)
normal_index = pd.Series([True, False, True, True], dtype=bool)
big_index = pd.Series([True, False, True, True, False, True], dtype=bool)

# Both indexes give back: pd.Series([1, 2, 3, 4], dtype=int)
# no warnings are raised!
assert (series_source[normal_index] == series_source[big_index]).all()

df_source = pd.DataFrame(
[
[1, 2, 3, 4],
[5, 6, 7, 8],
[9, 10, 11, 12],
[13, 14, 15, 16]
]
)

# no warning - works as expected: grabs rows 0, 2, and 3
df_normal_result = df_source[normal_index]

# UserWarning: Boolean Series key will be reindexed to match DataFrame index.
# (but still runs)
df_big_result = df_source[big_index]

# passes - they are equivalent
assert df_normal_result.equals(df_big_result)
print("Complete")

Почему индексация series_source с помощью big_index не вызывает предупреждение, хотя большой индекс имеет больше значений, чем источник ? Что панды делают под капотом, чтобы выполнить индексацию серий?
(Сравните это с индексацией df_source, где выдается явное предупреждение о том, что big_index необходимо переиндексировать, чтобы операция работала.)
В документации по индексированию утверждается, что:

Использование логического вектора для индексации серии работает точно так же, как в NumPy
ndarray

Однако, если я сделать

Код: Выделить всё

import numpy as np

a = np.array([1, 2, 3, 4, 5])
b = np.array([True, False, True, True, False])
c = np.array([True, False, True, True, False, True, True])

# returns an ndarray of [1,3, 4] as expected
print(a[b])

# raises IndexError: boolean index did not match indexed array along axis 0;
# size of axis is 5 but size of corresponding boolean axis is 7
print(a[c])

Поэтому не похоже, что эта функциональность соответствует Numpy, как утверждается в документации. Что происходит?
(Мои версии — pandas==2.2.2 и numpy==2.0.0.)

Подробнее здесь: https://stackoverflow.com/questions/786 ... eries-that

Реклама

1719849138

Anonymous

У меня есть следующий код:
[code]import pandas as pd

series_source = pd.Series([1, 2, 3, 4], dtype=int)
normal_index = pd.Series([True, False, True, True], dtype=bool)
big_index = pd.Series([True, False, True, True, False, True], dtype=bool)

# Both indexes give back: pd.Series([1, 2, 3, 4], dtype=int)
# no warnings are raised!
assert (series_source[normal_index] == series_source[big_index]).all()

df_source = pd.DataFrame(
[
[1, 2, 3, 4],
[5, 6, 7, 8],
[9, 10, 11, 12],
[13, 14, 15, 16]
]
)

# no warning - works as expected: grabs rows 0, 2, and 3
df_normal_result = df_source[normal_index]

# UserWarning: Boolean Series key will be reindexed to match DataFrame index.
# (but still runs)
df_big_result = df_source[big_index]

# passes - they are equivalent
assert df_normal_result.equals(df_big_result)
print("Complete")
[/code]
[b]Почему индексация series_source с помощью big_index не вызывает предупреждение, хотя большой индекс имеет больше значений, чем источник ?[/b] Что панды делают под капотом, чтобы выполнить индексацию серий?
(Сравните это с индексацией df_source, где выдается явное предупреждение о том, что big_index необходимо переиндексировать, чтобы операция работала.)
В документации по индексированию утверждается, что:

Использование логического вектора для индексации серии работает точно так же, как в NumPy
ndarray

Однако, если я сделать
[code]import numpy as np

a = np.array([1, 2, 3, 4, 5])
b = np.array([True, False, True, True, False])
c = np.array([True, False, True, True, False, True, True])

# returns an ndarray of [1,3, 4] as expected
print(a[b])

# raises IndexError: boolean index did not match indexed array along axis 0;
# size of axis is 5 but size of corresponding boolean axis is 7
print(a[c])
[/code]
Поэтому не похоже, что эта функциональность соответствует Numpy, как утверждается в документации. Что происходит?
(Мои версии — pandas==2.2.2 и numpy==2.0.0.) 

Подробнее здесь: [url]https://stackoverflow.com/questions/78692950/why-is-no-warning-thrown-for-indexing-a-series-of-values-with-a-bool-series-that[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Ошибка: тип аргумента «bool?» нельзя присвоить типу параметра «bool», потому что «bool?» имеет значение NULL, а «bool» —

Последнее сообщение Anonymous « 17 дек 2024, 00:28
Добавлено в форуме IOS

Anonymous » 17 дек 2024, 00:28 » в форуме IOS

У меня есть приложение Flutter, которое отлично работает на Android. Я создал проект ios и пытаюсь запустить его, но вижу следующую ошибку:
Could not build the precompiled application for the device.
Error (Xcode):...

0 Ответы

98 Просмотры

Последнее сообщение Anonymous
17 дек 2024, 00:28
Ускорение поиска самой длинной непрерывной последовательности/серии значений

Последнее сообщение Anonymous « 19 окт 2023, 13:41
Добавлено в форуме Python

Anonymous » 19 окт 2023, 13:41 » в форуме Python

У меня есть маскированный набор данных за 30 лет, содержащий значения для дней, в которые наблюдалась волна тепла. Я хочу рассчитать возникновение самой продолжительной тепловой волны в каждой ячейке сетки. Приведенный ниже код работает нормально,...

0 Ответы

27 Просмотры

Последнее сообщение Anonymous
19 окт 2023, 13:41
Если вы добавите _metadata в пользовательский подкласс серии, имя последовательности теряется при индексации

Последнее сообщение Anonymous « 24 май 2025, 14:04
Добавлено в форуме Python

Anonymous » 24 май 2025, 14:04 » в форуме Python

pandas 2.2.3
Давайте рассмотрим два варианта определения пользовательского подтипа Pandas.series . В первом из них не добавляются пользовательские свойства, в то время как во втором можно включено пользовательские метаданные:
import pandas as pd...

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
24 май 2025, 14:04
Если вы добавите _metadata в пользовательский подкласс серии, имя последовательности теряется при индексации

Последнее сообщение Anonymous « 25 май 2025, 11:34
Добавлено в форуме Python

Anonymous » 25 май 2025, 11:34 » в форуме Python

pandas 2.2.3
Давайте рассмотрим два варианта определения пользовательского подтипа Pandas.series . В первом из них не добавляются пользовательские свойства, в то время как во втором можно включено пользовательские метаданные:
import pandas as pd...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
25 май 2025, 11:34
Если вы добавите _metadata в пользовательский подкласс серии, имя последовательности теряется при индексации

Последнее сообщение Anonymous « 26 май 2025, 13:19
Добавлено в форуме Python

Anonymous » 26 май 2025, 13:19 » в форуме Python

pandas 2.2.3
Давайте рассмотрим два варианта определения пользовательского подтипа Pandas.series . В первом из них не добавляются пользовательские свойства, в то время как во втором можно включено пользовательские метаданные:
import pandas as pd...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
26 май 2025, 13:19

Вернуться в «Python»

Programmiererforum