Pandas превращает pd.Int64Dtype обратно в Float

Pandas превращает pd.Int64Dtype обратно в Float ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Pandas превращает pd.Int64Dtype обратно в Float

Цитата

Сообщение Anonymous » 16 июл 2024, 14:34

У меня есть фрагмент кода, который разбивает некоторые данные на ряды, вносит некоторые изменения, в том числе потенциально преобразует несколько значений в NaN, а затем в конечном итоге объединяет эти ряды в кадр данных.
(см. упрощенный код ниже)
sers = []

for item in items:
type_name = item.name
values = {pd.to_datetime(value.date_string): value.doc_count for value in item.values}
series = pd.Series(values, name=type_name, dtype=pd.Int64Dtype())
reindexed_series = series.reindex(date_range, fill_value=0)
exclude_inapplicable_days(reindexed_series, type_name)
apply_offset(reindexed_series, type_name)
sers.append(reindexed_series)

df = pd.DataFrame(sers)

в ignore_inapplicable_days и apply_offset Я меняю некоторые значения в этой серии на NaN, что имеет для нас другое значение, чем 0, которое мы использовали в качестве fill_value.
Все хорошо, пока это не просто серия, у них тип данных int благодаря его указанию, но df превращает все это обратно в числа с плавающей запятой, несмотря на все серии в sers
code> имеющий типы int, совместимые с NaN.
Почему это происходит? Есть ли способ обойти это, не повторяя df и не меняя все обратно?
Воспроизводимый пример:
import pandas as pd

date_range = pd.date_range(start="2023-01-01", end="2023-01-05")

items = [
{"name": "Type1", "values": [{"date_string": "2023-01-01", "doc_count": 1},
{"date_string": "2023-01-02", "doc_count": 2},
{"date_string": "2023-01-03", "doc_count": 3},
{"date_string": "2023-01-04", "doc_count": 4},
{"date_string": "2023-01-05", "doc_count": 5}]},
{"name": "Type2", "values": [{"date_string": "2023-01-01", "doc_count": 6},
{"date_string": "2023-01-02", "doc_count": 7},
{"date_string": "2023-01-03", "doc_count": 8},
{"date_string": "2023-01-04", "doc_count": 9},
{"date_string": "2023-01-05", "doc_count": 10}]}
]

def exclude_inapplicable_days(series, type_name):
series[series.index[0]] = pd.NA
print(f"After exclusion in {type_name}: {series.dtype}")

def apply_offset(series, type_name):
offset = {
"Type1": 2,
"Type2": 1
}[type_name]
if offset > 0:
series.iloc[-offset:] = pd.NA
print(f"After offset in {type_name}: {series.dtype}")

sers = []
for item in items:
type_name = item['name']
values = {pd.to_datetime(val['date_string']): val['doc_count'] for val in item['values']}
series = pd.Series(values, name=type_name, dtype=pd.Int64Dtype())
reindexed_series = series.reindex(date_range, fill_value=0)
exclude_inapplicable_days(reindexed_series, type_name)
apply_offset(reindexed_series, type_name)
sers.append(reindexed_series)

df = pd.DataFrame(sers)

print("DataFrame dtypes:")
print(df.dtypes)

Подробнее здесь: https://stackoverflow.com/questions/787 ... k-to-float

1721129696

Anonymous

У меня есть фрагмент кода, который разбивает некоторые данные на ряды, вносит некоторые изменения, в том числе потенциально преобразует несколько значений в NaN, а затем в конечном итоге объединяет эти ряды в кадр данных.
(см. упрощенный код ниже)
sers = []

for item in items:
type_name = item.name
values = {pd.to_datetime(value.date_string): value.doc_count for value in item.values}
series = pd.Series(values, name=type_name, dtype=pd.Int64Dtype())
reindexed_series = series.reindex(date_range, fill_value=0)
exclude_inapplicable_days(reindexed_series, type_name)
apply_offset(reindexed_series, type_name)
sers.append(reindexed_series)

df = pd.DataFrame(sers)

в ignore_inapplicable_days и apply_offset Я меняю некоторые значения в этой серии на NaN, что имеет для нас другое значение, чем 0, которое мы использовали в качестве fill_value. 
Все хорошо, пока это не просто серия, у них тип данных int благодаря его указанию, но df превращает все это обратно в числа с плавающей запятой, несмотря на все серии в sers
code> имеющий типы int, совместимые с NaN.
Почему это происходит? Есть ли способ обойти это, не повторяя df и не меняя все обратно?
Воспроизводимый пример:
import pandas as pd

date_range = pd.date_range(start="2023-01-01", end="2023-01-05")

items = [
{"name": "Type1", "values": [{"date_string": "2023-01-01", "doc_count": 1},
{"date_string": "2023-01-02", "doc_count": 2},
{"date_string": "2023-01-03", "doc_count": 3},
{"date_string": "2023-01-04", "doc_count": 4},
{"date_string": "2023-01-05", "doc_count": 5}]},
{"name": "Type2", "values": [{"date_string": "2023-01-01", "doc_count": 6},
{"date_string": "2023-01-02", "doc_count": 7},
{"date_string": "2023-01-03", "doc_count": 8},
{"date_string": "2023-01-04", "doc_count": 9},
{"date_string": "2023-01-05", "doc_count": 10}]}
]

def exclude_inapplicable_days(series, type_name):
series[series.index[0]] = pd.NA
print(f"After exclusion in {type_name}: {series.dtype}")

def apply_offset(series, type_name):
offset = {
"Type1": 2,
"Type2": 1
}[type_name]
if offset > 0:
series.iloc[-offset:] = pd.NA
print(f"After offset in {type_name}: {series.dtype}")

sers = []
for item in items:
type_name = item['name']
values = {pd.to_datetime(val['date_string']): val['doc_count'] for val in item['values']}
series = pd.Series(values, name=type_name, dtype=pd.Int64Dtype())
reindexed_series = series.reindex(date_range, fill_value=0)
exclude_inapplicable_days(reindexed_series, type_name)
apply_offset(reindexed_series, type_name)
sers.append(reindexed_series)

df = pd.DataFrame(sers)

print("DataFrame dtypes:")
print(df.dtypes)
 

Подробнее здесь: [url]https://stackoverflow.com/questions/78753666/pandas-turns-pd-int64dtype-back-to-float[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему мой float:left и float:none совершенно одинаковы и недостаточно далеко влево/не по центру [дубликат]

Последнее сообщение Anonymous « 27 ноя 2024, 07:40
Добавлено в форуме CSS

Anonymous » 27 ноя 2024, 07:40 » в форуме CSS

Я использую neocities для создания веб-сайта, и на данный момент я обнаружил, что использование div.nameofdiv (то, что говорят все веб-сайты, которые я пробовал) не работает, но #nameofdiv работает, я пытаюсь создайте сайт, который включает в себя...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
27 ноя 2024, 07:40
Не может применить + оператор между серией [float] и float

Последнее сообщение Anonymous « 24 апр 2025, 18:00
Добавлено в форуме Python

Anonymous » 24 апр 2025, 18:00 » в форуме Python

Я разрабатываю индикатор в Indie . Я пытаюсь вычислять Bollinger Bands и каналы Keltner , но я сталкиваюсь с ошибкой при добавлении серии к float значение.
Вот сообщение об ошибке:

typred> typred> и

Вот соответствующий фрагмент кода:
sDev =...

0 Ответы

5 Просмотры

Последнее сообщение Anonymous
24 апр 2025, 18:00
Pos arg 1 из тип не совпадает с параметром типа

Последнее сообщение Anonymous « 30 апр 2025, 17:23
Добавлено в форуме Python

Anonymous » 30 апр 2025, 17:23 » в форуме Python

Я работаю над индикатором Indie V5, который применяет EMA к серии цен, но я сталкиваюсь с этой ошибкой при вызове ema.new () :

Ошибка: 25:21 не смог найти определение функции, которая соответствует indie.algorithm.meam.new upper_band:...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
30 апр 2025, 17:23
Django tinymce превращает все текстовые поля в редактор форматированного текста

Последнее сообщение Anonymous « 03 окт 2024, 12:56
Добавлено в форуме Python

Anonymous » 03 окт 2024, 12:56 » в форуме Python

Я использую DRF в качестве серверной части. Я настроил Django Parler для управления своими переводами.
Я хотел бы использовать TinyMCE и обычные текстовые поля на одной странице администратора.
Это моя модель:from django.db import models
from...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
03 окт 2024, 12:56
C++ превращает тип структуры во ввод строкового типа

Последнее сообщение Anonymous « 04 ноя 2024, 02:10
Добавлено в форуме C++

Anonymous » 04 ноя 2024, 02:10 » в форуме C++

Я пытаюсь ввести формат даты «гггг.мм.дд», но определил его как структуру. Когда я пытаюсь получить разницу между двумя датами, это не сработает из-за знака . поэтому я пытаюсь ввести дату в виде строки, а не структуры.
#include
#include
using...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
04 ноя 2024, 02:10

Вернуться в «Python»