Проверка типов данных, условная логика и использование np.where,df.sort_values и cumsum

Проверка типов данных, условная логика и использование np.where,df.sort_values и cumsum ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Проверка типов данных, условная логика и использование np.where,df.sort_values и cumsum

Цитата

Сообщение Anonymous » 01 ноя 2024, 02:01

Это вопрос, касающийся вычисления значения флага 0 или 1 с использованием нескольких входных значений в кадре данных pandas. В то же время, если какое-либо из входных значений не является числом с плавающей запятой (или пустым, т.е. NaN в pandas), тогда флаг будет пустым, т.е. ''
Скажем, cols_to_check представляет список столбцов, которые служат входными данными.

Код: Выделить всё

# Function to check if a value is a floating point number
def is_floating_point(aString):
if (aString==aString): #this is to handle NaN values
try:
float(aString)
return True
except (ValueError, TypeError):
return False
else:
return False

# Check if all input values in the specified columns are floating points
data['valid'] = data[cols_to_check].applymap(is_floating_point).all(axis=1)

# Calculate the flag value
data['flag'] = np.where(data['valid'], data.sort_values(cols_to_check, ascending=[True, True, False, False, False,False]).groupby("emp_f8")["Rank"].cumsum(), '')
# data['flag'] = data.sort_values(cols_to_check, ascending=[True, True, False, False, False,False]).groupby("emp_f8")["Rank"].cumsum()

# Ensure flag is 0 or 1 (unless input data quality issue then it'd be '')
data['flag'] = np.where(data['flag'].astype(str) == '1','1', np.where(data['flag'].astype(str) == '', '', '0'))

В приведенном выше коде я, похоже, получаю правильные значения флагов, если не проверяю допустимый набор входных данных. Если я проверю достоверность набора входных данных (т. е. все входные значения имеют плавающую запятую, а не значение Null/ Blank/ NaN), то я не получу правильные значения флагов.
Почему бы это сделать? это не будет работать правильно, если я включу часть, в которой написано np.where(data['valid'],
По моему мнению, проверка типа данных и Операторы np.where вызывают неожиданное поведение. Я получаю значения флага 1, тогда как для данного набора входных данных я должен получать значения флага 0 и 1.
Обновление: я Пытаюсь предоставить образцы данных, но у меня возникают трудности с аккуратным представлением данных в таблицах. Попробовал описанные здесь советы по форматированию таблиц, но они не работают. В любом случае, вот они.

Код: Выделить всё

emp_f8      emp_l3  3gee    3hee    3iee    4bee       4dee
60033312    002      19     1       64      454133     426717.24
23232354    001      2      1       15.2    98353.39    98538.43
23232354    005      3      1       60.8    106493.24   21262.34

Для первой строки данных флаг будет равен 1. Следующие две строки имеют одинаковые значения emp_f8; поэтому только одна строка будет иметь значение флага 1, а другая — 0. Надеюсь, это поможет.

Подробнее здесь: https://stackoverflow.com/questions/791 ... es-and-cum

1730415696

Anonymous

Это вопрос, касающийся вычисления значения флага 0 или 1 с использованием нескольких входных значений в кадре данных pandas. В то же время, если какое-либо из входных значений не является числом с плавающей запятой (или пустым, т.е. NaN в pandas), тогда флаг будет пустым, т.е. ''
Скажем, cols_to_check представляет список столбцов, которые служат входными данными.
[code]# Function to check if a value is a floating point number
def is_floating_point(aString):
if (aString==aString): #this is to handle NaN values
try:
float(aString)
return True
except (ValueError, TypeError):
return False
else:
return False

# Check if all input values in the specified columns are floating points
data['valid'] = data[cols_to_check].applymap(is_floating_point).all(axis=1)

# Calculate the flag value
data['flag'] = np.where(data['valid'], data.sort_values(cols_to_check, ascending=[True, True, False, False, False,False]).groupby("emp_f8")["Rank"].cumsum(), '')
# data['flag'] = data.sort_values(cols_to_check, ascending=[True, True, False, False, False,False]).groupby("emp_f8")["Rank"].cumsum()

# Ensure flag is 0 or 1 (unless input data quality issue then it'd be '')
data['flag'] = np.where(data['flag'].astype(str) == '1','1', np.where(data['flag'].astype(str) == '', '', '0'))
[/code]
В приведенном выше коде я, похоже, получаю правильные значения флагов, если не проверяю допустимый набор входных данных. Если я проверю достоверность набора входных данных (т. е. все входные значения имеют плавающую запятую, а не значение Null/ Blank/ NaN), то я не получу правильные значения флагов.
Почему бы это сделать? это не будет работать правильно, если я включу часть, в которой написано np.where(data['valid'],
По моему мнению, проверка типа данных и Операторы np.where вызывают неожиданное поведение. Я получаю значения флага 1, тогда как для данного набора входных данных я должен получать значения флага 0 и 1.
Обновление: я Пытаюсь предоставить образцы данных, но у меня возникают трудности с аккуратным представлением данных в таблицах. Попробовал описанные здесь советы по форматированию таблиц, но они не работают. В любом случае, вот они.[code]emp_f8      emp_l3  3gee    3hee    3iee    4bee       4dee
60033312    002      19     1       64      454133     426717.24
23232354    001      2      1       15.2    98353.39    98538.43
23232354    005      3      1       60.8    106493.24   21262.34
[/code]
Для первой строки данных флаг будет равен 1. Следующие две строки имеют одинаковые значения emp_f8; поэтому только одна строка будет иметь значение флага 1, а другая — 0. Надеюсь, это поможет. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79141079/data-type-checking-conditional-logic-and-use-of-np-where-df-sort-values-and-cum[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Проверка типов данных, условная логика и использование np.where,df.sort_values и cumsum

Последнее сообщение Anonymous « 30 окт 2024, 15:36
Добавлено в форуме Python

Anonymous » 30 окт 2024, 15:36 » в форуме Python

Это вопрос, касающийся вычисления значения флага 0 или 1 с использованием нескольких входных значений в кадре данных pandas. В то же время, если какое-либо из входных значений не является числом с плавающей запятой (или пустым, т.е. NaN в pandas),...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
30 окт 2024, 15:36
Проверка типов данных, условная логика и использование np.where,df.sort_values и cumsum

Последнее сообщение Anonymous « 30 окт 2024, 20:04
Добавлено в форуме Python

Anonymous » 30 окт 2024, 20:04 » в форуме Python

Это вопрос, касающийся вычисления значения флага 0 или 1 с использованием нескольких входных значений в кадре данных pandas. В то же время, если какое-либо из входных значений не является числом с плавающей запятой (или пустым, т.е. NaN в pandas),...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
30 окт 2024, 20:04
Проверка типов данных, условная логика и использование np.where,df.sort_values и cumsum

Последнее сообщение Anonymous « 30 окт 2024, 20:55
Добавлено в форуме Python

Anonymous » 30 окт 2024, 20:55 » в форуме Python

Это вопрос, касающийся вычисления значения флага 0 или 1 с использованием нескольких входных значений в кадре данных pandas. В то же время, если какое-либо из входных значений не является числом с плавающей запятой (или пустым, т.е. NaN в pandas),...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
30 окт 2024, 20:55
Приложению Android не удается загрузить локализованные ресурсы (values-uk, Values-ru) на определенных устройствах в зави

Последнее сообщение Anonymous « 19 дек 2024, 00:23
Добавлено в форуме Android

Anonymous » 19 дек 2024, 00:23 » в форуме Android

У меня есть приложение для Android, которое поддерживает несколько языков: английский, украинский и русский. Приложение отлично работает при установке непосредственно из Android Studio на любое устройство . Однако при загрузке приложения из Google...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
19 дек 2024, 00:23
Приложению Android не удается загрузить локализованные ресурсы (values-uk, Values-ru) на определенных устройствах в зави

Последнее сообщение Anonymous « 29 дек 2024, 13:53
Добавлено в форуме Android

Anonymous » 29 дек 2024, 13:53 » в форуме Android

У меня есть приложение для Android, которое поддерживает несколько языков: английский, украинский и русский. Приложение отлично работает при установке непосредственно из Android Studio на любое устройство . Однако при загрузке приложения из Google...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
29 дек 2024, 13:53

Вернуться в «Python»

Проверка типов данных, условная логика и использование np.where,df.sort_values ​​и cumsum ⇐ Python

Быстрый ответ

Проверка типов данных, условная логика и использование np.where,df.sort_values и cumsum ⇐ Python