Как написать общую функцию Python, которая работает с аргументами Python, Numpy или Pandas и возвращает тот же тип

Как написать общую функцию Python, которая работает с аргументами Python, Numpy или Pandas и возвращает тот же тип ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как написать общую функцию Python, которая работает с аргументами Python, Numpy или Pandas и возвращает тот же тип

Цитата

Сообщение Anonymous » 23 ноя 2024, 04:10

Как лучше всего написать функцию Python, которая может использоваться с типами данных float, Numpy или Pandas и всегда возвращает тот же тип данных, что и переданные ей аргументы. Загвоздка в том, что расчет включает одно или несколько значений с плавающей запятой.
Например. пример игрушки:

Код: Выделить всё

def mycalc(x, a=1.0, b=1.0):
return a * x + b

(Здесь я значительно упростил проблему, поскольку в идеале мне хотелось бы иметь более одного входного аргумента, например x, но вы можете предположить, что функция векторизована в в том смысле, что он работает с аргументами массива Numpy и сериями Pandas).
Для массивов Numpy и серий Pandas это работает нормально, поскольку тип dtype определяется входными аргументами.

Код: Выделить всё

import numpy as np
x = np.array([1, 2, 3], dtype="float32")
print(mycalc(x).dtype)  # float32

Код: Выделить всё

import pandas as pd
x = pd.Series([1.0, 2.0, 3.0], dtype="float32")
print(mycalc(x).dtype)  # float32

Но при использовании numpy с плавающей запятой более низкой точности dtype «поднимается» до float64, предположительно из-за аргументов с плавающей запятой в формуле:

Код: Выделить всё

x = np.float32(1.0)
print(mycalc(x).dtype)  # float64

В идеале я бы хотел, чтобы функция работала с числами с плавающей запятой Python, скалярами numpy, массивами numpy, сериями Pandas, массивами Jax и даже символическими переменными Sympy, если это возможно.
/>Но я не хочу загромождать функцию слишком большим количеством дополнительных операторов для обработки каждого случая.
Я попробовал это, которое работает со скалярами Numpy, но ломается, когда вы предоставлять массивы или сериал:

Код: Выделить всё

def mycalc(x, a=1.0, b=1.0):
a = type(x)(a)
b = type(x)(b)
return a * x + b

assert isinstance(mycalc(1.0), float)
assert isinstance(mycalc(np.float32(1.0)), np.float32)
mycalc(np.array([1, 2, 3], dtype="float32"))  # raises TypeError: expected a sequence of integers or a single integer, got '1.0'

Кроме того, здесь есть ответ на аналогичный вопрос, который использует функцию декоратора для создания копий входного аргумента, что является хорошей идеей, но это было только для расширения функции из Массивы Numpy преобразуются в серии Pandas и не работают с числами с плавающей точкой Python или скалярами Numpy.

Код: Выделить всё

import functools

def apply_to_pandas(func):
@functools.wraps(func)
def wrapper_func(x, *args, **kwargs):
if isinstance(x, (np.ndarray, list)):
out = func(x, *args, **kwargs)
else:
out = x.copy(deep=False)
out[:] = np.apply_along_axis(func, 0, x, *args, **kwargs)
return out
return wrapper_func

@apply_to_pandas
def mycalc(x, a=1.0, b=1.0):
return a * x + b

mycalc(1.0) # TypeError: copy() got an unexpected keyword argument 'deep'

Обновление
Как отметил @Dunes в комментариях ниже, это больше не является проблемой в Numpy версии 2.x, как описано здесь, в Руководстве по миграции Numpy 2.0.
В новой версии (np.float32(1.0) + 1).dtype == "float32". Поэтому исходная функция выше возвращает результат того же типа d, что и входной x.

Подробнее здесь: https://stackoverflow.com/questions/792 ... r-pandas-a

1732324257

Anonymous

Как лучше всего написать функцию Python, которая может использоваться с типами данных float, Numpy или Pandas и всегда возвращает тот же тип данных, что и переданные ей аргументы.  Загвоздка в том, что расчет включает одно или несколько значений с плавающей запятой.
Например. пример игрушки:
[code]def mycalc(x, a=1.0, b=1.0):
return a * x + b
[/code]
(Здесь я значительно упростил проблему, поскольку в идеале мне хотелось бы иметь более одного входного аргумента, например x, но вы можете предположить, что функция векторизована в в том смысле, что он работает с аргументами массива Numpy и сериями Pandas).
Для массивов Numpy и серий Pandas это работает нормально, поскольку тип dtype определяется входными аргументами.
[code]import numpy as np
x = np.array([1, 2, 3], dtype="float32")
print(mycalc(x).dtype)  # float32
[/code]
[code]import pandas as pd
x = pd.Series([1.0, 2.0, 3.0], dtype="float32")
print(mycalc(x).dtype)  # float32
[/code]
Но при использовании numpy с плавающей запятой более низкой точности dtype «поднимается» до float64, предположительно из-за аргументов с плавающей запятой в формуле:
[code]x = np.float32(1.0)
print(mycalc(x).dtype)  # float64
[/code]
В идеале я бы хотел, чтобы функция работала с числами с плавающей запятой Python, скалярами numpy, массивами numpy, сериями Pandas, массивами Jax и даже символическими переменными Sympy, если это возможно.
/>Но я не хочу загромождать функцию слишком большим количеством дополнительных операторов для обработки каждого случая.
Я попробовал это, которое работает со скалярами Numpy, но ломается, когда вы предоставлять массивы или сериал:
[code]def mycalc(x, a=1.0, b=1.0):
a = type(x)(a)
b = type(x)(b)
return a * x + b

assert isinstance(mycalc(1.0), float)
assert isinstance(mycalc(np.float32(1.0)), np.float32)
mycalc(np.array([1, 2, 3], dtype="float32"))  # raises TypeError: expected a sequence of integers or a single integer, got '1.0'
[/code]
Кроме того, здесь есть ответ на аналогичный вопрос, который использует функцию декоратора для создания копий входного аргумента, что является хорошей идеей, но это было только для расширения функции из Массивы Numpy преобразуются в серии Pandas и не работают с числами с плавающей точкой Python или скалярами Numpy.
[code]import functools

def apply_to_pandas(func):
@functools.wraps(func)
def wrapper_func(x, *args, **kwargs):
if isinstance(x, (np.ndarray, list)):
out = func(x, *args, **kwargs)
else:
out = x.copy(deep=False)
out[:] = np.apply_along_axis(func, 0, x, *args, **kwargs)
return out
return wrapper_func

@apply_to_pandas
def mycalc(x, a=1.0, b=1.0):
return a * x + b

mycalc(1.0) # TypeError: copy() got an unexpected keyword argument 'deep'
[/code]
[b]Обновление[/b]
Как отметил @Dunes в комментариях ниже, это больше не является проблемой в Numpy версии 2.x, как описано здесь, в Руководстве по миграции Numpy 2.0.
В новой версии (np.float32(1.0) + 1).dtype == "float32". Поэтому исходная функция выше возвращает результат того же типа d, что и входной x. 

Подробнее здесь: [url]https://stackoverflow.com/questions/79212020/how-to-write-a-generic-python-function-that-works-with-python-numpy-or-pandas-a[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как написать полиморфную функцию, расширяя абстрактный класс, который реализует общую функцию интерфейса?

Последнее сообщение Anonymous « 23 июл 2025, 23:58
Добавлено в форуме JAVA

Anonymous » 23 июл 2025, 23:58 » в форуме JAVA

Я пытаюсь реализовать наблюдаемый шаблон с помощью абстрактного класса (так что мои подклассы не обеспечивают общую реализацию). Я хочу полиморфные функции для разных типов наблюдателей. public interface IObservable { /* also used version...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
23 июл 2025, 23:58
Как написать полиморфную функцию, расширяя абстрактный класс, который реализует общую функцию интерфейса?

Последнее сообщение Anonymous « 24 июл 2025, 01:22
Добавлено в форуме JAVA

Anonymous » 24 июл 2025, 01:22 » в форуме JAVA

Я пытаюсь реализовать наблюдаемый шаблон с помощью абстрактного класса (так что мои подклассы не обеспечивают общую реализацию). Я хочу полиморфные функции для разных типов наблюдателей. public interface IObservable { /* also used version...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
24 июл 2025, 01:22
Передача масштабированного текста на том же коде, тот же хром, тот же ноутбук и тот же разрешение монитора отличается пр

Последнее сообщение Anonymous « 14 июл 2025, 14:21
Добавлено в форуме Html

Anonymous » 14 июл 2025, 14:21 » в форуме Html

У меня есть этот маленький кодепен:
Это фрагмент кода:

Подробнее здесь:

0 Ответы

9 Просмотры

Последнее сообщение Anonymous
14 июл 2025, 14:21
Передача масштабированного текста на том же коде, тот же хром, тот же ноутбук и тот же разрешение монитора отличается пр

Последнее сообщение Anonymous « 14 июл 2025, 14:21
Добавлено в форуме CSS

Anonymous » 14 июл 2025, 14:21 » в форуме CSS

У меня есть этот маленький кодепен:
Это фрагмент кода:

Подробнее здесь:

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
14 июл 2025, 14:21
Попробуйте написать общую бесплатную функцию на Cython, но получите ошибку

Последнее сообщение Anonymous « 07 дек 2024, 12:54
Добавлено в форуме Python

Anonymous » 07 дек 2024, 12:54 » в форуме Python

Информация об ошибке:

.\tools.c(17775): ошибка C2069: преобразование из «недействительного» в непустое
. \tools.c(17775): ошибка C2036: «void *»: неизвестный размер

мой код:
Эта функция пытается освободить память одномерного массива или двумерного...

0 Ответы

6 Просмотры

Последнее сообщение Anonymous
07 дек 2024, 12:54

Вернуться в «Python»