Дисперсия Уэлфорда отличается от дисперсии Numpy

Дисперсия Уэлфорда отличается от дисперсии Numpy ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Дисперсия Уэлфорда отличается от дисперсии Numpy

Цитата

Сообщение Anonymous » 20 апр 2024, 10:31

Я хочу использовать метод Уэлфорда для вычисления текущей дисперсии и среднего значения. Я наткнулся на эту реализацию метода Уэлфорда в Python. Однако при тестировании, чтобы еще раз проверить, что он дает тот же результат, что и стандартная реализация Numpy для расчета дисперсии, я обнаружил, что есть разница в выводе.
Выполнение следующего кода (с использованием модуля unittest Python) показывает, что они дают разные результаты (даже после многократного тестирования):

Код: Выделить всё

random_sample = np.random.normal(0, 1, 100)
std = np.var(random_sample, dtype=np.longdouble)
mean = np.mean(random_sample, dtype=np.longdouble)
welford = Welford()
welford.add_all(random_sample)

self.assertAlmostEqual(mean, welford.mean)
self.assertAlmostEqual(var, welford.var_s)

>> AssertionError: 1.1782075496578717837 != 1.1901086360180526 within 7 places (0.011901086360180828804 difference)

Интересно, что существует только разница в дисперсии, а не в среднем значении.
Для моих целей разница в 0,012 достаточно значительна, чтобы ее можно было влияют на мои результаты.
Почему такая разница? Может ли это быть связано с накоплением ошибок с плавающей запятой? Если да, то лучше всего переписать пакет, чтобы использовать класс Decimal?

Подробнее здесь: https://stackoverflow.com/questions/783 ... y-variance

1713598303

Anonymous

Я хочу использовать метод Уэлфорда для вычисления текущей дисперсии и среднего значения. Я наткнулся на эту реализацию метода Уэлфорда в Python. Однако при тестировании, чтобы еще раз проверить, что он дает тот же результат, что и стандартная реализация Numpy для расчета дисперсии, я обнаружил, что есть разница в выводе.
Выполнение следующего кода (с использованием модуля unittest Python) показывает, что они дают разные результаты (даже после многократного тестирования):
[code]random_sample = np.random.normal(0, 1, 100)
std = np.var(random_sample, dtype=np.longdouble)
mean = np.mean(random_sample, dtype=np.longdouble)
welford = Welford()
welford.add_all(random_sample)

self.assertAlmostEqual(mean, welford.mean)
self.assertAlmostEqual(var, welford.var_s)

>> AssertionError: 1.1782075496578717837 != 1.1901086360180526 within 7 places (0.011901086360180828804 difference)
[/code]
Интересно, что существует только разница в дисперсии, а не в среднем значении.
Для моих целей разница в 0,012 достаточно значительна, чтобы ее можно было влияют на мои результаты.
Почему такая разница? Может ли это быть связано с накоплением ошибок с плавающей запятой? Если да, то лучше всего переписать пакет, чтобы использовать класс Decimal? 

Подробнее здесь: [url]https://stackoverflow.com/questions/78357085/welford-variance-differs-from-numpy-variance[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Mypy и дисперсия функции, возвращающей список подклассов на основе входного параметра

Последнее сообщение Anonymous « 05 окт 2024, 17:13
Добавлено в форуме Python

Anonymous » 05 окт 2024, 17:13 » в форуме Python

Я пытаюсь правильно аннотировать свой код. Вот пример фрагмента, позволяющего воссоздать мою проблему:
from pydantic import BaseModel
from typing import TypeVar

class Shape(BaseModel):
name: str

class Circle(Shape):
diameter: float

class...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
05 окт 2024, 17:13
Бинарная классификация гауссовского процесса: почему дисперсия с GPy намного меньше, чем с scikit-learn?

Последнее сообщение Anonymous « 14 окт 2024, 16:10
Добавлено в форуме Python

Anonymous » 14 окт 2024, 16:10 » в форуме Python

Я изучаю двоичную классификацию с помощью гауссовских процессов и сравниваю GPy с scikit-learn для игрушечной 1D-задачи, вдохновленной сообщением в блоге Мартина Крассера. Обе реализации (GPy и scikit-learn), похоже, используют одинаковую настройку...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
14 окт 2024, 16:10
Бинарная классификация гауссовского процесса: почему дисперсия с GPy намного меньше, чем с scikit-learn?

Последнее сообщение Anonymous « 14 окт 2024, 16:35
Добавлено в форуме Python

Anonymous » 14 окт 2024, 16:35 » в форуме Python

Я изучаю двоичную классификацию с помощью гауссовских процессов и сравниваю GPy с scikit-learn для игрушечной 1D-задачи, вдохновленной сообщением в блоге Мартина Крассера. Обе реализации (GPy и scikit-learn), похоже, используют одинаковую настройку...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
14 окт 2024, 16:35
Бинарная классификация гауссовского процесса: почему дисперсия с GPy намного меньше, чем с scikit-learn?

Последнее сообщение Anonymous « 18 окт 2024, 04:55
Добавлено в форуме Python

Anonymous » 18 окт 2024, 04:55 » в форуме Python

Я изучаю двоичную классификацию с помощью гауссовских процессов и сравниваю GPy с scikit-learn для игрушечной 1D-задачи, вдохновленной сообщением в блоге Мартина Крассера. Обе реализации (GPy и scikit-learn), похоже, используют одинаковую настройку...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
18 окт 2024, 04:55
Поиск мультиколлинеарности между атрибутами с использованием коэффициента инфляции дисперсии

Последнее сообщение Гость « 22 сен 2023, 16:40
Добавлено в форуме Python

Гость » 22 сен 2023, 16:40 » в форуме Python

Я пытаюсь понять мультиколлинеарность, которая может существовать между различными атрибутами/переменными в наборе данных, обычно для задачи регрессии с использованием VIF. Для этой цели я использую набор данных Boston Housing. Обнаружив...

0 Ответы

36 Просмотры

Последнее сообщение Гость
22 сен 2023, 16:40

Вернуться в «Python»