Моделирование байесовской иерархической линейной регрессии (частичный опрос) с использованием PYMC

Моделирование байесовской иерархической линейной регрессии (частичный опрос) с использованием PYMC ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Моделирование байесовской иерархической линейной регрессии (частичный опрос) с использованием PYMC

Цитата

Сообщение Anonymous » 02 июл 2024, 14:52

Набор данных:

У меня есть набор данных по штатам США, показывающий уровень смертности от сердечно-сосудистых заболеваний в зависимости от различных характеристик, например AQI, ожирение и т. д.
Цель:
Я хочу спрогнозировать уровень смертности (значение_данных), используя заданные функции.
Модель:
Используя корреляционную матрицу, я обнаружил, что уровень смертности больше коррелирует со значениями AQI, ожирения, температуры и предыдущего года.
Итак, я определяю свою модель следующим образом:

Код: Выделить всё

import pymc as pm
import numpy as np

# Preparing the data
cleaned_data['LocationDesc_encoded'] = cleaned_data['LocationDesc'].astype('category').cat.codes

# Define the model
with pm.Model() as hierarchical_model:
# Hyperpriors for group nodes
mu_a = pm.Normal('mu_a', mu=0, sigma=1)
sigma_a = pm.HalfCauchy('sigma_a', beta=1)

# Priors for individual intercepts
a = pm.Normal('a', mu=mu_a, sigma=sigma_a, shape=len(cleaned_data['LocationDesc_encoded'].unique()))

# Hyperpriors for group slopes
mu_b = pm.Normal('mu_b', mu=0, sigma=1)
sigma_b = pm.HalfCauchy('sigma_b', beta=1)

# Priors for individual slopes
b = pm.Normal('b', mu=mu_b, sigma=sigma_b, shape=(len(cleaned_data['LocationDesc_encoded'].unique()), 4))

# Model error
sigma = pm.HalfCauchy('sigma', beta=1)

# Expected value
mu = a[cleaned_data['LocationDesc_encoded'].values] + \
b[cleaned_data['LocationDesc_encoded'].values, 0] * cleaned_data['obesity_Prevalence'] + \
b[cleaned_data['LocationDesc_encoded'].values, 1] * cleaned_data['data_value_py'] + \
b[cleaned_data['LocationDesc_encoded'].values, 2] * cleaned_data['Avg Temp(°F)'] + \
b[cleaned_data['LocationDesc_encoded'].values, 3] * cleaned_data['AQI']

# Likelihood
Y_obs = pm.Normal('Y_obs', mu=mu, sigma=sigma, observed=cleaned_data['Data_Value'])

# Sampling from the posterior distribution
trace = pm.sample(5000, tune=1000, return_inferencedata=True)

Правильно ли определена моя модель?
Мы рассчитать точность по данным испытаний. Итак, как я могу спрогнозировать значения данных (уровень смертности) для тестовых данных, чтобы я мог рассчитать RMSE?
Различные ресурсы рассчитывают RMSE на данные, которые они использовали для нахождения апостериорного распределения. Правильный ли способ оценки модели?

Подробнее здесь: https://stackoverflow.com/questions/786 ... using-pymc

1719921164

Anonymous

Набор данных:
[img]https://i.sstatic.net/DgvtFw4E.png[/img]
У меня есть набор данных по штатам США, показывающий уровень смертности от сердечно-сосудистых заболеваний в зависимости от различных характеристик, например AQI, ожирение и т. д.
Цель:
Я хочу спрогнозировать уровень смертности (значение_данных), используя заданные функции.
Модель:
Используя корреляционную матрицу, я обнаружил, что уровень смертности больше коррелирует со значениями AQI, ожирения, температуры и предыдущего года.
Итак, я определяю свою модель следующим образом:
[code]import pymc as pm
import numpy as np

# Preparing the data
cleaned_data['LocationDesc_encoded'] = cleaned_data['LocationDesc'].astype('category').cat.codes

# Define the model
with pm.Model() as hierarchical_model:
# Hyperpriors for group nodes
mu_a = pm.Normal('mu_a', mu=0, sigma=1)
sigma_a = pm.HalfCauchy('sigma_a', beta=1)

# Priors for individual intercepts
a = pm.Normal('a', mu=mu_a, sigma=sigma_a, shape=len(cleaned_data['LocationDesc_encoded'].unique()))

# Hyperpriors for group slopes
mu_b = pm.Normal('mu_b', mu=0, sigma=1)
sigma_b = pm.HalfCauchy('sigma_b', beta=1)

# Priors for individual slopes
b = pm.Normal('b', mu=mu_b, sigma=sigma_b, shape=(len(cleaned_data['LocationDesc_encoded'].unique()), 4))

# Model error
sigma = pm.HalfCauchy('sigma', beta=1)

# Expected value
mu = a[cleaned_data['LocationDesc_encoded'].values] + \
b[cleaned_data['LocationDesc_encoded'].values, 0] * cleaned_data['obesity_Prevalence'] + \
b[cleaned_data['LocationDesc_encoded'].values, 1] * cleaned_data['data_value_py'] + \
b[cleaned_data['LocationDesc_encoded'].values, 2] * cleaned_data['Avg Temp(°F)'] + \
b[cleaned_data['LocationDesc_encoded'].values, 3] * cleaned_data['AQI']

# Likelihood
Y_obs = pm.Normal('Y_obs', mu=mu, sigma=sigma, observed=cleaned_data['Data_Value'])

# Sampling from the posterior distribution
trace = pm.sample(5000, tune=1000, return_inferencedata=True)

[/code]
[list]
[*]Правильно ли определена моя модель?

[*]Мы рассчитать точность по данным испытаний. Итак, как я могу спрогнозировать значения данных (уровень смертности) для тестовых данных, чтобы я мог рассчитать RMSE?

[*]Различные ресурсы рассчитывают RMSE на данные, которые они использовали для нахождения апостериорного распределения. Правильный ли способ оценки модели?

[/list] 

Подробнее здесь: [url]https://stackoverflow.com/questions/78696841/baysian-hirerchical-linear-regression-partial-polling-modeling-using-pymc[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как использовать PYMC, PYMC-маркетинг и Numpyro вместе, когда им требуются противоречивые версии JAX?

Последнее сообщение Anonymous « 31 июл 2025, 19:05
Добавлено в форуме Python

Anonymous » 31 июл 2025, 19:05 » в форуме Python

Я пытаюсь построить вероятностную модель на питоне, которая требует использования pymc , pymc-marketing и numpyro в одном и том же сценарии .

. 64-битный

Установленные пакеты:

pymc (последний)
pymc-marketing (последний)
numpyro 0.18.0...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
31 июл 2025, 19:05
Как использовать PYMC, PYMC-маркетинг и Numpyro вместе, когда им требуются противоречивые версии JAX?

Последнее сообщение Anonymous « 01 авг 2025, 17:44
Добавлено в форуме Python

Anonymous » 01 авг 2025, 17:44 » в форуме Python

Я пытаюсь построить вероятностную модель на питоне, которая требует использования pymc , pymc-marketing и numpyro в одном и том же сценарии .

. 64-битный

Установленные пакеты:

pymc (последний)
pymc-marketing (последний)
numpyro 0.18.0...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
01 авг 2025, 17:44
Boost.Asio, как работает опрос io_context и как проводить опрос в узком цикле?

Последнее сообщение Anonymous « 16 июл 2024, 19:41
Добавлено в форуме C++

Anonymous » 16 июл 2024, 19:41 » в форуме C++

Я экспериментировал с Boost.Asio и хочу иметь возможность проводить опросы, а не просто выполнять io_context.run(). Мое приложение в настоящее время состоит из двух объектов io_context, каждый из которых работает в отдельном потоке выполнения. Все...

0 Ответы

38 Просмотры

Последнее сообщение Anonymous
16 июл 2024, 19:41
Tutor LMS Pro Как добавить форму или опрос для обратной связи о курсе (опрос)

Последнее сообщение Anonymous « 22 окт 2024, 18:05
Добавлено в форуме Php

Anonymous » 22 окт 2024, 18:05 » в форуме Php

Я настроил модуль электронного обучения с помощью Tutor LMS pro, и клиент согласен со всеми функциями, кроме отзывов о курсе.

Клиенту необходимо показать специальный опрос для получения отзывов о курсе, но Tutor LMS pro предусматривает только одно...

0 Ответы

39 Просмотры

Последнее сообщение Anonymous
22 окт 2024, 18:05
Дендрограмма иерархической кластеризации с использованием Python

Последнее сообщение Anonymous « 12 дек 2024, 22:53
Добавлено в форуме Python

Anonymous » 12 дек 2024, 22:53 » в форуме Python

Теория графов и интеллектуальный анализ данных — две области информатики, в которых я пока новичок, поэтому извините за мои базовые знания.

Меня попросили построить дендрограмму иерархически кластеризованного графа.
Вводные данные, которые мне были...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
12 дек 2024, 22:53

Вернуться в «Python»