Попытка понять различия в взвешенных выходах логистической регрессии между StatsModels и RESERE и SRVYR Packages

Попытка понять различия в взвешенных выходах логистической регрессии между StatsModels и RESERE и SRVYR Packages ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Попытка понять различия в взвешенных выходах логистической регрессии между StatsModels и RESERE и SRVYR Packages

Цитата

Сообщение Anonymous » 04 фев 2025, 18:11

У меня есть вымышленный набор данных с взвешенным обследованием, который содержит информацию о цветах автомобилей респондентов и их ответе на вопрос «Мне нравится быстро водить». Я хотел бы выполнить регрессию, чтобы увидеть, изменяется ли вероятность немного с этим вопросом в зависимости от того, управляет ли респондент черный автомобиль. (Это не серьезный анализ; я просто представляю его с целью сравнения взвешенных регрессионных результатов в R и Python.) < /P>
Чтобы ответить на этот вопрос, я впервые забежал Взвешенная логистическая регрессия с использованием пакетов R's Survey и srvyr . Эта регрессия обеспечила тестовую статистику -1,18 для коэффициента цвета черного автомобиля и значение P 0,238. Однако, когда я запустил взвешенную логистическую регрессию в рамках StatsModels, я получил тестовую статистику -1,35 и значение P 0,177 для этого коэффициента. Я хотел бы понять, почему эти тестовые статистики различны, и делаю ли я какие -либо ошибки в своей настройке за любой тест, который мог бы объяснить это расхождение. Я удалил весовой компонент из каждого теста, мои тестовые статистики и значения P были почти идентичными. Следовательно, кажется, что эти две реализации по -разному обращаются с весами обследования. Тот же тетрадь, что и мой код Python.import pandas as pd
import statsmodels.formula.api as smf
import statsmodels.api as sm
%load_ext rpy2.ipython
%R library(dplyr)
%R library(srvyr)
%R library(survey)
%R library(broom)
import pandas as pd

df_car_survey = pd.read_csv(
'https://raw.githubusercontent.com/ifstudies/\
carsurveydata/refs/heads/main/car_survey.csv')

# Adding dummy columns for independent and dependent variables:

for column in ['Car_Color', 'Enjoy_Driving_Fast']:
df_car_survey = pd.concat([df_car_survey, pd.get_dummies(
df_car_survey[column], dtype = 'int', prefix = column)],
axis = 1)

df_car_survey.columns = [column.replace(' ', '_') for column in
df_car_survey.columns]

# Loading DataFrame into R and creating a survey design object:
# See https://tidy-survey-r.github.io/tidy-su ... ights.html
# for more details.
# This book was also inval
%Rpush df_car_survey
%R df_sdo % as_survey_design(\
weights = 'Weight')

print("Survey design object:")
%R print(df_sdo)

# Logistic regression in R:
# (This code was based on that found in
# https://tidy-survey-r.github.io/tidy-su ... eling.html )
%R logit_result

Подробнее здесь: https://stackoverflow.com/questions/794 ... ts-between

1738681912

Anonymous

 У меня есть вымышленный набор данных с взвешенным обследованием, который содержит информацию о цветах автомобилей респондентов и их ответе на вопрос «Мне нравится быстро водить». Я хотел бы выполнить регрессию, чтобы увидеть, изменяется ли вероятность  немного  с этим вопросом в зависимости от того, управляет ли респондент черный автомобиль. (Это не серьезный анализ; я просто представляю его с целью сравнения взвешенных регрессионных результатов в R и Python.) < /P>
Чтобы ответить на этот вопрос, я впервые забежал Взвешенная логистическая регрессия с использованием пакетов R's Survey  и srvyr . Эта регрессия обеспечила тестовую статистику -1,18 для коэффициента цвета черного автомобиля и значение P 0,238. Однако, когда я запустил взвешенную логистическую регрессию в рамках StatsModels, я получил тестовую статистику -1,35 и значение P 0,177 для этого коэффициента. Я хотел бы понять, почему эти тестовые статистики различны, и делаю ли я какие -либо ошибки в своей настройке за любой тест, который мог бы объяснить это расхождение. Я удалил весовой компонент из каждого теста, мои тестовые статистики и значения P были почти идентичными. Следовательно, кажется, что эти две реализации по -разному обращаются с весами обследования. Тот же тетрадь, что и мой код Python.import pandas as pd
import statsmodels.formula.api as smf
import statsmodels.api as sm
%load_ext rpy2.ipython
%R library(dplyr)
%R library(srvyr)
%R library(survey)
%R library(broom)
import pandas as pd

df_car_survey = pd.read_csv(
'https://raw.githubusercontent.com/ifstudies/\
carsurveydata/refs/heads/main/car_survey.csv')

# Adding dummy columns for independent and dependent variables:

for column in ['Car_Color', 'Enjoy_Driving_Fast']:
df_car_survey = pd.concat([df_car_survey, pd.get_dummies(
df_car_survey[column], dtype = 'int', prefix = column)],
axis = 1)

df_car_survey.columns = [column.replace(' ', '_') for column in
df_car_survey.columns]

# Loading DataFrame into R and creating a survey design object:
# See https://tidy-survey-r.github.io/tidy-survey-book/c10-sample-designs-replicate-weights.html
# for more details.
# This book was also inval
%Rpush df_car_survey
%R df_sdo % as_survey_design(\
weights = 'Weight')

print("Survey design object:")
%R print(df_sdo)

# Logistic regression in R:
# (This code was based on that found in
# https://tidy-survey-r.github.io/tidy-survey-book/c07-modeling.html )
%R logit_result 

Подробнее здесь: [url]https://stackoverflow.com/questions/79412165/trying-to-understand-differences-in-weighted-logistic-regression-outputs-between[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Попытка понять различия в взвешенных выходах логистической регрессии между StatsModels и RESERE и SRVYR Packages

Последнее сообщение Anonymous « 04 фев 2025, 19:55
Добавлено в форуме Python

Anonymous » 04 фев 2025, 19:55 » в форуме Python

У меня есть вымышленный набор данных с взвешенным обследованием, который содержит информацию о цветах автомобилей респондентов и их ответе на вопрос «Мне нравится быстро водить». Я хотел бы выполнить регрессию, чтобы увидеть, изменяется ли...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
04 фев 2025, 19:55
Ошибка сборки Xcode: «Отсутствует аргумент опции '-p, --packages '»

Последнее сообщение Anonymous « 01 мар 2024, 04:07
Добавлено в форуме IOS

Anonymous » 01 мар 2024, 04:07 » в форуме IOS

Я пытаюсь создать приложение, реагирующее на реакцию, и загрузить его в симулятор iPhone.

Когда я пытаюсь выполнить сборку с помощью кнопки сборки Xcode (14.2), она быстро терпит неудачу и выдает следующую ошибку:

Отсутствует аргумент опции '-p,...

0 Ответы

45 Просмотры

Последнее сообщение Anonymous
01 мар 2024, 04:07
Есть ли команда Java, которая работает аналогично pyspark --packages или spark-sql --packages, где она загружает jar и з

Последнее сообщение Anonymous « 02 июн 2024, 08:48
Добавлено в форуме JAVA

Anonymous » 02 июн 2024, 08:48 » в форуме JAVA

Есть ли Java-команда, которую вы можете запустить и которая работает аналогично pyspark --packages или spark-sql --packages, где она будет загружать jar и зависимости?
В идеале это было бы выглядеть
java --packages...

0 Ответы

47 Просмотры

Последнее сообщение Anonymous
02 июн 2024, 08:48
Как настроить SHIV для правильного использования существующих пакетов .venv Site-Packages, а не Redownload Packages?

Последнее сообщение Anonymous « 01 июл 2025, 18:19
Добавлено в форуме Python

Anonymous » 01 июл 2025, 18:19 » в форуме Python

Я пытаюсь использовать Shiv с проектом, который содержит pyproject.toml в моем ci.
Этот проект строится, на предыдущем шаге, по PDM с setuptools как Build Backend, и все зависимости уже в .venv, созданном этим. выполняет
pdm run shiv --compressed...

0 Ответы

12 Просмотры

Последнее сообщение Anonymous
01 июл 2025, 18:19
Как настроить SHIV, чтобы правильно использовать существующие пакеты .venv Site-Packages, а не Redownload Packages?

Последнее сообщение Anonymous « 01 июл 2025, 18:51
Добавлено в форуме Python

Anonymous » 01 июл 2025, 18:51 » в форуме Python

Я пытаюсь использовать Shiv с проектом, который содержит pyproject.toml в моем ci.
Этот проект строится, на предыдущем шаге, по PDM с setuptools как Build Backend, и все зависимости уже в .venv, созданном этим. выполняет
pdm run shiv --compressed...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
01 июл 2025, 18:51

Вернуться в «Python»