Расчет нагрузки на коэффициент PCA с использованием Sklearn при использовании стандартов

Расчет нагрузки на коэффициент PCA с использованием Sklearn при использовании стандартов ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Расчет нагрузки на коэффициент PCA с использованием Sklearn при использовании стандартов

Цитата

Сообщение Anonymous » 25 июл 2025, 02:28

Моя цель - получить корреляции между отдельными переменными и основными компонентами в Python. Я использую PCA в Iris dataset
iris = load_iris()
X = iris.data
y = iris.target

# Standardize the data
scaler = StandardScaler()
X_standardized = scaler.fit_transform(X)

# Apply PCA with two components
pca = PCA(n_components=2)
X_pca = pca.fit_transform(X_standardized)

# Extract loadings
loadings = pca.components_.T * np.sqrt(pca.explained_variance_)

# Create a DataFrame for loadings
loadings_df = pd.DataFrame(loadings, columns=['PC1', 'PC2'], index=iris.feature_names)
loadings_df
< /code>
Я изменил код, чтобы вместо этого я имел: < /p>
scaler = StandardScaler(with_std=False, with_mean=True)
< /code>
with_std[/code] и with_mean оба истины по умолчанию, но я изменил с_STD на false для целей моего исследования. Проблема заключается в том, что нагрузки, которые я получаю для моего собственного набора данных (массив 516 x 9,030), почти бессмысленные (они бесконечно малы). Подобно формуле для стандартизации нагрузки: < /p>
Loading / sqrt(Variable's variance)
< /code>
So the loading for each variable is divided by the square root of that variable's original variance. The loadings I get using this method seem to make sense, but I want to get some confirmation that I am on the right track (and leave a record for anyone else doing the same thing in the future).
Does the method I'm using to standardize my loadings (without standardizing the original data) make sense?

Подробнее здесь: https://stackoverflow.com/questions/797 ... dardscalar

1753399684

Anonymous

 Моя цель - получить корреляции между отдельными переменными и основными компонентами в Python. Я использую PCA  в [url=https://www.jcchouinard.com/sklearn-datasets-iris/]Iris dataset[/url]
iris = load_iris()
X = iris.data
y = iris.target

# Standardize the data
scaler = StandardScaler()
X_standardized = scaler.fit_transform(X)

# Apply PCA with two components
pca = PCA(n_components=2)
X_pca = pca.fit_transform(X_standardized)

# Extract loadings
loadings = pca.components_.T * np.sqrt(pca.explained_variance_)

# Create a DataFrame for loadings
loadings_df = pd.DataFrame(loadings, columns=['PC1', 'PC2'], index=iris.feature_names)
loadings_df
< /code>
Я изменил код, чтобы вместо этого я имел: < /p>
scaler = StandardScaler(with_std=False, with_mean=True)
< /code>
with_std[/code] и with_mean  оба истины  по умолчанию, но я изменил с_STD  на false  для целей моего исследования. Проблема заключается в том, что нагрузки, которые я получаю для моего собственного набора данных (массив 516 x 9,030), почти бессмысленные (они бесконечно малы). Подобно формуле для стандартизации нагрузки: < /p>
Loading / sqrt(Variable's variance)
< /code>
So the loading for each variable is divided by the square root of that variable's original variance. The loadings I get using this method seem to make sense, but I want to get some confirmation that I am on the right track (and leave a record for anyone else doing the same thing in the future).
Does the method I'm using to standardize my loadings (without standardizing the original data) make sense? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79700186/calculating-pca-factor-loadings-using-sklearn-when-using-standardscalar[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Реализация sklearn.ensemble.GradientBoostingRegressor с помощью sklearn.multioutput.MultiOutputRegressor и sklearn.model

Последнее сообщение Anonymous « 02 дек 2024, 01:49
Добавлено в форуме Python

Anonymous » 02 дек 2024, 01:49 » в форуме Python

Я пытаюсь создать модели, поддерживающие многомерный вывод. Одна из моделей, которые я пытаюсь использовать, — это GradientBoostingRegressor, которая изначально не поддерживает многомерный вывод. Существует обходной путь с помощью...

0 Ответы

49 Просмотры

Последнее сообщение Anonymous
02 дек 2024, 01:49
Реализация sklearn.ensemble.GradientBoostingRegressor с помощью sklearn.multioutput.MultiOutputRegressor и sklearn.model

Последнее сообщение Anonymous « 02 дек 2024, 13:06
Добавлено в форуме Python

Anonymous » 02 дек 2024, 13:06 » в форуме Python

Я пытаюсь создать модели, поддерживающие многомерный вывод. Одна из моделей, которые я пытаюсь использовать, — это GradientBoostingRegressor, которая изначально не поддерживает многомерный вывод. Существует обходной путь с помощью...

0 Ответы

54 Просмотры

Последнее сообщение Anonymous
02 дек 2024, 13:06
Реализация sklearn.ensemble.GradientBoostingRegressor с помощью sklearn.multioutput.MultiOutputRegressor и sklearn.model

Последнее сообщение Anonymous « 07 дек 2024, 02:51
Добавлено в форуме Python

Anonymous » 07 дек 2024, 02:51 » в форуме Python

Я пытаюсь создать модели, поддерживающие многомерный вывод. Одна из моделей, которые я пытаюсь использовать, — это GradientBoostingRegressor, которая изначально не поддерживает многомерный вывод. Существует обходной путь с помощью...

0 Ответы

39 Просмотры

Последнее сообщение Anonymous
07 дек 2024, 02:51
Проблема со sklearn PCA с использованием многопроцессорной обработки

Последнее сообщение Anonymous « 05 дек 2023, 11:29
Добавлено в форуме Python

Anonymous » 05 дек 2023, 11:29 » в форуме Python

У меня возникла проблема при запуске PCA с многопроцессорной обработкой. Когда я устанавливаю Pool(processes=4), все работает нормально (np.abs(tmp_matrix-X_train).max(), но когда я устанавливаю Pool(processes=5) # или 6 и выше, ошибка...

0 Ответы

69 Просмотры

Последнее сообщение Anonymous
05 дек 2023, 11:29
Простые графики собственных векторов для sklearn.decomposition.PCA

Последнее сообщение Anonymous « 08 ноя 2024, 05:03
Добавлено в форуме Python

Anonymous » 08 ноя 2024, 05:03 » в форуме Python

Я пытаюсь понять, как работает анализ главных компонентов, и тестирую его на наборе данных sklearn.datasets.load_iris. Я понимаю, как работает каждый шаг (например, стандартизация данных, ковариация, собственное разложение, сортировка по наибольшему...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
08 ноя 2024, 05:03

Вернуться в «Python»