Начиная с
import polars as pl
df = pl.DataFrame({
'a': [1,2,3],
'b': [4.,2.,6.],
'c': ['w', 'a', 'r'],
'd': [4, 1, 1]
})
как я могу получить корреляцию между и всеми другими числовыми столбцами?
Эквивалент в пандах:
In [30]: (
...: pd.DataFrame({
...: 'a': [1,2,3],
...: 'b': [4.,2.,6.],
...: 'c': ['w', 'a', 'r'],
...: 'd': [4, 1, 1]
...: })
...: .corr()
...: .loc['a']
...: )
Out[30]:
a 1.000000
b 0.500000
d -0.866025
Name: a, dtype: float64
Я пробовал
(
df.select(pl.col(pl.Int64).cast(pl.Float64), pl.col(pl.Float64))
.select(pl.corr('a', pl.exclude('a')))
)
но получил
DuplicateError: the name 'a' is duplicate
Подробнее здесь: https://stackoverflow.com/questions/747 ... meric-ones
Корр одного столбца со всеми остальными числовыми значениями ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение