Столбец Snowflake ARRAY в качестве входных данных для моделирования Snowpark.decompositionPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Столбец Snowflake ARRAY в качестве входных данных для моделирования Snowpark.decomposition

Сообщение Anonymous »

У меня есть таблица Snowflake со столбцом ARRAY, содержащим пользовательские внедрения (с размером массива>1000).
Эти массивы разрежены, и я хотел бы уменьшить их размер с помощью SVD (или одного из Snowpark ml. modeling.decomposition).
Игрушечный пример фрейма данных:

Код: Выделить всё

df = session.sql("""
select 'doc1' as doc_id, array_construct(0.1, 0.3, 0.5, 0.7) as doc_vec
union
select 'doc2' as doc_id, array_construct(0.2, 0.4, 0.6, 0.8) as doc_vec
""")
print(df)
# DOC_ID  | DOC_VEC
# doc1 | [   0.1,   0.3,   0.5,   0.7 ]
# doc2 | [   0.2,   0.4,   0.6,   0.8 ]
Однако, когда я пытаюсь подогнать этот фрейм данных

Код: Выделить всё

from snowflake.ml.modeling.decomposition import TruncatedSVD
tsvd = TruncatedSVD(input_cols = 'doc_vec', output_cols='out_svd')
print(tsvd)
out = tsvd.fit(df)
Я понимаю

Код: Выделить всё

 File "snowflake/ml/modeling/_internal/snowpark_trainer.py", line 218, in fit_wrapper_function
args = {"X": df[input_cols]}
~~^^^^^^^^^^^^   File "pandas/core/frame.py", line 3767, in __getitem__
indexer = self.columns._get_indexer_strict(key, "columns")[1]



KeyError: "None of [Index(['doc_vec'], dtype='object')] are in the [columns]"
Основываясь на информации из этого руководства text_embedding_as_snowpark_python_udf,
я подозреваю, что массив Snowpark необходимо преобразовать в np.ndarray перед передачей в базовый sklearn.decomposition .TruncatedSVD
Может кто-нибудь указать мне какой-нибудь пример использования массивов Snoflake в качестве входных данных для моделей Snowpark?

Подробнее здесь: https://stackoverflow.com/questions/780 ... omposition
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»