Столбец Snowflake ARRAY в качестве входных данных для моделирования Snowpark.decomposition

Столбец Snowflake ARRAY в качестве входных данных для моделирования Snowpark.decomposition ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Столбец Snowflake ARRAY в качестве входных данных для моделирования Snowpark.decomposition

Цитата

Сообщение Anonymous » 01 окт 2024, 12:49

У меня есть таблица Snowflake со столбцом ARRAY, содержащим пользовательские внедрения (с размером массива>1000).
Эти массивы разрежены, и я хотел бы уменьшить их размер с помощью SVD (или одного из Snowpark ml. modeling.decomposition).
Игрушечный пример фрейма данных:

Код: Выделить всё

df = session.sql("""
select 'doc1' as doc_id, array_construct(0.1, 0.3, 0.5, 0.7) as doc_vec
union
select 'doc2' as doc_id, array_construct(0.2, 0.4, 0.6, 0.8) as doc_vec
""")
print(df)
# DOC_ID  | DOC_VEC
# doc1 | [   0.1,   0.3,   0.5,   0.7 ]
# doc2 | [   0.2,   0.4,   0.6,   0.8 ]

Однако, когда я пытаюсь подогнать этот фрейм данных

Код: Выделить всё

from snowflake.ml.modeling.decomposition import TruncatedSVD
tsvd = TruncatedSVD(input_cols = 'doc_vec', output_cols='out_svd')
print(tsvd)
out = tsvd.fit(df)

Я понимаю

Код: Выделить всё

 File "snowflake/ml/modeling/_internal/snowpark_trainer.py", line 218, in fit_wrapper_function
args = {"X": df[input_cols]}
~~^^^^^^^^^^^^   File "pandas/core/frame.py", line 3767, in __getitem__
indexer = self.columns._get_indexer_strict(key, "columns")[1]



KeyError: "None of [Index(['doc_vec'], dtype='object')] are in the [columns]"

Основываясь на информации из этого руководства text_embedding_as_snowpark_python_udf,
я подозреваю, что массив Snowpark необходимо преобразовать в np.ndarray перед передачей в базовый sklearn.decomposition .TruncatedSVD
Может кто-нибудь указать мне какой-нибудь пример использования массивов Snoflake в качестве входных данных для моделей Snowpark?

Подробнее здесь: https://stackoverflow.com/questions/780 ... omposition

1727776196

Anonymous

У меня есть таблица Snowflake со столбцом ARRAY, содержащим пользовательские внедрения (с размером массива>1000).
Эти массивы разрежены, и я хотел бы уменьшить их размер с помощью SVD (или одного из Snowpark ml. modeling.decomposition).
Игрушечный пример фрейма данных:
[code]df = session.sql("""
select 'doc1' as doc_id, array_construct(0.1, 0.3, 0.5, 0.7) as doc_vec
union
select 'doc2' as doc_id, array_construct(0.2, 0.4, 0.6, 0.8) as doc_vec
""")
print(df)
# DOC_ID  | DOC_VEC
# doc1 | [   0.1,   0.3,   0.5,   0.7 ]
# doc2 | [   0.2,   0.4,   0.6,   0.8 ]
[/code]
Однако, когда я пытаюсь подогнать этот фрейм данных
[code]from snowflake.ml.modeling.decomposition import TruncatedSVD
tsvd = TruncatedSVD(input_cols = 'doc_vec', output_cols='out_svd')
print(tsvd)
out = tsvd.fit(df)
[/code]
Я понимаю
[code] File "snowflake/ml/modeling/_internal/snowpark_trainer.py", line 218, in fit_wrapper_function
args = {"X": df[input_cols]}
~~^^^^^^^^^^^^   File "pandas/core/frame.py", line 3767, in __getitem__
indexer = self.columns._get_indexer_strict(key, "columns")[1]



KeyError: "None of [Index(['doc_vec'], dtype='object')] are in the [columns]"
[/code]
Основываясь на информации из этого руководства text_embedding_as_snowpark_python_udf,
я подозреваю, что массив Snowpark необходимо преобразовать в np.ndarray перед передачей в базовый sklearn.decomposition .TruncatedSVD
Может кто-нибудь указать мне какой-нибудь пример использования массивов Snoflake в качестве входных данных для моделей Snowpark? 

Подробнее здесь: [url]https://stackoverflow.com/questions/78062935/snowflake-array-column-as-input-to-snowpark-modeling-decomposition[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Snowflake/Snowpark «импортировать sklearn» приводит к тому, что «модуль не найден».

Последнее сообщение Anonymous « 17 сен 2024, 19:14
Добавлено в форуме Python

Anonymous » 17 сен 2024, 19:14 » в форуме Python

Я использую лист Python в Snowflake. Я во всем этом совсем не разбираюсь.
Когда я добрался до Information_schema.packages, scikit-learn явно там и установлен.
Но когда я ссылаюсь на «sklearn» (не совсем понимаю, откуда взялось это полное имя или...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
17 сен 2024, 19:14
Snowflake/Snowpark «импортировать sklearn» приводит к тому, что «модуль не найден».

Последнее сообщение Anonymous « 17 сен 2024, 20:06
Добавлено в форуме Python

Anonymous » 17 сен 2024, 20:06 » в форуме Python

Я использую лист Python в Snowflake. Я во всем этом совсем не разбираюсь.
Когда я добрался до Information_schema.packages, scikit-learn явно там и установлен.
Но когда я ссылаюсь на «sklearn» (не совсем понимаю, откуда взялось это полное имя или...

0 Ответы

16 Просмотры

Последнее сообщение Anonymous
17 сен 2024, 20:06
Соединитель Snowflake/Snowpark/Python – как устранить непредвиденную ошибку «@»SNOWPARK_TEMP_STAGE_...»?

Последнее сообщение Anonymous « 08 янв 2025, 13:15
Добавлено в форуме Python

Anonymous » 08 янв 2025, 13:15 » в форуме Python

При попытке добавления к существующей таблице «снежинка» с помощью хранимой процедуры Python вы используете write_pandas, т. е.
session.write_pandas(my_df, table_name=my_table_name, overwrite=True,database='MY_DATABASE',schema='MY_SANDBOX')

Я...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
08 янв 2025, 13:15
Snowflake/ SnowPark "Import Sklearn" приводит к «модулю не найдена».

Последнее сообщение Anonymous « 04 сен 2025, 18:05
Добавлено в форуме Python

Anonymous » 04 сен 2025, 18:05 » в форуме Python

Я использую рабочий лист Python в Snowflect. В нем говорится, что модуль не найден. Так в чем же сделка? Что я делаю не так?

Подробнее здесь:

0 Ответы

3 Просмотры

Последнее сообщение Anonymous
04 сен 2025, 18:05
Приложение Snowflake Native с контейнерной службой, предоставление импортированных привилегий в базе данных Snowflake DB

Последнее сообщение Anonymous « 11 июл 2024, 18:35
Добавлено в форуме Python

Anonymous » 11 июл 2024, 18:35 » в форуме Python

Как собственное приложение Snowflake, созданное с использованием контейнерных служб, может запросить или предоставить импортированные привилегии в базе данных Snowflake?
Согласно документации Snowflake, предоставление прав можно добавить только с...

0 Ответы

45 Просмотры

Последнее сообщение Anonymous
11 июл 2024, 18:35

Вернуться в «Python»