Сохранение модели Mllib Spark с использованием каталога данных KEDroPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Сохранение модели Mllib Spark с использованием каталога данных KEDro

Сообщение Anonymous »

Рассмотрим модель, которая обучена этому примеру из документации Кедро < /p>

Код: Выделить всё

from typing import Any, Dict

from kedro.pipeline import node, pipeline
from pyspark.ml.classification import RandomForestClassifier
from pyspark.sql import DataFrame

def train_model(training_data: DataFrame) -> RandomForestClassifier:
"""Node for training a random forest model to classify the data."""
classifier = RandomForestClassifier(numTrees=10)
return classifier.fit(training_data)

def predict(model: RandomForestClassifier, testing_data: DataFrame) -> DataFrame:
"""Node for making predictions given a pre-trained model and a testing dataset."""
predictions = model.transform(testing_data)
return predictions

def create_pipeline(**kwargs) -> Pipeline:
return pipeline(
[
node(train_model, inputs=["training_data"], outputs="example_classifier"),
node(
predict,
inputs=dict(model="example_classifier", testing_data="testing_data"),
outputs="example_predictions",
),
]
)
< /code>
Я хотел бы не терять свою предварительно обученную модель и сохранять ее в качестве трубопровода Pyspark, но я не смог найти подходящий набор данных для этого в документации Kedro Dataset < /p>
Обычно я бы сделал что-то подобное: < /p>
< /p>  save_path = "path/to/save/pipeline_model"
pipeline_model.save(save_path)
< /code>
Но как я использую Kedro, я не хочу иметь IO за пределами моего каталога. Это поддерживаемый вариант использования, или мне придется реализовать свои собственные данные пользовательские Kedrodataset 
для достижения этого?

Подробнее здесь: https://stackoverflow.com/questions/796 ... ta-catalog
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»