В конвейере предварительной обработки данных машинного обучения этапы конвейера обычно сериализуются или сохраняются в виде пикселей или слоев в модели, чтобы их можно было снова загрузить позже для обслуживания или прогнозирования, тем самым сохраняя параметры преобразования/подгонки каждого шага. получены на основе исходных данных обучения.
Почему не существует оболочек Python высокого уровня, которые вместо этого позволяют возвращать параметры или значения атрибутов этапов обработки в виде данных, тем самым их можно сохранить например, в базе данных без необходимости сохранять весь объект?
Это позволит заново создавать этапы обработки для обслуживания/прогнозирования во время прогнозирования и настраивать их с использованием сохраненных параметров и атрибутов. значения, загруженные из базы данных.
Я не могу найти библиотеки Python или оболочки существующих библиотек (например, TensorFlow, scikit-learn, PyTorch и т. д.), которые предоставляют высокоуровневый API для конвейера. сохранение и настройка параметров шага.
Почему они не существуют?
Мне кажется, это было бы полезно для переносимости и абстрагирования от библиотеку реализации, а также для проверки и отладки этапов обработки.
Я рассмотрел sklearn get_attrs и set_attrs, но они становятся очень сложными, особенно там, где используются вложенные преобразования и их необходимо представлять в виде дерева. шел.
Я упускаю какую-то фундаментальную концепцию или что-то в этом роде?
Подробнее здесь: https://stackoverflow.com/questions/790 ... wrap-commo
Существует ли метод получения и установки параметров обработки данных ML для переноса общих преобразователей/блоков/слое ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Как загрузить таблицу блоков данных в блокнот блоков данных с помощью Fugue?
Anonymous » » в форуме Python - 0 Ответы
- 89 Просмотры
-
Последнее сообщение Anonymous
-