Я новичок в этом, и я искал, но не нашел стандартного подхода.
Например, я бы структурировал проект следующим образом:(Примечание: это всего лишь пример, чтобы дать представление, папки могут иметь еще много файлов .py, файлы с определениями классов,...)
Код: Выделить всё
+---configuration_files
+---data
+---models
+---README.md
+---report.md
+---requirements.txt
+---shell_scripts
\---src
| data_cleaning.py
| data_preprocessing.py
| preprocessed_data_analysis.py
| raw_data_analysis.py
| test.py
| train.py
|
\---modules
| __init__.py
|
+---data_analysis
| data_analysis_utils.py
| __init__.py
|
+---data_handling
| data_loaders.py
| __init__.py
|
+---data_preprocessing
| data_preprocessing_utils.py
| __init__.py
|
+---general_utils
| general_utils.py
| __init__.py
|
+---test
| test_utils.py
| __init__.py
|
\---train
trainer.py.py
train_functions_1.py
train_functions_2.py
__init__.py
Например, размещение сценариев, которые нужно запускать, непосредственно в каталоге src упрощает импорт;
/>Однако мне кажется, что размещение их в таких папках, как data_preprocessing, data_anaанализ, train, test, каждая с соответствующим пакетом и модулями, будет чище. Однако это создаст проблемы при импорте из пакета General_utils, который должен быть общим для всех.
Более того, каково соглашение об использовании таких имен, как src , elements , утилиты,...? Должен ли я иметь сценарий main.py ? (даже у меня есть отдельные фазы)
Какой вообще самый эффективный и широко используемый способ структурирования такого проекта в отрасли?
Подробнее здесь: https://stackoverflow.com/questions/792 ... ml-project
Мобильная версия