Как лучше всего структурировать каталоги проекта Python ML? - Цифровое Кемерово

Как лучше всего структурировать каталоги проекта Python ML? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Как лучше всего структурировать каталоги проекта Python ML?

Цитата

Сообщение Anonymous » 26 ноя 2024, 14:44

Я хотел бы знать, как правильно структурировать каталоги для проекта Python ML; чтобы проект было легко читать, поддерживать и правильно работать с импортом пакетов. (т.е. импорт выполняется плавно как при запуске из командной строки, так и из IDE, без необходимости жесткого внесения изменений в PYTHONPATH или тому подобного)
Я новичок в этом, и я искал, но не нашел стандартного подхода.
Например, я бы структурировал проект следующим образом:(Примечание: это всего лишь пример, чтобы дать представление, папки могут иметь еще много файлов .py, файлы с определениями классов,...)

Код: Выделить всё

+---configuration_files
+---data
+---models
+---README.md
+---report.md
+---requirements.txt
+---shell_scripts
\---src
|   data_cleaning.py
|   data_preprocessing.py
|   preprocessed_data_analysis.py
|   raw_data_analysis.py
|   test.py
|   train.py
|
\---modules
|   __init__.py
|
+---data_analysis
|       data_analysis_utils.py
|       __init__.py
|
+---data_handling
|       data_loaders.py
|       __init__.py
|
+---data_preprocessing
|       data_preprocessing_utils.py
|       __init__.py
|
+---general_utils
|       general_utils.py
|       __init__.py
|
+---test
|       test_utils.py
|       __init__.py
|
\---train
trainer.py.py
train_functions_1.py
train_functions_2.py
__init__.py

Что вы об этом думаете?
Например, размещение сценариев, которые нужно запускать, непосредственно в каталоге src упрощает импорт;
/>Однако мне кажется, что размещение их в таких папках, как data_preprocessing, data_anaанализ, train, test, каждая с соответствующим пакетом и модулями, будет чище. Однако это создаст проблемы при импорте из пакета General_utils, который должен быть общим для всех.
Более того, каково соглашение об использовании таких имен, как src , elements , утилиты,...? Должен ли я иметь сценарий main.py ? (даже у меня есть отдельные фазы)
Какой вообще самый эффективный и широко используемый способ структурирования такого проекта в отрасли?

Подробнее здесь: https://stackoverflow.com/questions/792 ... ml-project

1732621472

Anonymous

Я хотел бы знать, как правильно структурировать каталоги для проекта Python ML; чтобы проект было легко читать, поддерживать и правильно работать с импортом пакетов. (т.е. импорт выполняется плавно как при запуске из командной строки, так и из IDE, без необходимости жесткого внесения изменений в PYTHONPATH или тому подобного)
Я новичок в этом, и я искал, но не нашел стандартного подхода.
Например, я бы структурировал проект следующим образом:(Примечание: это всего лишь пример, чтобы дать представление, папки могут иметь еще много файлов .py, файлы с определениями классов,...)
[code]+---configuration_files
+---data
+---models
+---README.md
+---report.md
+---requirements.txt
+---shell_scripts
\---src
|   data_cleaning.py
|   data_preprocessing.py
|   preprocessed_data_analysis.py
|   raw_data_analysis.py
|   test.py
|   train.py
|
\---modules
|   __init__.py
|
+---data_analysis
|       data_analysis_utils.py
|       __init__.py
|
+---data_handling
|       data_loaders.py
|       __init__.py
|
+---data_preprocessing
|       data_preprocessing_utils.py
|       __init__.py
|
+---general_utils
|       general_utils.py
|       __init__.py
|
+---test
|       test_utils.py
|       __init__.py
|
\---train
trainer.py.py
train_functions_1.py
train_functions_2.py
__init__.py
[/code]
Что вы об этом думаете?
Например, размещение сценариев, которые нужно запускать, непосредственно в каталоге src упрощает импорт;
/>Однако мне кажется, что размещение их в таких папках, как data_preprocessing, data_anaанализ, train, test, каждая с соответствующим пакетом и модулями, будет чище. Однако это создаст проблемы при импорте из пакета General_utils, который должен быть общим для всех.
Более того, каково соглашение об использовании таких имен, как src , elements , утилиты,...? Должен ли я иметь сценарий main.py ? (даже у меня есть отдельные фазы)
Какой вообще самый эффективный и широко используемый способ структурирования такого проекта в отрасли? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79226565/what-is-the-best-way-to-structure-the-directories-a-python-ml-project[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»