Основное содержание блокнота следующее:
Код: Выделить всё
%%bash
pip install xxx # Install dependencies
if [ ! -d "/kaggle/working/latex-ocr-pytorch" ]; then
echo "Directory does not exist, copying..."
cp -r /kaggle/input/latex-ocr-pytorch /kaggle/working
else
echo "Directory already exists, skipping copy"
fi
cd /kaggle/working/latex-ocr-pytorch
python train.py # Train and save the model (save checkpoints)
После завершения запуска в каталоге /kaggle/working/latex-ocr-pytorch/checkpoints создается несколько файлов checkpoint_xxx.pth.tar. На этом этапе, если я хочу загрузить файлы в папке контрольных точек, это становится довольно проблематичным, потому что файлов несколько, и мне приходится нажимать кнопку «Загрузить» для каждого из них индивидуально.
Я попробовал использовать команду kaggle kernels output user_name/kaggle-latex-ocr-pytorch -p /path/to/dest для загрузки, но обнаружил, что я скачал файлы журналов, а это не то, что мне нужно.
Поэтому я сослался на онлайн-блог и добавил ячейку кода в конце блокнота:
Код: Выделить всё
%%bash
cd /kaggle/working/latex-ocr-pytorch/
if [ -d "checkpoints" ]; then
tar -czf checkpoints.tar.gz checkpoints
echo "Compression successful"
else
echo "Warning: checkpoints directory does not exist"
exit 1
fi
Поскольку запуск модели занимает много времени, а Kaggle имеет ограничение по времени для одного сеанса в 12 часов, блокнот отключился на полпути во время выполнения. В результате последняя ячейка кода упаковки контрольных точек не запустилась. Какое решение этой проблемы?
Подробнее здесь: https://stackoverflow.com/questions/798 ... -on-kaggle
Мобильная версия