Невозможно загрузить большой набор данных обнимающихся лиц на Google Диск в ColabPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Невозможно загрузить большой набор данных обнимающихся лиц на Google Диск в Colab

Сообщение Anonymous »

Я пытаюсь загрузить большой набор данных из Hugging Face в Google Colab, но у меня постоянно возникают проблемы с хранилищем. Поскольку набор данных слишком велик для локального диска Colab, я хочу сохранить его непосредственно на своем Google Диске, где достаточно места.
Я безуспешно пробовал следующие подходы:
  • Задайте переменные среды, такие как HF_HOME, DOWNLOADED_DATASETS_PATH, HF_DATASETS_CACHE и HF_CACHE_HOME, чтобы они указывали на каталог Google Диска:

Код: Выделить всё

import os
from pathlib import Path
from datasets import config

datasets_drive_dir = "/content/drive/MyDrive/my_huggingface"

if not os.path.isdir(datasets_drive_dir):
print("Directory doesn't exist - creating it")
os.mkdir(datasets_drive_dir)

os.environ\['HF_HOME'\] = datasets_drive_dir
os.environ\['DOWNLOADED_DATASETS_PATH'\] = datasets_drive_dir
os.environ\['HF_DATASETS_CACHE'\] = datasets_drive_dir
os.environ\['HF_CACHE_HOME'\] = datasets_drive_dir

config.DOWNLOADED_DATASETS_PATH = Path(datasets_drive_dir)
config.HF_DATASETS_CACHE = Path(datasets_drive_dir)
config.HF_CACHE_HOME = Path(datasets_drive_dir)
  • Изменил каталог кэша, установив кэш_dir в самой функции:

    Код: Выделить всё

    load_dataset(DATASET_NAME, 'pre',  cache_dir=datasets_drive_dir)
Несмотря на эти усилия, набор данных все еще пытается загрузиться в локальное хранилище Colab, и мне не хватает места :(
Также, когда я попробовал режим потоковой передачи, но во время обучения обнаружил следующую ошибку:

Код: Выделить всё

huggingface_hub.utils._errors.HfHubHTTPError: 500 Server Error: Internal Server Error..


Подробнее здесь: https://stackoverflow.com/questions/790 ... e-in-colab
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»