Код: Выделить всё
from sagemaker.pytorch import PyTorch
estimator = PyTorch(
entry_point="train.py",
source_dir=source_dir,
role=role,
framework_version=framework_version,
py_version="py3",
train_instance_count=1,
train_instance_type=instance_type,
hyperparameters=hyperparameters,
metric_definitions=[
{"Name": "train:loss", "Regex": "Train Loss:([0-9\\.]+)"},
{"Name": "val:loss", "Regex": "Val Loss:([0-9\\.]+)"},
],
enable_sagemaker_metrics=True
)
Код: Выделить всё
estimator.fit(s3_url)
Код: Выделить всё
from sagemaker.analytics import TrainingJobAnalytics
analysis = TrainingJobAnalytics(training_job_name=estimator._current_job_name)
df = analysis.dataframe()
df
Код: Выделить всё
timestamp metric_name value
0 0.0 train:loss 0.471061
1 0.0 val:loss 0.167700
Подробнее здесь: https://stackoverflow.com/questions/684 ... aining-job