Мой экземпляр Python без исключения ломается в [_model(torch.zeros(1, 3, self.image_size, self.image_size).to(_selected_

Мой экземпляр Python без исключения ломается в [_model(torch.zeros(1, 3, self.image_size, self.image_size).to(_selected_ ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Мой экземпляр Python без исключения ломается в [_model(torch.zeros(1, 3, self.image_size, self.image_size).to(_selected_

Цитата

Сообщение Anonymous » 12 май 2024, 22:49

это информация о моей памяти, процессоре, графическом процессоре и версии фонаря:

Код: Выделить всё

MemTotal:       30794980 kB
MemFree:        26650464 kB
MemAvailable:   28247716 kB
Buffers:           73680 kB
Cached:          1840696 kB
SwapCached:            0 kB
Active:           981320 kB
Inactive:        2659044 kB
Active(anon):       1356 kB
Inactive(anon):  1736720 kB
Active(file):     979964 kB
Inactive(file):   922324 kB
Unevictable:       18600 kB
Mlocked:           18600 kB
SwapTotal:             0 kB
SwapFree:              0 kB
Dirty:                40 kB
Writeback:             0 kB
AnonPages:       1744600 kB
Mapped:           640532 kB
Shmem:              3876 kB
KReclaimable:      92008 kB
Slab:             182620 kB
SReclaimable:      92008 kB
SUnreclaim:        90612 kB
KernelStack:        8256 kB
PageTables:        19732 kB
NFS_Unstable:          0 kB
Bounce:                0 kB
WritebackTmp:          0 kB
CommitLimit:    15397488 kB
Committed_AS:    9151572 kB
VmallocTotal:   34359738367 kB
VmallocUsed:       80276 kB
VmallocChunk:          0 kB
Percpu:             6496 kB
HardwareCorrupted:     0 kB
AnonHugePages:         0 kB
ShmemHugePages:        0 kB
ShmemPmdMapped:        0 kB
FileHugePages:         0 kB
FilePmdMapped:         0 kB
HugePages_Total:       0
HugePages_Free:        0
HugePages_Rsvd:        0
HugePages_Surp:        0
Hugepagesize:       2048 kB
Hugetlb:               0 kB
DirectMap4k:      406328 kB
DirectMap2M:     7979008 kB
DirectMap1G:    25165824 kB

Код: Выделить всё

Architecture:                       x86_64
CPU op-mode(s):                     32-bit, 64-bit
Byte Order:                         Little Endian
Address sizes:                      46 bits physical, 48 bits virtual
CPU(s):                             8
On-line CPU(s) list:                0-7
Thread(s) per core:                 2
Core(s) per socket:                 4
Socket(s):                          1
NUMA node(s):                       1
Vendor ID:                          GenuineIntel
CPU family:                         6
Model:                              63
Model name:                         Intel(R) Xeon(R) CPU @ 2.30GHz
Stepping:                           0
CPU MHz:                            2299.998
BogoMIPS:                           4599.99
Hypervisor vendor:                  KVM
Virtualization type:                full
L1d cache:                          128 KiB
L1i cache:                          128 KiB
L2 cache:                           1 MiB
L3 cache:                           45 MiB
NUMA node0 CPU(s):                  0-7
Vulnerability Gather data sampling: Not affected
Vulnerability Itlb multihit:        Not affected
Vulnerability L1tf:                 Mitigation; PTE Inversion
Vulnerability Mds:                  Mitigation; Clear CPU buffers; SMT Host state unknown
Vulnerability Meltdown:             Mitigation; PTI
Vulnerability Mmio stale data:      Vulnerable: Clear CPU buffers attempted, no microcode; SMT Host state unknown
Vulnerability Retbleed:             Mitigation; IBRS
Vulnerability Spec rstack overflow: Not affected
Vulnerability Spec store bypass:    Mitigation; Speculative Store Bypass disabled via prctl and seccomp
Vulnerability Spectre v1:           Mitigation; usercopy/swapgs barriers and __user pointer sanitization
Vulnerability Spectre v2:           Mitigation; IBRS; IBPB conditional; STIBP conditional; RSB filling; PBRSB-eIBRS Not affected;  BHI
Syscall hardening, KVM SW loop
Vulnerability Srbds:                Not affected
Vulnerability Tsx async abort:      Not affected
Flags:                              fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2
ss ht syscall nx pdpe1gb rdtscp lm constant_tsc rep_good nopl xtopology nonstop_tsc cpuid tsc_kn
own_freq pni pclmulqdq ssse3 fma cx16 pcid sse4_1 sse4_2 x2apic movbe popcnt aes xsave avx f16c r
drand hypervisor lahf_lm abm invpcid_single pti ssbd ibrs ibpb stibp fsgsbase tsc_adjust bmi1 avx
2 smep bmi2 erms invpcid xsaveopt arat md_clear arch_capabilities

Код: Выделить всё

+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.171.04             Driver Version: 535.171.04   CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla T4                       Off | 00000000:00:04.0 Off |                    0 |
| N/A   38C    P8               9W /  70W |    105MiB / 15360MiB |      0%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
+---------------------------------------------------------------------------------------+

Код: Выделить всё

Name: torch
Version: 2.2.1
Summary: Tensors and Dynamic neural networks in Python with strong GPU acceleration
Home-page: https://pytorch.org/
Author: PyTorch Team
Author-email: [email protected]
License: BSD-3
Location: /usr/local/lib/python3.8/dist-packages
Requires: nvidia-cufft-cu12, nvidia-cusparse-cu12, nvidia-cuda-cupti-cu12, nvidia-nccl-cu12, nvidia-nvtx-cu12, triton, filelock, fsspec, nvidia-cusolver-cu12, nvidia-cuda-nvrtc-cu12, nvidia-curand-cu12, nvidia-cublas-cu12, sympy, nvidia-cudnn-cu12, jinja2, typing-extensions, nvidia-cuda-runtime-cu12, networkx
Required-by: torchvision

ранее ломалось

Код: Выделить всё

try:  # FLOPS
from thop import profile
connect.loginfo("imported thop profile")
stride = max(int(model.stride.max()), 32) if hasattr(model, 'stride') else 32
connect.loginfo(f"stride: {stride}")
img = torch.zeros((1, model.yaml.get('ch', 3), stride, stride), device=next(model.parameters()).device)  # input
connect.loginfo(f"zero torch tensor: {img}")
flops = profile(deepcopy(model), inputs=(img,), verbose=False)[0] / 1E9 * 2  # stride GFLOPS
connect.loginfo(f"stride_flops: {flops}")
img_size = img_size if isinstance(img_size, list) else [img_size, img_size]  # expand if int/float
connect.loginfo(f"img_size: {img_size}")
fs = ', %.1f GFLOPS' % (flops * img_size[0] / stride * img_size[1] / stride)  # 640x640 GFLOPS
connect.loginfo(f"640_flops: {fs}")

profile, я удалил модуль top. Раньше тот же сценарий нормально работал на другом сервере. Теперь я сменил сервер, и на старом сервере установлена версия Torch 2.2.0 с той же версией cuda.
Загвоздка в том, что я запускаю сценарий с помощью RabbitMQ, тогда он ломается. только, но если я вызываю его обычным образом с теми же аргументами, все работает нормально. Может кто-нибудь сказать, что здесь не так. Используемая мной _model возвращается функцией yolov7 try_load(models.experimental.py)

Подробнее здесь: https://stackoverflow.com/questions/784 ... eros1-3-se

1715543388

Anonymous

это информация о моей памяти, процессоре, графическом процессоре и версии фонаря:
[code]MemTotal:       30794980 kB
MemFree:        26650464 kB
MemAvailable:   28247716 kB
Buffers:           73680 kB
Cached:          1840696 kB
SwapCached:            0 kB
Active:           981320 kB
Inactive:        2659044 kB
Active(anon):       1356 kB
Inactive(anon):  1736720 kB
Active(file):     979964 kB
Inactive(file):   922324 kB
Unevictable:       18600 kB
Mlocked:           18600 kB
SwapTotal:             0 kB
SwapFree:              0 kB
Dirty:                40 kB
Writeback:             0 kB
AnonPages:       1744600 kB
Mapped:           640532 kB
Shmem:              3876 kB
KReclaimable:      92008 kB
Slab:             182620 kB
SReclaimable:      92008 kB
SUnreclaim:        90612 kB
KernelStack:        8256 kB
PageTables:        19732 kB
NFS_Unstable:          0 kB
Bounce:                0 kB
WritebackTmp:          0 kB
CommitLimit:    15397488 kB
Committed_AS:    9151572 kB
VmallocTotal:   34359738367 kB
VmallocUsed:       80276 kB
VmallocChunk:          0 kB
Percpu:             6496 kB
HardwareCorrupted:     0 kB
AnonHugePages:         0 kB
ShmemHugePages:        0 kB
ShmemPmdMapped:        0 kB
FileHugePages:         0 kB
FilePmdMapped:         0 kB
HugePages_Total:       0
HugePages_Free:        0
HugePages_Rsvd:        0
HugePages_Surp:        0
Hugepagesize:       2048 kB
Hugetlb:               0 kB
DirectMap4k:      406328 kB
DirectMap2M:     7979008 kB
DirectMap1G:    25165824 kB
[/code]
[code]Architecture:                       x86_64
CPU op-mode(s):                     32-bit, 64-bit
Byte Order:                         Little Endian
Address sizes:                      46 bits physical, 48 bits virtual
CPU(s):                             8
On-line CPU(s) list:                0-7
Thread(s) per core:                 2
Core(s) per socket:                 4
Socket(s):                          1
NUMA node(s):                       1
Vendor ID:                          GenuineIntel
CPU family:                         6
Model:                              63
Model name:                         Intel(R) Xeon(R) CPU @ 2.30GHz
Stepping:                           0
CPU MHz:                            2299.998
BogoMIPS:                           4599.99
Hypervisor vendor:                  KVM
Virtualization type:                full
L1d cache:                          128 KiB
L1i cache:                          128 KiB
L2 cache:                           1 MiB
L3 cache:                           45 MiB
NUMA node0 CPU(s):                  0-7
Vulnerability Gather data sampling: Not affected
Vulnerability Itlb multihit:        Not affected
Vulnerability L1tf:                 Mitigation; PTE Inversion
Vulnerability Mds:                  Mitigation; Clear CPU buffers; SMT Host state unknown
Vulnerability Meltdown:             Mitigation; PTI
Vulnerability Mmio stale data:      Vulnerable: Clear CPU buffers attempted, no microcode; SMT Host state unknown
Vulnerability Retbleed:             Mitigation; IBRS
Vulnerability Spec rstack overflow: Not affected
Vulnerability Spec store bypass:    Mitigation; Speculative Store Bypass disabled via prctl and seccomp
Vulnerability Spectre v1:           Mitigation; usercopy/swapgs barriers and __user pointer sanitization
Vulnerability Spectre v2:           Mitigation; IBRS; IBPB conditional; STIBP conditional; RSB filling; PBRSB-eIBRS Not affected;  BHI
Syscall hardening, KVM SW loop
Vulnerability Srbds:                Not affected
Vulnerability Tsx async abort:      Not affected
Flags:                              fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2
ss ht syscall nx pdpe1gb rdtscp lm constant_tsc rep_good nopl xtopology nonstop_tsc cpuid tsc_kn
own_freq pni pclmulqdq ssse3 fma cx16 pcid sse4_1 sse4_2 x2apic movbe popcnt aes xsave avx f16c r
drand hypervisor lahf_lm abm invpcid_single pti ssbd ibrs ibpb stibp fsgsbase tsc_adjust bmi1 avx
2 smep bmi2 erms invpcid xsaveopt arat md_clear arch_capabilities
[/code]
[code]+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.171.04             Driver Version: 535.171.04   CUDA Version: 12.2     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  Tesla T4                       Off | 00000000:00:04.0 Off |                    0 |
| N/A   38C    P8               9W /  70W |    105MiB / 15360MiB |      0%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
+---------------------------------------------------------------------------------------+
[/code]
[code]Name: torch
Version: 2.2.1
Summary: Tensors and Dynamic neural networks in Python with strong GPU acceleration
Home-page: https://pytorch.org/
Author: PyTorch Team
Author-email: [email protected]
License: BSD-3
Location: /usr/local/lib/python3.8/dist-packages
Requires: nvidia-cufft-cu12, nvidia-cusparse-cu12, nvidia-cuda-cupti-cu12, nvidia-nccl-cu12, nvidia-nvtx-cu12, triton, filelock, fsspec, nvidia-cusolver-cu12, nvidia-cuda-nvrtc-cu12, nvidia-curand-cu12, nvidia-cublas-cu12, sympy, nvidia-cudnn-cu12, jinja2, typing-extensions, nvidia-cuda-runtime-cu12, networkx
Required-by: torchvision
[/code]
ранее ломалось
[code]try:  # FLOPS
from thop import profile
connect.loginfo("imported thop profile")
stride = max(int(model.stride.max()), 32) if hasattr(model, 'stride') else 32
connect.loginfo(f"stride: {stride}")
img = torch.zeros((1, model.yaml.get('ch', 3), stride, stride), device=next(model.parameters()).device)  # input
connect.loginfo(f"zero torch tensor: {img}")
flops = profile(deepcopy(model), inputs=(img,), verbose=False)[0] / 1E9 * 2  # stride GFLOPS
connect.loginfo(f"stride_flops: {flops}")
img_size = img_size if isinstance(img_size, list) else [img_size, img_size]  # expand if int/float
connect.loginfo(f"img_size: {img_size}")
fs = ', %.1f GFLOPS' % (flops * img_size[0] / stride * img_size[1] / stride)  # 640x640 GFLOPS
connect.loginfo(f"640_flops: {fs}")
[/code]
profile, я удалил модуль top. Раньше тот же сценарий нормально работал на другом сервере. Теперь я сменил сервер, и на старом сервере установлена версия Torch 2.2.0 с той же версией cuda.
[b]Загвоздка в том, что я запускаю сценарий с помощью RabbitMQ, тогда он ломается. только, но если я вызываю его обычным образом с теми же аргументами, все работает нормально[/b]. Может кто-нибудь сказать, что здесь не так. [b]Используемая мной _model возвращается функцией yolov7 try_load(models.experimental.py)[/b] 

Подробнее здесь: [url]https://stackoverflow.com/questions/78463874/my-python-instance-is-breaking-without-exception-at-modeltorch-zeros1-3-se[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Почему я должен не допустить данных от Torch.Size ([50]) до Torch.Size ([50, 1])

Последнее сообщение Anonymous « 11 фев 2025, 18:02
Добавлено в форуме Python

Anonymous » 11 фев 2025, 18:02 » в форуме Python

Я проходил курс глубокого обучения Pytorch от Freecodecamp, и сомнение:
weight = 0.7
bias = 0.3
start = 0
end = 1
step = 0.02

X = torch.arange(start, end, step).unsqueeze(dim=1)
y=weight*X + bias
X , y
train_split=int(0.8*len(X))
X_train,...

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
11 фев 2025, 18:02
Я не понимаю поведение torch.Tensor при передаче в него объекта torch.Size.

Последнее сообщение Anonymous « 19 апр 2024, 23:27
Добавлено в форуме Python

Anonymous » 19 апр 2024, 23:27 » в форуме Python

Предыстория
Я пытаюсь придерживаться концепции Torch, чтобы гарантировать, что если структуры данных, с которыми я работаю, находятся в графическом процессоре, то все они находятся в графическом процессоре, и наоборот, чтобы Я не смешиваю...

0 Ответы

87 Просмотры

Последнее сообщение Anonymous
19 апр 2024, 23:27
Как исправить ошибку: «base_model.model.model.model.embed_tokens» означает при использовании peftModel в Python? (FinGPT

Последнее сообщение Anonymous « 15 июл 2024, 01:36
Добавлено в форуме Python

Anonymous » 15 июл 2024, 01:36 » в форуме Python

Я пытаюсь использовать пример кода из FinGPTForecaster. Я создал токен Huggingface и вошел в Huggingface из строки cmd (Windows 11). Пример кода, скопированный с
Воспроизведенный здесь пример кода выглядит следующим образом:
from datasets import...

0 Ответы

108 Просмотры

Последнее сообщение Anonymous
15 июл 2024, 01:36
Код Pytorch испортит мою оперативную память при использовании torch.zeros ()

Последнее сообщение Anonymous « 13 мар 2025, 00:47
Добавлено в форуме Python

Anonymous » 13 мар 2025, 00:47 » в форуме Python

Итак, у меня есть функция для измерения выделенной оперативной памяти Python в мегабайтах:
def getram(): print(psutil.Process(os.getpid()).memory_info().rss / 1024**2)
, а также у меня есть:
device = cuda
Моя проблема в том, что следующий код...

0 Ответы

11 Просмотры

Последнее сообщение Anonymous
13 мар 2025, 00:47
Код Pytorch испортит мою оперативную память при использовании torch.zeros ()

Последнее сообщение Anonymous « 13 мар 2025, 01:25
Добавлено в форуме Python

Anonymous » 13 мар 2025, 01:25 » в форуме Python

У меня есть функция для измерения выделенной оперативной памяти Python в мегабайтах:
def getram(): print(psutil.Process(os.getpid()).memory_info().rss / 1024**2)
, а также у меня есть:
device = cuda
Моя проблема в том, что следующий код выделяет...

0 Ответы

15 Просмотры

Последнее сообщение Anonymous
13 мар 2025, 01:25

Вернуться в «Python»