RuntimeError: Ожидается, что тензор для индексов аргумента № 1 будет иметь один из следующих скалярных типов: Long, Int;

RuntimeError: Ожидается, что тензор для индексов аргумента № 1 будет иметь один из следующих скалярных типов: Long, Int; ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

RuntimeError: Ожидается, что тензор для индексов аргумента № 1 будет иметь один из следующих скалярных типов: Long, Int;

Цитата

Сообщение Anonymous » 08 янв 2025, 20:35

Я хочу применить интегрированные градиенты в качестве метода XAI к предварительно обученной модели обнимающегося лица. Входными данными являются обзоры фильмов, и я использую Captum для создания атрибуции для каждого токена.
Но мой код не запускается. Вот что у меня есть:

Код: Выделить всё

import torch
from transformers import AutoModelForSequenceClassification, AutoTokenizer
from captum.attr import IntegratedGradients

device = torch.device("cuda" if torch.cuda.is_available() else "mps" if torch.backends.mps.is_available() else "cpu")

# load model and tokenizer
model_name = "lxyuan/distilbert-base-multilingual-cased-sentiments-student"
model = AutoModelForSequenceClassification.from_pretrained(model_name).to(device)
tokenizer = AutoTokenizer.from_pretrained(model_name)

# let's get it to run with this first
text = "I love this movie! It's amazing and heartfelt."
bl_text = ""  # baseline

# tokenize
input_ids = tokenizer(text, return_tensors="pt", padding=True, truncation=True)['input_ids']

input_length = input_ids.shape[1]

# create baseline that has same length as input
b_input_ids = tokenizer(bl_text, return_tensors="pt", padding="max_length", max_length=input_length, truncation=True)["input_ids"]

# cast tensors (got that from stackoverflow thread [chatGPT didn't help either])
input_ids = torch.tensor(input_ids).to(device).to(torch.int64)
b_input_ids = torch.tensor(b_input_ids).to(device).to(torch.int64)

# trying if the model works i.g.
# produced output:  SequenceClassifierOutput(loss=None, logits=tensor([[ 3.7188, -1.5369, -2.4152]], device='mps:0',
#                           grad_fn=), hidden_states=None, attentions=None)
output = model(input_ids)
print(output)

target_class = 2

ig = IntegratedGradients(model)

# check if types are correct before going further
print("Inputs dtype:", input_ids.dtype)  # expects: torch.int64 (success)
print("Baseline dtype:", b_input_ids.dtype)  # expects: torch.int64 (success)
print("Inputs device:", input_ids.device)  # expects: mps (success)
print("Baseline device:", b_input_ids.device)  # expects: mps (success)

# calc attributions
attributions, delta = ig.attribute(
input_ids,
b_input_ids,
target=target_class,
return_convergence_delta=True,
)

tokens = tokenizer.convert_ids_to_tokens(input_ids[0].tolist())
attributions = attributions[0].detach().cpu().numpy()

print("token with attributes:")
for token, attribution in zip(tokens, attributions):
print(f"{token}: {attribution}")

Как только я запускаю код, я получаю следующую ошибку RuntimeError:

Код: Выделить всё

Traceback (most recent call last):
File "/Users/Explainable AI/Project/Integrated_Gradients_Project/integ_grad.py", line 45, in 
attributions, delta = ig.attribute(
^^^^^^^^^^^^^
[...]
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "/Users/x/.pyenv/versions/3.12.0/lib/python3.12/site-packages/torch/nn/modules/sparse.py", line 190, in forward
return F.embedding(
^^^^^^^^^^^^
File "/Users/x/.pyenv/versions/3.12.0/lib/python3.12/site-packages/torch/nn/functional.py", line 2551, in embedding
return torch.embedding(weight, input, padding_idx, scale_grad_by_freq, sparse)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
RuntimeError: Expected tensor for argument #1 'indices' to have one of the following scalar types: Long, Int; but got MPSFloatType instead (while checking arguments for embedding)

Process finished with exit code 1

Я уже пытался использовать не MPS, а только свой процессор, но это привело к эквивалентной ошибке: теперь тип torch.FloatTensor вместо требуемого Int/Long.
Как вы можете видеть, я использую Python 3.12.0 с недавно установленными PyTorch, Captum, Transfomers, используя виртуальную среду. Я также искал в Интернете и stackoverflow, но решения мне не помогли.
Если вам нужна дополнительная информация, свяжитесь со мной. Заранее спасибо!

Подробнее здесь: https://stackoverflow.com/questions/793 ... -the-follo

1736357707

Anonymous

Я хочу применить интегрированные градиенты в качестве метода XAI к предварительно обученной модели обнимающегося лица. Входными данными являются обзоры фильмов, и я использую Captum для создания атрибуции для каждого токена.
Но мой код не запускается. Вот что у меня есть:
[code]import torch
from transformers import AutoModelForSequenceClassification, AutoTokenizer
from captum.attr import IntegratedGradients

device = torch.device("cuda" if torch.cuda.is_available() else "mps" if torch.backends.mps.is_available() else "cpu")

# load model and tokenizer
model_name = "lxyuan/distilbert-base-multilingual-cased-sentiments-student"
model = AutoModelForSequenceClassification.from_pretrained(model_name).to(device)
tokenizer = AutoTokenizer.from_pretrained(model_name)

# let's get it to run with this first
text = "I love this movie! It's amazing and heartfelt."
bl_text = ""  # baseline

# tokenize
input_ids = tokenizer(text, return_tensors="pt", padding=True, truncation=True)['input_ids']

input_length = input_ids.shape[1]

# create baseline that has same length as input
b_input_ids = tokenizer(bl_text, return_tensors="pt", padding="max_length", max_length=input_length, truncation=True)["input_ids"]

# cast tensors (got that from stackoverflow thread [chatGPT didn't help either])
input_ids = torch.tensor(input_ids).to(device).to(torch.int64)
b_input_ids = torch.tensor(b_input_ids).to(device).to(torch.int64)

# trying if the model works i.g.
# produced output:  SequenceClassifierOutput(loss=None, logits=tensor([[ 3.7188, -1.5369, -2.4152]], device='mps:0',
#                           grad_fn=), hidden_states=None, attentions=None)
output = model(input_ids)
print(output)

target_class = 2

ig = IntegratedGradients(model)

# check if types are correct before going further
print("Inputs dtype:", input_ids.dtype)  # expects: torch.int64 (success)
print("Baseline dtype:", b_input_ids.dtype)  # expects: torch.int64 (success)
print("Inputs device:", input_ids.device)  # expects: mps (success)
print("Baseline device:", b_input_ids.device)  # expects: mps (success)

# calc attributions
attributions, delta = ig.attribute(
input_ids,
b_input_ids,
target=target_class,
return_convergence_delta=True,
)

tokens = tokenizer.convert_ids_to_tokens(input_ids[0].tolist())
attributions = attributions[0].detach().cpu().numpy()

print("token with attributes:")
for token, attribution in zip(tokens, attributions):
print(f"{token}: {attribution}")
[/code]
Как только я запускаю код, я получаю следующую ошибку RuntimeError:
[code]Traceback (most recent call last):
File "/Users/Explainable AI/Project/Integrated_Gradients_Project/integ_grad.py", line 45, in 
attributions, delta = ig.attribute(
^^^^^^^^^^^^^
[...]
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
File "/Users/x/.pyenv/versions/3.12.0/lib/python3.12/site-packages/torch/nn/modules/sparse.py", line 190, in forward
return F.embedding(
^^^^^^^^^^^^
File "/Users/x/.pyenv/versions/3.12.0/lib/python3.12/site-packages/torch/nn/functional.py", line 2551, in embedding
return torch.embedding(weight, input, padding_idx, scale_grad_by_freq, sparse)
^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
RuntimeError: Expected tensor for argument #1 'indices' to have one of the following scalar types: Long, Int; but got MPSFloatType instead (while checking arguments for embedding)

Process finished with exit code 1
[/code]
Я уже пытался использовать не MPS, а только свой процессор, но это привело к эквивалентной ошибке: теперь тип torch.FloatTensor вместо требуемого Int/Long.
Как вы можете видеть, я использую Python 3.12.0 с недавно установленными PyTorch, Captum, Transfomers, используя виртуальную среду. Я также искал в Интернете и stackoverflow, но решения мне не помогли.
Если вам нужна дополнительная информация, свяжитесь со мной. Заранее спасибо! 

Подробнее здесь: [url]https://stackoverflow.com/questions/79340235/runtimeerror-expected-tensor-for-argument-1-indices-to-have-one-of-the-follo[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как преобразовать список[int, int, int] в кортеж[int, int, int], а не в кортеж[int, ...]

Последнее сообщение Anonymous « 27 апр 2024, 23:47
Добавлено в форуме Python

Anonymous » 27 апр 2024, 23:47 » в форуме Python

Предположим, у меня есть две функции: func1 и func2. func1 возвращает список из 3 целых чисел, а func2 принимает кортеж из 3 целых чисел. Как мне преобразовать список в кортеж таким образом, чтобы можно было предотвратить ошибки с помощью средств...

0 Ответы

288 Просмотры

Последнее сообщение Anonymous
27 апр 2024, 23:47
Почему `long long typedef ll` работает так же, как `typedef long long ll`? [дубликат]

Последнее сообщение Гость « 27 фев 2024, 19:15
Добавлено в форуме C++

Гость » 27 фев 2024, 19:15 » в форуме C++

В основном заголовок; Я наткнулся на код C++, который имел long long typedef LL; вместо того, что все ожидали, что-то вроде typedef long long LL;. Это волшебным образом сработало!

Я никогда не видел никакой документации по этому поводу и понятия...

0 Ответы

128 Просмотры

Последнее сообщение Гость
27 фев 2024, 19:15
Почему «long long and = n * n;» правильно, но "long long temp = (n - i - 1) * (n - i - 1);" неправильно? [закрыто]

Последнее сообщение Anonymous « 27 янв 2025, 04:37
Добавлено в форуме C++

Anonymous » 27 янв 2025, 04:37 » в форуме C++

Мне нужно вычислить некоторые значения в большом массиве. Я заметил, что следующие два фрагмента кода ведут себя по-разному с точки зрения корректности при использовании long long:
long long ans = n * n;

и
long long temp = (n - i - 1) * (n - i -...

0 Ответы

32 Просмотры

Последнее сообщение Anonymous
27 янв 2025, 04:37
RuntimeError: mat1 и mat2 должны иметь один и тот же тип dtype, но иметь Long и Float

Последнее сообщение Anonymous « 23 окт 2024, 08:42
Добавлено в форуме Python

Anonymous » 23 окт 2024, 08:42 » в форуме Python

Я работаю над тонкой настройкой модели SpeechT5 TTS. Первоначально я вручную собрал некоторые элементы для набора данных и начал их предварительную обработку. После предварительной обработки я сохранил их в формате «.npy». Но я столкнулся с ошибкой...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
23 окт 2024, 08:42
RuntimeError: mat1 и mat2 должны иметь один и тот же тип dtype, но иметь Long и Float

Последнее сообщение Anonymous « 23 окт 2024, 12:43
Добавлено в форуме Python

Anonymous » 23 окт 2024, 12:43 » в форуме Python

Я работаю над тонкой настройкой модели SpeechT5 TTS. Первоначально я вручную собрал некоторые элементы для набора данных и начал их предварительную обработку. После предварительной обработки я сохранил их в формате «.npy». Но я столкнулся с ошибкой...

0 Ответы

42 Просмотры

Последнее сообщение Anonymous
23 окт 2024, 12:43

Вернуться в «Python»