Загрузить PHI 3 модели извлечь слой внимания и визуализировать его

Загрузить PHI 3 модели извлечь слой внимания и визуализировать его ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Загрузить PHI 3 модели извлечь слой внимания и визуализировать его

Цитата

Сообщение Anonymous » 20 фев 2025, 21:25

Я хотел бы визуализировать слой внимания Phi-3-Mini-4k-instruct модель, загруженную из обнимающегося листа. В частности, я использую следующую модель, Tokenizer :

Код: Выделить всё

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
import pdb

tokenizer = AutoTokenizer.from_pretrained("microsoft/Phi-3-mini-4k-instruct")

model = AutoModelForCausalLM.from_pretrained(
"microsoft/Phi-3-mini-4k-instruct",
device_map = "cuda:0",
torch_dtype = "auto",
trust_remote_code = True
)

# Create a pipeline
generator = pipeline(
"text-generation",
model = model,
tokenizer = tokenizer,
return_full_text= False,
max_new_tokens = 50,
do_sample = False
)

prompt = "..."
input_ids = tokenizer(prompt, return_tensors = "pt").input_ids
# tokenize the input prompt
input_ids = input_ids.to("cuda:0")
# get the output of the model
model_output = model.model(input_ids)

# extract the attention layer
attention = model_output[-2]
< /code>
Во -первых, я блуждаю, если это правильный способ извлечь внимание из моей модели. Что должно ожидать от этой модели и как я могу ее правильно визуализировать? Разве я не должен ожидать матрицы n_tokens x n_tokens

?

Подробнее здесь: https://stackoverflow.com/questions/794 ... sualize-it

1740075948

Anonymous

 Я хотел бы визуализировать слой внимания Phi-3-Mini-4k-instruct  модель, загруженную из обнимающегося листа. В частности, я использую следующую модель, Tokenizer : 
[code]import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
import pdb

tokenizer = AutoTokenizer.from_pretrained("microsoft/Phi-3-mini-4k-instruct")

model = AutoModelForCausalLM.from_pretrained(
"microsoft/Phi-3-mini-4k-instruct",
device_map = "cuda:0",
torch_dtype = "auto",
trust_remote_code = True
)

# Create a pipeline
generator = pipeline(
"text-generation",
model = model,
tokenizer = tokenizer,
return_full_text= False,
max_new_tokens = 50,
do_sample = False
)

prompt = "..."
input_ids = tokenizer(prompt, return_tensors = "pt").input_ids
# tokenize the input prompt
input_ids = input_ids.to("cuda:0")
# get the output of the model
model_output = model.model(input_ids)

# extract the attention layer
attention = model_output[-2]
< /code>
Во -первых, я блуждаю, если это правильный способ извлечь внимание из моей модели. Что должно ожидать от этой модели и как я могу ее правильно визуализировать? Разве я не должен ожидать матрицы n_tokens x n_tokens [/code]?  

Подробнее здесь: [url]https://stackoverflow.com/questions/79455504/load-phi-3-model-extract-attention-layer-and-visualize-it[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Загрузить PHI 3 модели извлечь слой внимания и визуализировать его

Последнее сообщение Anonymous « 23 фев 2025, 13:54
Добавлено в форуме Python

Anonymous » 23 фев 2025, 13:54 » в форуме Python

Я хотел бы визуализировать слой внимания Phi-3-Mini-4k-instruct модель, загруженную из обнимающегося листа. В частности, я использую следующую модель, Tokenizer :
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline...

0 Ответы

22 Просмотры

Последнее сообщение Anonymous
23 фев 2025, 13:54
Загрузить PHI 3 модели извлечь слой внимания и визуализировать его

Последнее сообщение Anonymous « 24 фев 2025, 16:17
Добавлено в форуме Python

Anonymous » 24 фев 2025, 16:17 » в форуме Python

Я хотел бы визуализировать слой внимания Phi-3-Mini-4k-instruct модель, загруженную из обнимающегося листа. В частности, я использую следующую модель, Tokenizer :
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
24 фев 2025, 16:17
Загрузить PHI 3 модели извлечь слой внимания и визуализировать его

Последнее сообщение Anonymous « 24 фев 2025, 16:49
Добавлено в форуме Python

Anonymous » 24 фев 2025, 16:49 » в форуме Python

Я хотел бы визуализировать уровень внимания модели Phi-3-Medium-4K-instruct (или mini), загруженной из объятия. В частности, я использую следующую модель, Tokenizer :
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer,...

0 Ответы

13 Просмотры

Последнее сообщение Anonymous
24 фев 2025, 16:49
Уровень внимания Keras не возвращает оценки внимания

Последнее сообщение Anonymous « 24 дек 2024, 13:08
Добавлено в форуме Python

Anonymous » 24 дек 2024, 13:08 » в форуме Python

Я использую keras=3.7.0 и пытаюсь реализовать собственный блок Temporal Convolutional Attention Network (TCAN). Хотя уровень внимания работает в автономном тестовом примере, я столкнулся с проблемой при его интеграции в мою пользовательскую модель....

0 Ответы

40 Просмотры

Последнее сообщение Anonymous
24 дек 2024, 13:08
Использование языковой модели Phi-3-Mini квантовая версия в ноутбуке Юпитера

Последнее сообщение Anonymous « 02 фев 2025, 12:41
Добавлено в форуме Python

Anonymous » 02 фев 2025, 12:41 » в форуме Python

Я пытаюсь использовать небольшую языковую модель в ноутбуке Юпитера и не могу найти рабочее решение. Я хочу использовать квантовую версию Phi-3-Mini, так как она достаточно мала, чтобы поместиться на моем GPU, и работает быстрее. But when loading...

0 Ответы

34 Просмотры

Последнее сообщение Anonymous
02 фев 2025, 12:41

Вернуться в «Python»