Загрузить PHI 3 модели извлечь слой внимания и визуализировать его

Загрузить PHI 3 модели извлечь слой внимания и визуализировать его ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Загрузить PHI 3 модели извлечь слой внимания и визуализировать его

Цитата

Сообщение Anonymous » 24 фев 2025, 16:49

Я хотел бы визуализировать уровень внимания модели Phi-3-Medium-4K-instruct (или mini), загруженной из объятия. В частности, я использую следующую модель, Tokenizer :

Код: Выделить всё

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
import pdb

tokenizer = AutoTokenizer.from_pretrained("microsoft/Phi-3-medium-4k-instruct")

model = AutoModelForCausalLM.from_pretrained(
"microsoft/Phi-3-meduium-4k-instruct",
device_map = "auto",
torch_dtype = "auto",
trust_remote_code = True
)

# Create a pipeline
generator = pipeline(
"text-generation",
model = model,
tokenizer = tokenizer,
return_full_text= False,
max_new_tokens = 50,
do_sample = False
)

prompt = "..."
input_ids = tokenizer(prompt, return_tensors = "pt").input_ids
# tokenize the input prompt
input_ids = input_ids.to("cuda:0")
# get the output of the model
model_output = model.model(input_ids)

# extract the attention layer
attention = model_output[-1]
< /code>
Во -первых, мне интересно, является ли это правильным способом извлечь внимание из моей модели. Что должно ожидать от этой модели и как я могу ее правильно визуализировать? Разве я не должен ожидать матрицы n_tokens x n_tokens

?
Внимание переменная, которую я извлекла, имеет размер 1x40x40x15x15 (или 1x12x12x15x15 в случае Mini модели), где первое измерение соответствует разным слоям второй для разных Heads , и последние два для матрицы внимания . Это на самом деле мое предположение, и я не уверен, правильно ли это. Когда я визуализирую внимание, я получаю некоторые очень странные матрицы, такие как:
< /p>
То, что мы видим на этом рисунке, я предполагаю, что все головы для одного слоя. Тем не менее, большинство голов в равной степени распространяют внимание на все токены. Это имеет смысл?

Подробнее здесь: https://stackoverflow.com/questions/794 ... sualize-it

1740404974

Anonymous

 Я хотел бы визуализировать уровень внимания модели Phi-3-Medium-4K-instruct  (или mini), загруженной из объятия. В частности, я использую следующую модель, Tokenizer : 
[code]import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline
import pdb

tokenizer = AutoTokenizer.from_pretrained("microsoft/Phi-3-medium-4k-instruct")

model = AutoModelForCausalLM.from_pretrained(
"microsoft/Phi-3-meduium-4k-instruct",
device_map = "auto",
torch_dtype = "auto",
trust_remote_code = True
)

# Create a pipeline
generator = pipeline(
"text-generation",
model = model,
tokenizer = tokenizer,
return_full_text= False,
max_new_tokens = 50,
do_sample = False
)

prompt = "..."
input_ids = tokenizer(prompt, return_tensors = "pt").input_ids
# tokenize the input prompt
input_ids = input_ids.to("cuda:0")
# get the output of the model
model_output = model.model(input_ids)

# extract the attention layer
attention = model_output[-1]
< /code>
Во -первых, мне интересно, является ли это правильным способом извлечь внимание из моей модели. Что должно ожидать от этой модели и как я могу ее правильно визуализировать? Разве я не должен ожидать матрицы n_tokens x n_tokens [/code]? 
Внимание  переменная, которую я извлекла, имеет размер 1x40x40x15x15  (или 1x12x12x15x15  в случае Mini  модели), где первое измерение соответствует разным слоям второй для разных Heads , и последние два для матрицы внимания . Это на самом деле мое предположение, и я не уверен, правильно ли это. Когда я визуализирую внимание, я получаю некоторые очень странные матрицы, такие как: 
 < /p>
То, что мы видим на этом рисунке, я предполагаю, что все головы для одного слоя. Тем не менее, большинство голов в равной степени распространяют внимание на все токены. Это имеет смысл?  

Подробнее здесь: [url]https://stackoverflow.com/questions/79455504/load-phi-3-model-extract-attention-layer-and-visualize-it[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Загрузить PHI 3 модели извлечь слой внимания и визуализировать его

Последнее сообщение Anonymous « 20 фев 2025, 21:25
Добавлено в форуме Python

Anonymous » 20 фев 2025, 21:25 » в форуме Python

Я хотел бы визуализировать слой внимания Phi-3-Mini-4k-instruct модель, загруженную из обнимающегося листа. В частности, я использую следующую модель, Tokenizer :
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
20 фев 2025, 21:25
Загрузить PHI 3 модели извлечь слой внимания и визуализировать его

Последнее сообщение Anonymous « 23 фев 2025, 13:54
Добавлено в форуме Python

Anonymous » 23 фев 2025, 13:54 » в форуме Python

Я хотел бы визуализировать слой внимания Phi-3-Mini-4k-instruct модель, загруженную из обнимающегося листа. В частности, я использую следующую модель, Tokenizer :
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
23 фев 2025, 13:54
Загрузить PHI 3 модели извлечь слой внимания и визуализировать его

Последнее сообщение Anonymous « 24 фев 2025, 16:17
Добавлено в форуме Python

Anonymous » 24 фев 2025, 16:17 » в форуме Python

Я хотел бы визуализировать слой внимания Phi-3-Mini-4k-instruct модель, загруженную из обнимающегося листа. В частности, я использую следующую модель, Tokenizer :
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline...

0 Ответы

7 Просмотры

Последнее сообщение Anonymous
24 фев 2025, 16:17
Уровень внимания Keras не возвращает оценки внимания

Последнее сообщение Anonymous « 24 дек 2024, 13:08
Добавлено в форуме Python

Anonymous » 24 дек 2024, 13:08 » в форуме Python

Я использую keras=3.7.0 и пытаюсь реализовать собственный блок Temporal Convolutional Attention Network (TCAN). Хотя уровень внимания работает в автономном тестовом примере, я столкнулся с проблемой при его интеграции в мою пользовательскую модель....

0 Ответы

41 Просмотры

Последнее сообщение Anonymous
24 дек 2024, 13:08
Использование языковой модели Phi-3-Mini квантовая версия в ноутбуке Юпитера

Последнее сообщение Anonymous « 02 фев 2025, 12:41
Добавлено в форуме Python

Anonymous » 02 фев 2025, 12:41 » в форуме Python

Я пытаюсь использовать небольшую языковую модель в ноутбуке Юпитера и не могу найти рабочее решение. Я хочу использовать квантовую версию Phi-3-Mini, так как она достаточно мала, чтобы поместиться на моем GPU, и работает быстрее. But when loading...

0 Ответы

35 Просмотры

Последнее сообщение Anonymous
02 фев 2025, 12:41

Вернуться в «Python»