Как составить карту моста? - Цифровое Кемерово

Как составить карту моста? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Как составить карту моста?

Цитата

Сообщение Anonymous » 06 янв 2025, 10:16

Предположим, num_classes = пакетный_размер = N

Код: Выделить всё

mention_embeddings = [M, dim]

class_index = [M, 1] # (already sorted) . Eg [0,0,0,1,1,2,3,4...] means 3 first mentions have the same class and so on.

# Note: max(class_index) = N - 1 as we have N classes and M >= N

Каждый класс может иметь несколько кластеров. После обнаружения кластеров каждого класса у меня есть:

Код: Выделить всё

cluster_index = [M, 1] # an array indicates which mention index are in the same cluster. E.g [0, 1, 0, 2, 3, 3, .... ] means mention at index 0, and 2 are the same cluster,...

num_clusters = torch.unquie(cluster_index) # -> K cluster. N  from [N, 1] => [M, 1]
positive_labels = positive_labels[cluster_label_index] # choose K indices from M indices from [M, 1] => [K, 1]

Меня просто беспокоит, имеет ли он последовательный порядок между встраиваниями кластера и соответствующими им положительными и отрицательными метками.
Я это вижу для этого подхода мне нужно назвать метку кластера по индексу от 0 -> K-1, поэтому, когда я вычисляю встраивания кластера с помощью index_add_, она сопоставляется с упорядоченным индексом, я думаю, от 0 -> K-1
также эта строка код:

Код: Выделить всё

 cluster_label_index = torch.cat([item.view(-1, )
for item in cluster_label_index_mapping.values()]
)

Я не уверен, что unique_label в torch.unique(cluster_index) всегда дает мне одинаковый порядок от 0 -> K-1 (или у меня есть чтобы отсортировать его)
Этот подход довольно длинный и непростой

но с помощью class_index для указания класса упоминания (поскольку количество упоминаний в каждом классе не является то же самое, поэтому я не могу сохранить его в 2D тензор), я экономлю много памяти. Что вы думаете? или у вас есть другие идеи?

Подробнее здесь: https://stackoverflow.com/questions/793 ... ge-mapping

1736147782

Anonymous

Предположим, num_classes = пакетный_размер = N
[code]mention_embeddings = [M, dim]

class_index = [M, 1] # (already sorted) . Eg [0,0,0,1,1,2,3,4...] means 3 first mentions have the same class and so on.

# Note: max(class_index) = N - 1 as we have N classes and M >= N

[/code]
Каждый класс может иметь несколько кластеров. После обнаружения кластеров каждого класса у меня есть:
[code]cluster_index = [M, 1] # an array indicates which mention index are in the same cluster. E.g [0, 1, 0, 2, 3, 3, .... ] means mention at index 0, and 2 are the same cluster,...

num_clusters = torch.unquie(cluster_index) # -> K cluster. N  from [N, 1] => [M, 1]
positive_labels = positive_labels[cluster_label_index] # choose K indices from M indices from [M, 1] => [K, 1]
[/code]
Меня просто беспокоит, имеет ли он последовательный порядок между встраиваниями кластера и соответствующими им положительными и отрицательными метками.
Я это вижу для этого подхода мне нужно назвать метку кластера по индексу от 0 -> K-1, поэтому, когда я вычисляю встраивания кластера с помощью index_add_, она сопоставляется с упорядоченным индексом, я думаю, от 0 -> K-1
также эта строка код:
[code] cluster_label_index = torch.cat([item.view(-1, )
for item in cluster_label_index_mapping.values()]
)
[/code]
Я не уверен, что unique_label в torch.unique(cluster_index) всегда дает мне одинаковый порядок от 0 -> K-1 (или у меня есть чтобы отсортировать его)
Этот подход довольно длинный и непростой :) но с помощью class_index для указания класса упоминания (поскольку количество упоминаний в каждом классе не является то же самое, поэтому я не могу сохранить его в 2D тензор), я экономлю много памяти. Что вы думаете? или у вас есть другие идеи? 

Подробнее здесь: [url]https://stackoverflow.com/questions/79332309/how-to-do-bridge-mapping[/url]