Есть ли какие-либо недостатки в многократной установке umap? - Цифровое Кемерово

Есть ли какие-либо недостатки в многократной установке umap? ⇐ Python

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Anonymous

Есть ли какие-либо недостатки в многократной установке umap?

Цитата

Сообщение Anonymous » 22 ноя 2024, 08:18

Пытаясь уменьшить количество результатов встраивания различных моделей обнимающихся лиц, я наткнулся на TSNE, который должен был помочь в уменьшении размеров. Однако при дальнейшем чтении TSNE выясняется, что выходные данные подходят только для ввода данных, и любые дополнительные входные данные не могут быть сопоставимы.
Я нашел umap в качестве замены, поскольку он выполнял те же функции, что и TSNE, но его можно было обучить и использовать для будущих точек данных.
мой вопрос касается протокола обучения. Существует ли оптимальный метод обучения таких преобразователей, как umap? Система, над которой я работаю, имеет ограниченные ресурсы, поэтому обучение в одной большой группе не является оптимальным.
Моя текущая настройка следующая
import umap
from transformers import AutoModel, AutoTokenizer

text_list = ["words", . . .] # this is 10000+ words

def generate_tensor(text_list):
. . .
return tensor_list # n x 768 embeddings, n = len(text_list)

reducer = umap.UMAP(n_components=3, random_state=80085, init='spectral'})

for x in range(0,100,100):
pro_list = word_list[x:x+100]
tensors_data = generate_tensor(pro_list)
tensors_numpy = tensors_data.detach().numpy()
reducer.fit(tensors_numpy)

Подробнее здесь: https://stackoverflow.com/questions/792 ... repeatedly

Реклама

1732252699

Anonymous

Пытаясь уменьшить количество результатов встраивания различных моделей обнимающихся лиц, я наткнулся на TSNE, который должен был помочь в уменьшении размеров. Однако при дальнейшем чтении TSNE выясняется, что выходные данные подходят только для ввода данных, и любые дополнительные входные данные не могут быть сопоставимы.
Я нашел umap в качестве замены, поскольку он выполнял те же функции, что и TSNE, но его можно было обучить и использовать для будущих точек данных.
мой вопрос касается протокола обучения. Существует ли оптимальный метод обучения таких преобразователей, как umap? Система, над которой я работаю, имеет ограниченные ресурсы, поэтому обучение в одной большой группе не является оптимальным.
Моя текущая настройка следующая
import umap
from transformers import AutoModel, AutoTokenizer

text_list = ["words", . . .] # this is 10000+ words

def generate_tensor(text_list):
. . .
return tensor_list # n x 768 embeddings, n = len(text_list)

reducer = umap.UMAP(n_components=3, random_state=80085, init='spectral'})

for x in range(0,100,100):
pro_list = word_list[x:x+100]
tensors_data = generate_tensor(pro_list)
tensors_numpy = tensors_data.detach().numpy()
reducer.fit(tensors_numpy)
 

Подробнее здесь: [url]https://stackoverflow.com/questions/79213750/is-there-any-disadvantages-to-fitting-umap-repeatedly[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как устранить ошибку «У модуля umap нет атрибута UMAP». Я пробовал установить и переустановить umap, но у меня ничего не

Последнее сообщение Anonymous « 12 дек 2024, 09:37
Добавлено в форуме Python

Anonymous » 12 дек 2024, 09:37 » в форуме Python

AttributeError: module 'umap' has no attribute 'UMAP'

Я пробовал устанавливать и переустанавливать различные библиотеки umap и umap Learn, но ничего не помогло.

Подробнее здесь:

0 Ответы

26 Просмотры

Последнее сообщение Anonymous
12 дек 2024, 09:37
Дополнительное пустое пространство при многократной печати

Последнее сообщение Anonymous « 07 окт 2023, 18:35
Добавлено в форуме IOS

Anonymous » 07 окт 2023, 18:35 » в форуме IOS

У меня возникла проблема: я пытаюсь распечатать одну и ту же страницу несколько раз, нажимая кнопки печати, которые я создал в проекте приложения для iPad. У меня есть лишнее пустое место вверху страницы (4 см).

Если URL-адрес принтера равен нулю,...

0 Ответы

41 Просмотры

Последнее сообщение Anonymous
07 окт 2023, 18:35
Измените соответствующий файл конфигурации на основе переменной среды без многократной сборки приложения.

Последнее сообщение Anonymous « 13 апр 2024, 15:45
Добавлено в форуме C#

Anonymous » 13 апр 2024, 15:45 » в форуме C#

У меня есть приложение для Windows, разработанное на C#, которое имеет 3 файла конфигурации, а именно dev.config, qa.config и prod.config.
В моем основном файле app.config я написал что-то вроде этого:

И когда мне приходится развертывать в другой...

0 Ответы

49 Просмотры

Последнее сообщение Anonymous
13 апр 2024, 15:45
ModuleNotFoundError: нет модуля с именем «mysql» даже после многократной установки mysqlconnector.

Последнее сообщение Anonymous « 19 сен 2024, 15:39
Добавлено в форуме Python

Anonymous » 19 сен 2024, 15:39 » в форуме Python

Я впервые пишу здесь, поэтому прошу прощения за путаницу.
Постоянно получаю эту ошибку.
Ошибка указывает на то, что пакет mysql не установлен в среде. я устанавливал это несколько раз разными способами, но при поиске все равно получаю ту же ошибку....

0 Ответы

19 Просмотры

Последнее сообщение Anonymous
19 сен 2024, 15:39
Как ускорить работу многократной фильтрации и создать столбцы с отфильтрованными значениями?

Последнее сообщение Anonymous « 09 ноя 2024, 15:19
Добавлено в форуме Python

Anonymous » 09 ноя 2024, 15:19 » в форуме Python

Задача состоит в том, чтобы отфильтровать кадр данных Polars df с множеством условий, создать столбцы значений для каждого условия, а затем объединить все sub_df среди всех условий.
import polars as pl
from itertools import product

df =...

0 Ответы

30 Просмотры

Последнее сообщение Anonymous
09 ноя 2024, 15:19

Вернуться в «Python»

Programmiererforum