Как я могу гарантировать, что короткие или общие слова будут найдены в качестве релевантных результатов при использовани

Как я могу гарантировать, что короткие или общие слова будут найдены в качестве релевантных результатов при использовани ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Как я могу гарантировать, что короткие или общие слова будут найдены в качестве релевантных результатов при использовани

Цитата

Сообщение Anonymous » 18 дек 2024, 15:48

У меня есть список из около 11 000 различных тегов. Я хочу присвоить компаниям соответствующие теги на основе их описания. Описание представляет собой короткий текст длиной около 1000 символов, описывающий компанию и предлагаемые ею услуги. Я встроил текст и теги и использовал косинусное сходство, чтобы получить список наиболее релевантных тегов. Это работает относительно хорошо, но я заметил, что более конкретные (длинные) теги имеют преимущество перед более общими. Например:
Компания может производить сельскохозяйственную технику. Могут быть найдены следующие теги:
'сельскохозяйственная техника', 'машиностроение', 'сельскохозяйственная техника'
Но есть и более общие теги. в наборе данных, которые также могут иметь отношение к компании, например «оборудование».
Причина, по которой я хочу, чтобы эти более общие теги также сопоставлялись, заключается в том, что я ожидаю, что пользователи будут чаще использовать более общие теги. часто, если я не назначу эти теги, которые зачастую компании могут быть не найдены.
Каков будет хороший подход к сопоставлению более общих тегов с описаниями компаний?

Подробнее здесь: https://stackoverflow.com/questions/792 ... ts-when-us

1734526111

Anonymous

Подробнее здесь: [url]https://stackoverflow.com/questions/79291158/how-can-i-make-sure-short-or-generic-words-are-found-as-relevant-results-when-us[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как я могу гарантировать, что короткие или общие слова будут найдены в качестве релевантных результатов при использовани

Последнее сообщение Anonymous « 19 дек 2024, 01:11
Добавлено в форуме Python

Anonymous » 19 дек 2024, 01:11 » в форуме Python

У меня есть список из около 11 000 различных тегов. Я хочу присвоить компаниям соответствующие теги на основе их описания. Описание представляет собой короткий текст длиной около 1000 символов, описывающий компанию и предлагаемые ею услуги. Я...

0 Ответы

10 Просмотры

Последнее сообщение Anonymous
19 дек 2024, 01:11
Вложенное исключение — org.hibernate.HibernateException: найдены общие ссылки на коллекцию.

Последнее сообщение Anonymous « 18 ноя 2024, 16:59
Добавлено в форуме JAVA

Anonymous » 18 ноя 2024, 16:59 » в форуме JAVA

У меня есть две такие сущности:
@Data
@Builder
@Entity
@FieldDefaults(level = AccessLevel.PRIVATE)
@AllArgsConstructor
@NoArgsConstructor
@Table(name = refund_initiate ,uniqueConstraints={@UniqueConstraint(columnNames={ device_code ,...

0 Ответы

14 Просмотры

Последнее сообщение Anonymous
18 ноя 2024, 16:59
Вложенное исключение — org.hibernate.HibernateException: найдены общие ссылки на коллекцию.

Последнее сообщение Anonymous « 18 ноя 2024, 19:30
Добавлено в форуме JAVA

Anonymous » 18 ноя 2024, 19:30 » в форуме JAVA

У меня есть две такие сущности:
@Data
@Builder
@Entity
@FieldDefaults(level = AccessLevel.PRIVATE)
@AllArgsConstructor
@NoArgsConstructor
@Table(name = refund_initiate ,uniqueConstraints={@UniqueConstraint(columnNames={ device_code ,...

0 Ответы

18 Просмотры

Последнее сообщение Anonymous
18 ноя 2024, 19:30
Как заставить scikit-learn гарантировать, что сумма всех результатов прогнозирования должна составлять 100%?

Последнее сообщение Anonymous « 08 ноя 2024, 15:12
Добавлено в форуме Python

Anonymous » 08 ноя 2024, 15:12 » в форуме Python

У меня есть «MultiOutputRegressor», основанный на регрессоре «LinearReгрессия».
Я использую его для прогнозирования трех выходных данных в каждой строке X_data (например, классификатор), которые представляют собой процентную вероятность трех...

0 Ответы

23 Просмотры

Последнее сообщение Anonymous
08 ноя 2024, 15:12
Как я могу гарантировать, что Azure Text-Speek правильно произносит переводы на слова для слов?

Последнее сообщение Anonymous « 20 июн 2025, 10:16
Добавлено в форуме Python

Anonymous » 20 июн 2025, 10:16 » в форуме Python

Я работаю над приложением, используя Azure, Gemini, Python и DART, и я хочу убедиться, что произношение между языками на месте. Например, я хочу перевести между немецким и испанским языком: цель состоит в том, чтобы «Hallo» -> 'Hola' правильно...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
20 июн 2025, 10:16

Вернуться в «Python»