У меня есть большой набор данных, содержащий названия мелких/местных компаний, и мне нужно классифицировать каждую компанию по таким секторам, как Технологии, Промышленность, Финансы, Розничная торговля и т. д.
Проблема в следующем:
Эти компании слишком малы, чтобы их можно было найти в Google, LinkedIn или любая другая модель искусственного интеллекта/база знаний, поэтому я не могу полагаться на веб-поиск или поиск искусственного интеллекта.
Я пытался использовать ChatGPT для их классификации, но поскольку этих компаний нет в общедоступных наборах данных, модель делает предположения неверно или непоследовательно.
Что мне нужно:
программный и масштабируемый подход (желательно на Python), чтобы классифицировать названия компаний только на основе самого названия.
Любые рекомендации, идеи, библиотеки или примеры кода будут очень полезны.
Подробнее здесь: https://stackoverflow.com/questions/798 ... dustry-etc
Мобильная версия