Как лучше всего сравнить несколько корпусов естественного языка? - Цифровое Кемерово

Как лучше всего сравнить несколько корпусов естественного языка? ⇐ Python

Ответить

1 сообщение • Страница 1 из 1

Anonymous

Как лучше всего сравнить несколько корпусов естественного языка?

Цитата

Сообщение Anonymous » 30 окт 2024, 06:10

Я создавал тематические модели LDA для повествовательных отчетов на естественном языке для исследовательского проекта (используя Gensim с Python). У меня есть несколько небольших корпусов (от 1400 до 200 документов каждый — я знаю, это крошечно!), которые я хотел бы сравнить, но я не знаю, как это сделать, кроме как рассматривать каждую модель LDA (например, с помощью pyLDAviz). . Мое академическое образование не связано с компьютерными науками, и я все еще немного новичок в НЛП.

Каковы хорошие способы сравнения тем между корпусами/тематическими моделями? Например, можно ли оценить, насколько пересекаются две модели LDA? Или есть другие способы оценить сходство тем нескольких корпусов?

Заранее спасибо за помощь!

Подробнее здесь: https://stackoverflow.com/questions/460 ... l-language

1730257821

Anonymous

Я создавал тематические модели LDA для повествовательных отчетов на естественном языке для исследовательского проекта (используя Gensim с Python). У меня есть несколько небольших корпусов (от 1400 до 200 документов каждый — я знаю, это крошечно!), которые я хотел бы сравнить, но я не знаю, как это сделать, кроме как рассматривать каждую модель LDA (например, с помощью pyLDAviz). . Мое академическое образование не связано с компьютерными науками, и я все еще немного новичок в НЛП.

Каковы хорошие способы сравнения тем между корпусами/тематическими моделями? Например, можно ли оценить, насколько пересекаются две модели LDA? Или есть другие способы оценить сходство тем нескольких корпусов?

Заранее спасибо за помощь! 

Подробнее здесь: [url]https://stackoverflow.com/questions/46001910/whats-the-best-way-to-compare-several-corpora-in-natural-language[/url]

Ответить

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Вернуться в «Python»

Programmiererforum