Задача моделирования с открытым набором обработки телефонных исследований с открытым концомPython

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Задача моделирования с открытым набором обработки телефонных исследований с открытым концом

Сообщение Anonymous »

Я работаю с набором данных, размером около ~ 900 данных DataPoints W.R.T, на открытый обследование удовлетворенности. чрезвычайно гетероген, собирается и транскрибируется несколькими разными интервьюерами, которые имеют разные методы отмечения того, что написали респонденты. У некоторых есть номер идентификации опроса, упомянутый в стенограмме, некоторые нет, некоторые из них находятся от первого лица, а некоторые от третьего лица, в нескольких ответах есть ошибки правописания и т. Д. В такой ситуации, если я запускаю обычный классификатор BERT и получу векторные встраивания, будет ли это значимым? Я предполагаю, что мне нужно преобразовать данные в какую -то однородную форму, после которой я могу сделать любой анализ. Получив эту выдающуюся тему, я предполагаю, что мне придется вручную пометить некоторые данные и провести некоторое тестирование/обучение, но я немного нечетком в процессе и буду признателен за любую помощь. Спасибо!

Подробнее здесь: https://stackoverflow.com/questions/796 ... se-dataset
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»