Как люди собирают данные, используя Crawlers для тонкой настройки? [закрыто]Python

Программы на Python
Ответить Пред. темаСлед. тема
Anonymous
 Как люди собирают данные, используя Crawlers для тонкой настройки? [закрыто]

Сообщение Anonymous »

Я довольно новичок в ML, и я хотел точно настроить модель (базу T5) с помощью собственного набора данных. Есть несколько проблем, с которыми я сталкивался: < /p>
  • Написание сценария для сокраски различных веб -сайтов, но он поставляется с большим количеством шума. образцы и прийти к выводу, что я не должен был тратить свое время в первую очередь. /> Использование CHATGPT для генерации образцов. (Сгенерированные образцы недостаточно хороши для тонкой настройки, и большинство из них повторяются.) Чудо.) (TBF Я также хотел собрать данные самостоятельно, чтобы увидеть, как это работает)
    Итак, мой вопрос: есть ли какой -нибудь способ проще получить чистые данные? Какие сканеры/сценарии я могу использовать, чтобы помочь мне автоматизировать этот процесс? Или точнее я хочу знать, что такое решение/техника, которая используется для сбора данных.


Подробнее здесь: https://stackoverflow.com/questions/797 ... ine-tuning
Реклама
Ответить Пред. темаСлед. тема

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

  • Похожие темы
    Ответы
    Просмотры
    Последнее сообщение

Вернуться в «Python»