Я довольно новичок в ML, и я хотел точно настроить модель (базу T5) с помощью собственного набора данных. Есть несколько проблем, с которыми я сталкивался: < /p>
Написание сценария для сокраски различных веб -сайтов, но он поставляется с большим количеством шума. образцы и прийти к выводу, что я не должен был тратить свое время в первую очередь. /> Использование CHATGPT для генерации образцов. (Сгенерированные образцы недостаточно хороши для тонкой настройки, и большинство из них повторяются.) Чудо.) (TBF Я также хотел собрать данные самостоятельно, чтобы увидеть, как это работает)
Итак, мой вопрос: есть ли какой -нибудь способ проще получить чистые данные? Какие сканеры/сценарии я могу использовать, чтобы помочь мне автоматизировать этот процесс? Или точнее я хочу знать, что такое решение/техника, которая используется для сбора данных.
Я довольно новичок в ML, и я хотел точно настроить модель (базу T5) с помощью собственного набора данных. Есть несколько проблем, с которыми я сталкивался: < /p> [list] [*] Написание сценария для сокраски различных веб -сайтов, но он поставляется с большим количеством шума. образцы и прийти к выводу, что я не должен был тратить свое время в первую очередь. /> Использование CHATGPT для генерации образцов. (Сгенерированные образцы недостаточно хороши для тонкой настройки, и большинство из них повторяются.) Чудо.) (TBF Я также хотел собрать данные самостоятельно, чтобы увидеть, как это работает) Итак, мой вопрос: есть ли какой -нибудь способ проще получить чистые данные? Какие сканеры/сценарии я могу использовать, чтобы помочь мне автоматизировать этот процесс? Или точнее я хочу знать, что такое решение/техника, которая используется для сбора данных. [/list]
Можно ли создать такое приложение, которое перехватывало бы весь сетевой трафик на мобильных устройствах или трафик определенных приложений и определяло, какие данные о пользователе они отправляют на сервер?
Я провожу исследование о личных данных,...
Я новичок в обучении данных, особенно в области точной настройки. Я хочу попробовать сделать точную настройку аудиоданных с помощью vits Finetuning с небольшим набором данных под 100 аудиофайлов длительностью менее 10 с каждый, и вот в чем проблема,...
Я новичок в обучении данных, особенно в области точной настройки. Я хочу попробовать сделать точную настройку аудиоданных с помощью витов с небольшим набором данных под 100 аудиофайлов по 10 с каждый, и вот в чем проблема, я уже пробовал...
Я экспериментирую с LoRA, чтобы точно настроить модель для обработки и анализа PDF-файлов, чтобы можно было задавать вопросы на основе этих файлов. По сути, я загружал PDF-файлы, затем программа разбивала их на куски и «училась» на PDF-файлах, чтобы...
Я экспериментирую с LoRA, чтобы точно настроить модель для обработки и анализа PDF-файлов, чтобы можно было задавать вопросы на основе этих файлов. По сути, я загружал PDF-файлы, затем программа разбивала их на куски и «училась» на PDF-файлах, чтобы...