Классификация намерений с высокой точностью с небольшими моделями для развертывания AWS Lambda

Классификация намерений с высокой точностью с небольшими моделями для развертывания AWS Lambda ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

Классификация намерений с высокой точностью с небольшими моделями для развертывания AWS Lambda

Цитата

Сообщение Anonymous » 07 авг 2025, 15:01

Я разрабатываю услуги fastapi для классификации намерений, которая будет развернута на aws lambda . Основная цель состоит в том, чтобы построить модель с высокой точностью (≥95%) как на наборах данных обучения, так и в тестировании. Эта служба будет частью Contrucation AI System , которая классифицирует пользовательские запросы в конкретные намерения: «Приветствие» , «Положительная обратная связь» , «Отрицательная обратная связь» , «Запрос справки» и «Запада» .
Ключевой технический строительство
подходы я пробовал: < /h3>

1. Трансформаторы предложений + логистическая регрессия:

шаги, предпринятые :

использовал библиотеку SERENCETRANSFORMER с предварительно обученной моделью «Парафразо-multingual-minilm-l12-v2» к кодру LogisticRegression Classifier.
фрагмент кода :
Код: Выделить всё
```
embedder = SentenceTransformer("paraphrase-multilingual-MiniLM-L12-v2")
input_embeddings = embedder.encode(texts)
clf = LogisticRegression().fit(input_embeddings, labels)
< /code>
< /li>
  [b] result < /strong>:

Модель работает хорошо, но одна только модель трансформатора выше  100 мб < /strong>, превышает ограничения Lambda. < /p>
< /li>
< /ul>
[h4] 2. Обученная на заказ модель Spacy: [/h4]

   шаги, предпринятые [/b]:

подготовленная Textcat 
```
на основе en_core_web_md модель (~ 31 МБ), с использованием ~ 5000 с трудоем. /> configuration :

использовал Spacy Train с пользовательским config.cfg , компоненты замораживания, такие как tok2vec и только тренировочный текстовый код . Зависимости, такие как Scipy /
Код: Выделить всё
```
numpy
```
привели к тому, что развертывание превышало 50 МБ.

3. Тонко насыщенная дистилберт:

шаги, предпринятые :

Fine-Tuned Distilbert Использование трансформаторов Huggingface и тренер API на пользовательском данных ~ 500 выборки через 5 интенсивных. /> result < /strong>:

, достигнутая над 95% точностью < /strong>, но размер модели (~ 250 МБ) делает ее непригодным для стандартной лямбды. < /p>
< /li>
< /ul>
< /h3>
и изучил его, но меня специально интересуют, есть ли какой-либо новый, легкий или эффективный метод для достижения этих целей в пределах предела пакета 50 МБ .
Успешно развернул nlp classifier nlp в соответствии с этими конфигурациями под этими конструкциями

Подробнее здесь: https://stackoverflow.com/questions/797 ... deployment

1754568064

Anonymous

 Я разрабатываю услуги [b] fastapi [/b] для классификации намерений, которая будет развернута на [b] aws lambda [/b]. Основная цель состоит в том, чтобы построить модель с [b] высокой точностью (≥95%) [/b] как на наборах данных обучения, так и в тестировании. Эта служба будет частью [b] Contrucation AI System [/b], которая классифицирует пользовательские запросы в конкретные намерения: «Приветствие» , «Положительная обратная связь» , «Отрицательная обратная связь» , «Запрос справки»  и «Запада» . 
Ключевой технический строительство 
 подходы я пробовал: < /h3>
[h4] 1. Трансформаторы предложений + логистическая регрессия: [/h4]
[list]
[*]  [b] шаги, предпринятые [/b]:

использовал библиотеку SERENCETRANSFORMER  с предварительно обученной моделью «Парафразо-multingual-minilm-l12-v2»  к кодру LogisticRegression  Classifier. 

[*]  [b] фрагмент кода [/b]: 
[code]embedder = SentenceTransformer("paraphrase-multilingual-MiniLM-L12-v2")
input_embeddings = embedder.encode(texts)
clf = LogisticRegression().fit(input_embeddings, labels)
< /code>
< /li>
  [b] result < /strong>:

Модель работает хорошо, но одна только модель трансформатора выше  100 мб < /strong>, превышает ограничения Lambda. < /p>
< /li>
< /ul>
[h4] 2. Обученная на заказ модель Spacy: [/h4]

   шаги, предпринятые [/b]:

подготовленная Textcat [/code] на основе en_core_web_md  модель (~ 31 МБ), с использованием ~ 5000 с трудоем. />   [b] configuration [/b]:

использовал Spacy Train  с пользовательским config.cfg , компоненты замораживания, такие как tok2vec  и только тренировочный текстовый код . Зависимости, такие как Scipy /[code]numpy[/code] привели к тому, что развертывание превышало 50 МБ. 

[/list]
[h4] 3. Тонко насыщенная дистилберт: [/h4]

  [b] шаги, предпринятые [/b]:

Fine-Tuned Distilbert  Использование трансформаторов Huggingface  и тренер  API на пользовательском данных ~ 500 выборки через 5 интенсивных. />   [b] result < /strong>:

, достигнутая над  95% точностью < /strong>, но размер модели (~ 250 МБ) делает ее непригодным для стандартной лямбды. < /p>
< /li>
< /ul>
  < /h3>
и изучил его, но меня специально интересуют, есть ли какой-либо  новый, легкий или эффективный метод [/b] для достижения этих целей [b] в пределах предела пакета 50 МБ [/b].
Успешно развернул  nlp classifier nlp  в соответствии с этими конфигурациями  под этими конструкциями 

Подробнее здесь: [url]https://stackoverflow.com/questions/79728531/high-accuracy-intent-classification-with-small-models-for-aws-lambda-deployment[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Как построить и развернуть модель классификации NLP Sub-50 МБ для AWS Lambda с> 95% точностью? [закрыто]

Последнее сообщение Anonymous « 08 авг 2025, 11:20
Добавлено в форуме Python

Anonymous » 08 авг 2025, 11:20 » в форуме Python

Я разрабатываю услугу Fastapi для классификации намерений, которая будет развернута на AWS Lambda. Сервис должен классифицировать пользовательские запросы по одному из пяти намерений: «Приветствие», «Положительная обратная связь», «отрицательная...

0 Ответы

1 Просмотры

Последнее сообщение Anonymous
08 авг 2025, 11:20
Как интегрировать функцию с высокой точностью

Последнее сообщение Гость « 29 фев 2024, 08:52
Добавлено в форуме Python

Гость » 29 фев 2024, 08:52 » в форуме Python

Я пытаюсь интегрировать произведение функций sin и cos. Результаты, которые я получаю, совпадают, когда речь идет об относительно больших числах, таких как мощность e-02....e-04. Тем не менее, дробные числа, составляющие степень е-11.....е-32,...

0 Ответы

15 Просмотры

Последнее сообщение Гость
29 фев 2024, 08:52
Обратная задача/плато функции потерь нейронной сети автоэнкодера для приложений с высокой точностью

Последнее сообщение Anonymous « 07 окт 2024, 20:50
Добавлено в форуме Python

Anonymous » 07 окт 2024, 20:50 » в форуме Python

Этот вопрос частично унаследован от кривой переоценки предыдущего вопроса, аппроксимирующей формулу дисперсии Шотта для стеклянного материала, так что при наличии только двух значений n_e и V_e регрессия может соответствовать кривой, которая...

0 Ответы

24 Просмотры

Последнее сообщение Anonymous
07 окт 2024, 20:50
Лучший способ заснуть или сделать паузу в Unity с высокой точностью времени

Последнее сообщение Anonymous « 05 ноя 2024, 07:09
Добавлено в форуме C#

Anonymous » 05 ноя 2024, 07:09 » в форуме C#

Я работаю над проектом Unity, где мне нужно добиться высокоточного управления временем для цикла отображения и обработки кадров. В частности, мне нужно, чтобы временной интервал между кадрами был как можно более постоянным, с возможностью...

0 Ответы

17 Просмотры

Последнее сообщение Anonymous
05 ноя 2024, 07:09
Лучший способ заснуть или сделать паузу в Unity с высокой точностью времени

Последнее сообщение Anonymous « 05 ноя 2024, 10:49
Добавлено в форуме C#

Anonymous » 05 ноя 2024, 10:49 » в форуме C#

Я работаю над проектом Unity, где мне нужно добиться высокоточного управления временем для цикла отображения и обработки кадров. В частности, мне нужно, чтобы временной интервал между кадрами был как можно более постоянным, с возможностью...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
05 ноя 2024, 10:49

Вернуться в «Python»