Я создаю приложение Azure Retrival-Augmented Generation (RAG) с использованием Когнитивного поиска Azure для обработки данных, связанных с обучаемыми, которые хранятся в файлах JSON. Вот общий рабочий процесс:
Структура данных: каждый файл JSON представляет план (например, free-trainees-project-data. json, premium-trainees-project-data.json). Ниже приведен пример структуры:
[
{
"overview": "The user John Doe (UUID: 00000000-0000-0000-0000-000000000001) has subscribed to the plan 'Free' starting from 2024-07-08 00:00:00.0. The user isn't associated with any tracks or projects.",
"user_name": "John Doe",
"user_uuid": "00000000-0000-0000-0000-000000000001",
"plan_start_date": "2024-07-08 00:00:00.0",
"plan_name": "Free",
"tracks": []
},
{
"overview": "The user Jane Smith (UUID: 00000000-0000-0000-0000-000000000002) has subscribed to the plan 'Free' starting from 2024-02-21 00:00:00.0. The user is associated with the following skill tracks: Track 'Quality Assurance' includes the following projects: [Project 'Sample Project A' (UUID: 00000000-0000-0000-0000-000000000003) has tags [[\"TESTNG\",\"Postman\"]], difficulty level 'intermediate', and is currently 'In Progress'. It is led by Team Lead ABC, started on 2024-06-06 08:14:06.758, and ended on Ongoing. ]",
"user_name": "Jane Smith",
"user_uuid": "00000000-0000-0000-0000-000000000002",
"plan_start_date": "2024-02-21 00:00:00.0",
"plan_name": "Free",
"tracks": [
{
"track_name": "Quality Assurance",
"projects": [
{
"project_name": "Sample Project A",
"project_uuid": "00000000-0000-0000-0000-000000000003",
"project_tags": "[\"TESTNG\",\"Postman\"]",
"team_lead": "Team Lead ABC",
"joining_date": "2024-06-06 08:14:06.758",
"project_difficulty": "intermediate",
"project_status": "In Progress",
"updated_by": "Team Lead ABC",
"exit_date": "Ongoing"
}
]
}
]
},
...
]
Рабочий процесс Azure:
Отправьте файлы JSON в контейнер хранилища Azure.
Настройте Когнитивный поиск Azure для анализа массива JSON с использованием режима анализа массива JSON.< /p>
Векторизация поле обзора с использованием модели text-embedding-ada-003.
Проблема >: Запросы возвращают ненадежные результаты. Например:
Запрос: "Список пользователей в плане "Начальный" без каких-либо треков или проектов"
Ожидается: список пользователей, соответствующих этому условию.
Реально: неправильные пользователи или неполный список.
Запрос: «Подсчитайте количество пользователей, подписавшихся на бесплатный план».
Ожидается: точный подсчет.
Факт: возвращается неверное количество.
Предпринятые шаги:
Проверена структура JSON и режим синтаксического анализа.
Использован обзор в качестве цели векторизации.
Проверено соединение между Azure Сервисы поиска и OpenAI.
Вопросы:
Я неправильно структурирую данные JSON или процесс векторизации?
Как повысить точность запросов в таких случаях использования?
Сведения о среде:
3 . Когнитивный поиск Azure с интеграцией OpenAI.
4. Модель: text-embedding-ada-003. Мой код:
Я создаю приложение Azure Retrival-Augmented Generation (RAG) с использованием Когнитивного поиска Azure для обработки данных, связанных с обучаемыми, которые хранятся в файлах JSON. Вот общий рабочий процесс: [list] [*][b]Структура данных[/b]: каждый файл JSON представляет план (например, free-trainees-project-data. json, premium-trainees-project-data.json). Ниже приведен пример структуры: [/list] [code][ { "overview": "The user John Doe (UUID: 00000000-0000-0000-0000-000000000001) has subscribed to the plan 'Free' starting from 2024-07-08 00:00:00.0. The user isn't associated with any tracks or projects.", "user_name": "John Doe", "user_uuid": "00000000-0000-0000-0000-000000000001", "plan_start_date": "2024-07-08 00:00:00.0", "plan_name": "Free", "tracks": [] }, { "overview": "The user Jane Smith (UUID: 00000000-0000-0000-0000-000000000002) has subscribed to the plan 'Free' starting from 2024-02-21 00:00:00.0. The user is associated with the following skill tracks: Track 'Quality Assurance' includes the following projects: [Project 'Sample Project A' (UUID: 00000000-0000-0000-0000-000000000003) has tags [[\"TESTNG\",\"Postman\"]], difficulty level 'intermediate', and is currently 'In Progress'. It is led by Team Lead ABC, started on 2024-06-06 08:14:06.758, and ended on Ongoing. ]", "user_name": "Jane Smith", "user_uuid": "00000000-0000-0000-0000-000000000002", "plan_start_date": "2024-02-21 00:00:00.0", "plan_name": "Free", "tracks": [ { "track_name": "Quality Assurance", "projects": [ { "project_name": "Sample Project A", "project_uuid": "00000000-0000-0000-0000-000000000003", "project_tags": "[\"TESTNG\",\"Postman\"]", "team_lead": "Team Lead ABC", "joining_date": "2024-06-06 08:14:06.758", "project_difficulty": "intermediate", "project_status": "In Progress", "updated_by": "Team Lead ABC", "exit_date": "Ongoing" } ] } ] }, ...
] [/code] [list] [*][b]Рабочий процесс Azure[/b]:
[*] Отправьте файлы JSON в контейнер хранилища Azure.
[*]Настройте Когнитивный поиск Azure для анализа массива JSON с использованием режима анализа массива JSON.< /p>
[*]Векторизация поле обзора с использованием модели text-embedding-ada-003.
[*]Запрос: "Список пользователей в плане "Начальный" без каких-либо треков или проектов"
[*]Ожидается: список пользователей, соответствующих этому условию.
[*] Реально: неправильные пользователи или неполный список.
[*]Запрос: «Подсчитайте количество пользователей, подписавшихся на бесплатный план».
[*]Ожидается: точный подсчет.
[*]Факт: возвращается неверное количество.
[/list][b]Предпринятые шаги:[/b] [list] [*]Проверена структура JSON и режим синтаксического анализа. [*]Использован обзор в качестве цели векторизации. [*]Проверено соединение между Azure Сервисы поиска и OpenAI. [/list] [b]Вопросы:[/b] [list] [*]Я неправильно структурирую данные JSON или процесс векторизации? [*]Как повысить точность запросов в таких случаях использования? [/list] [b]Сведения о среде:[/b] 3 . Когнитивный поиск Azure с интеграцией OpenAI. 4. Модель: text-embedding-ada-003. [b]Мой код:[/b] [code] @Override public Flux getOpenAIAsyncClientChatStream( ModelConfiguration modelConfiguration, List messages) {
Я создаю приложение Azure Retrival-Augmented Generation (RAG) с использованием Когнитивного поиска Azure для обработки данных, связанных с обучаемыми, хранящихся в файлах JSON. Вот общий рабочий процесс:
Я хотел создать лазурный когнитивный поиск, чтобы запросить каталог курса с использованием векторов. У меня есть Pandas DataFrame под названием Courses_PD, и он имеет два столбца: «Контент» и «встраивание», которые представляют собой встраивание,...
Я пытаюсь проанализировать очень простой простой JSON в приложении-функции Azure с помощью Python. Этот JSON поступает в виде запроса POST. Ниже приведен полный код приложения-функции Azure:
import azure.functions as func
import logging
import...
Я работаю с pyMongo, подключаясь к базе данных клиента. Конкретная коллекция, к которой я запрашиваю, состоит из документов с полем под названием items, которое может представлять собой пустой список или содержать ряд вложенных документов.
Например,...