Структура данных для файла CSV с использованием OpenAI и LangChains CSVLoader

Структура данных для файла CSV с использованием OpenAI и LangChains CSVLoader ⇐ Python

1 сообщение • Страница 1 из 1

Гость

Структура данных для файла CSV с использованием OpenAI и LangChains CSVLoader

Сообщение Гость » 01 ноя 2023, 15:47

Хорошо, возможно, это глупый вопрос, но я нигде не могу найти ответа. Я пытаюсь загрузить файл csv в приложение openAI, которое будет использовать данные, связанные с раком в США. Я пытаюсь определить «лучшую» структуру данных для выполнения запросов. Я имею в виду следующее:

Лучше ли размещать каждый элемент в отдельной строке или добавление столбца работает таким же образом? Например

| Государство | округ | Рак | Оценить | |-------|------------|---------|------| |СК | Чарльстон | мочевой пузырь | 3,9 | |СК | Дорчестер | мочевой пузырь | 4.4 | |СК | Пикенс | мочевой пузырь | 3,4 | |СК | Чарльстон | Двоеточие | 1,9 | |СК | Дорчестер | Двоеточие | 8,5 | |СК | Пикенс | Двоеточие | 3,4 | или

| Государство | округ | Скорость мочевого пузыря | Колон_Rate | |-------|------------|--------------|------------| |СК | Чарльстон | 3,9 | 1,9 | |СК | Дорчестер | 4.4 | 8,5 | |СК | Пикенс | 3,4 | 3,4 | Вопросы применимы только к данным, содержащимся в CSV-файле. Существует ли общедоступный ресурс, который определяет точность ответов на основе структуры данных и выбранных моделей. При этом в значительной степени будут использоваться статические данные, поэтому я хочу попытаться найти наиболее точную структуру. Однако; При этом, если исследователь задаст вопрос, а ответ окажется полной галлюцинацией, то приложение больше никогда не будет использоваться. Здесь будут храниться все данные в Соединенных Штатах, опубликованные правительственными ресурсами для каждого округа в каждом штате по каждому типу рака, за которым они следят. Но данные меняются не очень часто.

Гость

1 сообщение • Страница 1 из 1

Вернуться в «Python»