Структура данных для файла CSV с использованием OpenAI и LangChains CSVLoader ⇐ Python
-
Гость
Структура данных для файла CSV с использованием OpenAI и LangChains CSVLoader
Хорошо, возможно, это глупый вопрос, но я нигде не могу найти ответа. Я пытаюсь загрузить файл csv в приложение openAI, которое будет использовать данные, связанные с раком в США. Я пытаюсь определить «лучшую» структуру данных для выполнения запросов. Я имею в виду следующее:
Лучше ли размещать каждый элемент в отдельной строке или добавление столбца работает таким же образом? Например
| Государство | округ | Рак | Оценить | |-------|------------|---------|------| |СК | Чарльстон | мочевой пузырь | 3,9 | |СК | Дорчестер | мочевой пузырь | 4.4 | |СК | Пикенс | мочевой пузырь | 3,4 | |СК | Чарльстон | Двоеточие | 1,9 | |СК | Дорчестер | Двоеточие | 8,5 | |СК | Пикенс | Двоеточие | 3,4 | или
| Государство | округ | Скорость мочевого пузыря | Колон_Rate | |-------|------------|--------------|------------| |СК | Чарльстон | 3,9 | 1,9 | |СК | Дорчестер | 4.4 | 8,5 | |СК | Пикенс | 3,4 | 3,4 | Вопросы применимы только к данным, содержащимся в CSV-файле. Существует ли общедоступный ресурс, который определяет точность ответов на основе структуры данных и выбранных моделей. При этом в значительной степени будут использоваться статические данные, поэтому я хочу попытаться найти наиболее точную структуру. Однако; При этом, если исследователь задаст вопрос, а ответ окажется полной галлюцинацией, то приложение больше никогда не будет использоваться. Здесь будут храниться все данные в Соединенных Штатах, опубликованные правительственными ресурсами для каждого округа в каждом штате по каждому типу рака, за которым они следят. Но данные меняются не очень часто.
Хорошо, возможно, это глупый вопрос, но я нигде не могу найти ответа. Я пытаюсь загрузить файл csv в приложение openAI, которое будет использовать данные, связанные с раком в США. Я пытаюсь определить «лучшую» структуру данных для выполнения запросов. Я имею в виду следующее:
Лучше ли размещать каждый элемент в отдельной строке или добавление столбца работает таким же образом? Например
| Государство | округ | Рак | Оценить | |-------|------------|---------|------| |СК | Чарльстон | мочевой пузырь | 3,9 | |СК | Дорчестер | мочевой пузырь | 4.4 | |СК | Пикенс | мочевой пузырь | 3,4 | |СК | Чарльстон | Двоеточие | 1,9 | |СК | Дорчестер | Двоеточие | 8,5 | |СК | Пикенс | Двоеточие | 3,4 | или
| Государство | округ | Скорость мочевого пузыря | Колон_Rate | |-------|------------|--------------|------------| |СК | Чарльстон | 3,9 | 1,9 | |СК | Дорчестер | 4.4 | 8,5 | |СК | Пикенс | 3,4 | 3,4 | Вопросы применимы только к данным, содержащимся в CSV-файле. Существует ли общедоступный ресурс, который определяет точность ответов на основе структуры данных и выбранных моделей. При этом в значительной степени будут использоваться статические данные, поэтому я хочу попытаться найти наиболее точную структуру. Однако; При этом, если исследователь задаст вопрос, а ответ окажется полной галлюцинацией, то приложение больше никогда не будет использоваться. Здесь будут храниться все данные в Соединенных Штатах, опубликованные правительственными ресурсами для каждого округа в каждом штате по каждому типу рака, за которым они следят. Но данные меняются не очень часто.
Мобильная версия