Задача в том, что файлы Excel структурированы (строки, столбцы, листы), поэтому в отличие от простого текста, наивный брюк может потерять важные отношения между ячеек. Разделы (например, заголовки + блок данных)? < /p>
Существуют ли лучшие методы сохранения контекста (например, заголовки, имена листов, формулы, метаданные), чтобы LLM все еще могло интерпретировать данные? Для обработки файлов .xlsx.
Поскольку LLM имеют ограничения длины контекста, я хочу разделить (Chunk) данные Excel на более мелкие, значимые части, прежде чем встраивать или подавать в модель.
Подробнее здесь: https://stackoverflow.com/questions/797 ... xlsx-files
Какова лучшая стратегия обучения для обработки LLM файлов .xlsx? [закрыто] ⇐ Python
-
- Похожие темы
- Ответы
- Просмотры
- Последнее сообщение
-
-
Какова лучшая стратегия для создания надежной утилиты PR -портирования? [закрыто]
Anonymous » » в форуме JAVA - 0 Ответы
- 3 Просмотры
-
Последнее сообщение Anonymous
-