Я не могу поделиться самими файлами из-за институциональных ограничений, но вот что я знаю в общих чертах:
- Файлы содержат заголовок неизвестной длины.
- После заголовка, похоже, находится большой двоичный блок (возможно, спектральный X–Y). данные).
- Некоторые части файла выглядят как последовательности 32-битных чисел с плавающей запятой, но я не могу определить, какой блок соответствует оси рамановского сдвига, а какой блок представляет интенсивность.
- Нет очевидных маркеров, смещений или структур метаданных, соответствующих каким-либо известным открытым форматам.
Поскольку формат недокументирован, мне нужен общий совет:
Каков рекомендуемый рабочий процесс для обратного проектирования неизвестного проприетарного двоичного формата спектроскопии?
Существуют ли стандартные методы, инструменты или эвристики, обычно используемые при работе с устаревшими инструментальными средствами данные?
Возможные подходы, которые я рассматриваю:
- Проверка двоичного файла с помощью шестнадцатеричного редактора
- Поиск областей float32 / float64
- Определение повторяющихся шаблонов, которые могут указывать на массивы
- Тестирование С прямым порядком байтов и с прямым порядком байтов
- Поиск целых чисел, которые могут быть смещениями или размерами блоков
- Сравнение нескольких файлов на предмет структурного сходства
Заранее спасибо.
Подробнее здесь: https://stackoverflow.com/questions/798 ... -binary-fi
Мобильная версия