Как провести реверс-инжиниринг недокументированного проприетарного формата двоичных файлов рамановской спектроскопии (.jPython

Программы на Python
Ответить
Anonymous
 Как провести реверс-инжиниринг недокументированного проприетарного формата двоичных файлов рамановской спектроскопии (.j

Сообщение Anonymous »

Я работаю с несколькими файлами данных рамановской спектроскопии, которые используют собственный двоичный формат с расширением .jws. Исходное программное обеспечение, которое могло бы читать эти файлы, больше не доступно, и нет общедоступной документации, описывающей файловую структуру.
Я не могу поделиться самими файлами из-за институциональных ограничений, но вот что я знаю в общих чертах:
  • Файлы содержат заголовок неизвестной длины.
  • После заголовка, похоже, находится большой двоичный блок (возможно, спектральный X–Y). данные).
  • Некоторые части файла выглядят как последовательности 32-битных чисел с плавающей запятой, но я не могу определить, какой блок соответствует оси рамановского сдвига, а какой блок представляет интенсивность.
  • Нет очевидных маркеров, смещений или структур метаданных, соответствующих каким-либо известным открытым форматам.
Моя цель - просто извлечь данные рамановского спектра XY, чтобы их можно было проанализировать с помощью современных инструментов.
Поскольку формат недокументирован, мне нужен общий совет:
Каков рекомендуемый рабочий процесс для обратного проектирования неизвестного проприетарного двоичного формата спектроскопии?

Существуют ли стандартные методы, инструменты или эвристики, обычно используемые при работе с устаревшими инструментальными средствами данные?
Возможные подходы, которые я рассматриваю:
  • Проверка двоичного файла с помощью шестнадцатеричного редактора
  • Поиск областей float32 / float64
  • Определение повторяющихся шаблонов, которые могут указывать на массивы
  • Тестирование С прямым порядком байтов и с прямым порядком байтов
  • Поиск целых чисел, которые могут быть смещениями или размерами блоков
  • Сравнение нескольких файлов на предмет структурного сходства
Прежде чем тратить слишком много времени на декодирование файлов вручную, я был бы признателен за любые общие рекомендации или передовой опыт от людей, которые занимались реверс-инжинирингом подобных файлов. форматы научных данных.
Заранее спасибо.

Подробнее здесь: https://stackoverflow.com/questions/798 ... -binary-fi
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»