Как читать и идентифицировать удаленные наблюдения в файле SAS7BDAT в PythonPython

Программы на Python
Ответить
Anonymous
 Как читать и идентифицировать удаленные наблюдения в файле SAS7BDAT в Python

Сообщение Anonymous »

В SAS, когда наблюдения «удаляются», они не удаляются полностью из набора данных, а вместо этого помечаются для удаления. При чтении таких файлов sas7bdat в Python с использованием таких библиотек, как pandas, pyreadstat или sas7bdat, Python считывает все наблюдения, включая те, которые помечены как удаленные. Однако в этих библиотеках нет встроенного индикатора, позволяющего различать активные и удаленные наблюдения.
В результате я не могу определить, какие наблюдения на самом деле помечены как удаленные в SAS. и должен быть исключен
Мои вопросы:

Код: Выделить всё

•   Is there a way to identify deleted observations in a sas7bdat file when loading it into Python?
•   Are there any tools, workarounds, or additional SAS preprocessing steps that can help identify and remove these deleted observations before or during the import process in Python?
Будем очень признательны за любые рекомендации по обработке этих «удалённых» строк!
. Я пробовал следующие подходы
1. Использование pandas.read_sas(): считывает весь набор данных, включая удаленные наблюдения, без каких-либо указаний на удаление.
2. Использование pyreadstat: Хотя pyreadstat.read_sas7bdat() может читать сжатые и несжатые файлы, ему также не хватает поддержки для различения удаленных строк.

Подробнее здесь: https://stackoverflow.com/questions/791 ... -in-python
Ответить

Быстрый ответ

Изменение регистра текста: 
Смайлики
:) :( :oops: :roll: :wink: :muza: :clever: :sorry: :angel: :read: *x)
Ещё смайлики…
   
К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми.

Максимально разрешённый размер вложения: 15 МБ.

Вернуться в «Python»