Подключение к учетной записи хранения Azure для чтения файла паркета через управляемое удостоверение с использованием биPython

Программы на Python
Anonymous
 Подключение к учетной записи хранения Azure для чтения файла паркета через управляемое удостоверение с использованием би

Сообщение Anonymous »

Я использую версию библиотеки Polars на Python для чтения файла паркета с большим количеством строк. Вот ссылка на библиотеку — https://github.com/pola-rs/polars
Я пытаюсь прочитать файл паркета из учетной записи хранения Azure с помощью метода read_parquet. Я вижу, что есть аргумент Storage_options, который можно использовать для указания способа подключения к хранилищу данных. Вот определение метода read_parquet -

Код: Выделить всё

def read_parquet(
source: str | Path | BinaryIO | BytesIO | bytes,
columns: list[int] | list[str] | None = None,
n_rows: int | None = None,
use_pyarrow: bool = False,
memory_map: bool = True,
storage_options: dict[str, object] | None = None,
parallel: ParallelStrategy = "auto",
row_count_name: str | None = None,
row_count_offset: int = 0,
low_memory: bool = False,
pyarrow_options: dict[str, object] | None = None,
) -> DataFrame:
Может ли кто-нибудь сообщить мне, какие значения мне нужно указать в качестве части Storage_options для подключения к учетной записи хранения Azure, если я использую управляемое удостоверение, назначенное системой. К сожалению, я не смог найти ни одного примера для этого. В большинстве примеров используются строка подключения и ключи доступа, и по соображениям безопасности я не могу их использовать.
edit: Я только что узнал, что Storage_options передаются в другую библиотеку под названием ffspec. Но я понятия не имею об этом.

Подробнее здесь: https://stackoverflow.com/questions/741 ... dentity-us

Вернуться в «Python»