Я пытаюсь написать тест, чтобы проверить, есть ли в фрейме данных Spark записи с неверным типом значения, но я застрял. Есть фрейм данных: [code]schema1 = StructType( [ StructField("id_key", IntegerType(), True), StructField("country", StringType(), True), ] ) data_wrong = [(10, "France"), (20, "USA"), (30, 1790), (40, "Germany")]
df = spark_session.createDataFrame(data=data_wrong, schema=schema1) [/code] И теперь я хочу уловить, что в поле страны в третьей записи указан неверный тип данных. Я пробовал использовать [list] [*][code]assert isinstance(df["country"], str)[/code] [*][code]assert isinstance(df.select("country"), str)[/code] [*]Прокрутка столбцов и проверка их типов: [/list] [code]for c in df.columns: if df[c].dtype != 'string': print("Error") [/code] конечно, ни один из них не работает, и у меня нет идей. Пожалуйста, помогите
Я пытаюсь написать тест, чтобы проверить, есть ли в фрейме данных Spark записи с неверным типом значения, но я застрял.
Есть фрейм данных:
schema1 = StructType(
Я пытаюсь написать тест, чтобы проверить, есть ли в фрейме данных Spark записи с неверным типом значения, но я застрял.
Есть фрейм данных:
schema1 = StructType(