Искровой набор данных.фильтр китайское имя столбца, org.apache.spark.sql.catalyst.parser.ParseException

Искровой набор данных.фильтр китайское имя столбца, org.apache.spark.sql.catalyst.parser.ParseException ⇐ JAVA

1 сообщение • Страница 1 из 1

Anonymous

Искровой набор данных.фильтр китайское имя столбца, org.apache.spark.sql.catalyst.parser.ParseException

Цитата

Сообщение Anonymous » 24 июл 2024, 11:27

У меня есть таблица с китайским именем столбца 人员, используйте org.apache.spark.sql.Dataset для обработки данных.
Когда я фильтрую с английским именем столбца, запуск выполняется успешно.

Код: Выделить всё

dataset.filter(" ( (name = 'name1') ) ")

, queryExecution — это:

Код: Выделить всё

== Parsed Logical Plan ==
'Filter ('name = name1)
+- Project [人员#541, name#542, 1 AS col1#547]
+- Project [人员#541, name#542]
+- Project [cast(人员#537 as string) AS 人员#541, cast(name#538 as string) AS name#542]
+- Relation [人员#537,name#538] JDBCRelation(`test1111`) [numPartitions=1]

== Analyzed Logical Plan ==
string, name: string, col1: int
Filter (name#542 = name1)
+- Project [人员#541, name#542, 1 AS col1#547]
+- Project [人员#541, name#542]
+- Project [cast(人员#537 as string) AS 人员#541, cast(name#538 as string) AS name#542]
+- Relation [人员#537,name#538] JDBCRelation(`test1111`) [numPartitions=1]

== Optimized Logical Plan ==
Project [人员#537, name#538, 1 AS col1#547]
+- Filter (isnotnull(name#538) AND (name#538 = name1))
+- Relation [人员#537,name#538] JDBCRelation(`test1111`) [numPartitions=1]

== Physical Plan ==
*(1) Project [人员#537, name#538, 1 AS col1#547]
+- *(1) Scan JDBCRelation(`test1111`) [numPartitions=1] [人员#537,name#538] PushedFilters: [*IsNotNull(name), *EqualTo(name,name1)], ReadSchema: struct

Но если фильтр с китайским именем столбца запускается неудачно.

Код: Выделить всё

dataset.filter(" ( (`人员` = '111') ) ")

, queryExecution — это:

Код: Выделить всё

== Parsed Logical Plan ==
'Filter ('人员 = 111)
+- Project [人员#576, name#577, 1 AS col1#582]
+- Project [人员#576, name#577]
+- Project [cast(人员#572 as string) AS 人员#576, cast(name#573 as string) AS name#577]
+- Relation [人员#572,name#573] JDBCRelation(`test1111`) [numPartitions=1]

== Analyzed Logical Plan ==
人员: string, name: string, col1: int
Filter (人员#576 = 111)
+- Project [人员#576, name#577, 1 AS col1#582]
+- Project [人员#576, name#577]
+- Project [cast(人员#572 as string) AS 人员#576, cast(name#573 as string) AS name#577]
+- Relation [人员#572,name#573] JDBCRelation(`test1111`) [numPartitions=1]

== Optimized Logical Plan ==
Project [人员#572, name#573, 1 AS col1#582]
+- Filter (isnotnull(人员#572) AND (人员#572 = 111))
+- Relation [人员#572,name#573] JDBCRelation(`test1111`) [numPartitions=1]

== Physical Plan ==
org.apache.spark.sql.catalyst.parser.ParseException:
Syntax error at or near '人'(line 1, pos 0)

== SQL ==
人员
^^^

Версия Spark — 3.3.1
У кого-нибудь есть идеи?
Я думаю, это не Неизвестный язык Универсальная китайская проблема.
Понятия не имею.

Подробнее здесь: https://stackoverflow.com/questions/787 ... rser-parse

1721809666

Anonymous

У меня есть таблица с китайским именем столбца 人员, используйте org.apache.spark.sql.Dataset для обработки данных.
Когда я фильтрую с английским именем столбца, запуск выполняется успешно.
[code]dataset.filter(" ( (name = 'name1') ) ")[/code], queryExecution — это:
[code]== Parsed Logical Plan ==
'Filter ('name = name1)
+- Project [人员#541, name#542, 1 AS col1#547]
+- Project [人员#541, name#542]
+- Project [cast(人员#537 as string) AS 人员#541, cast(name#538 as string) AS name#542]
+- Relation [人员#537,name#538] JDBCRelation(`test1111`) [numPartitions=1]

== Analyzed Logical Plan ==
string, name: string, col1: int
Filter (name#542 = name1)
+- Project [人员#541, name#542, 1 AS col1#547]
+- Project [人员#541, name#542]
+- Project [cast(人员#537 as string) AS 人员#541, cast(name#538 as string) AS name#542]
+- Relation [人员#537,name#538] JDBCRelation(`test1111`) [numPartitions=1]

== Optimized Logical Plan ==
Project [人员#537, name#538, 1 AS col1#547]
+- Filter (isnotnull(name#538) AND (name#538 = name1))
+- Relation [人员#537,name#538] JDBCRelation(`test1111`) [numPartitions=1]

== Physical Plan ==
*(1) Project [人员#537, name#538, 1 AS col1#547]
+- *(1) Scan JDBCRelation(`test1111`) [numPartitions=1] [人员#537,name#538] PushedFilters: [*IsNotNull(name), *EqualTo(name,name1)], ReadSchema: struct

[/code]
Но если фильтр с китайским именем столбца запускается неудачно.
[code]dataset.filter(" ( (`人员` = '111') ) ")[/code], queryExecution — это:
[code]== Parsed Logical Plan ==
'Filter ('人员 = 111)
+- Project [人员#576, name#577, 1 AS col1#582]
+- Project [人员#576, name#577]
+- Project [cast(人员#572 as string) AS 人员#576, cast(name#573 as string) AS name#577]
+- Relation [人员#572,name#573] JDBCRelation(`test1111`) [numPartitions=1]

== Analyzed Logical Plan ==
人员: string, name: string, col1: int
Filter (人员#576 = 111)
+- Project [人员#576, name#577, 1 AS col1#582]
+- Project [人员#576, name#577]
+- Project [cast(人员#572 as string) AS 人员#576, cast(name#573 as string) AS name#577]
+- Relation [人员#572,name#573] JDBCRelation(`test1111`) [numPartitions=1]

== Optimized Logical Plan ==
Project [人员#572, name#573, 1 AS col1#582]
+- Filter (isnotnull(人员#572) AND (人员#572 = 111))
+- Relation [人员#572,name#573] JDBCRelation(`test1111`) [numPartitions=1]

== Physical Plan ==
org.apache.spark.sql.catalyst.parser.ParseException:
Syntax error at or near '人'(line 1, pos 0)

== SQL ==
人员
^^^

[/code]
Версия Spark — 3.3.1
У кого-нибудь есть идеи?
Я думаю, это не Неизвестный язык Универсальная китайская проблема.
Понятия не имею. 

Подробнее здесь: [url]https://stackoverflow.com/questions/78786975/spark-dataset-filter-chinese-colname-org-apache-spark-sql-catalyst-parser-parse[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Py4JException: конструктор org.apache.spark.sql.SparkSession([класс org.apache.spark.SparkContext, класс java.util.HashM

Последнее сообщение Anonymous « 16 сен 2024, 12:30
Добавлено в форуме Python

Anonymous » 16 сен 2024, 12:30 » в форуме Python

Я пытаюсь запустить сеанс Spark в Jupyter Notebook на компьютере EC2 Linux с помощью кода Visual Studio. Мой код выглядит следующим образом:
from pyspark.sql import SparkSession
spark = SparkSession.builder.appName( spark_app ).getOrCreate()...

0 Ответы

71 Просмотры

Последнее сообщение Anonymous
16 сен 2024, 12:30
При выполнении org.apache.avro:avro-maven-plugin:1.11.3:schema: org/apache/avro/Schema$Parser отсутствовал необходимый к

Последнее сообщение Anonymous « 17 окт 2024, 16:27
Добавлено в форуме JAVA

Anonymous » 17 окт 2024, 16:27 » в форуме JAVA

Недавно мы добавили автоматизацию Kafka в наш проект, и благодаря созданию новой учетной записи потребителя мы смогли проводить опросы по этой теме и получать сообщения в нашем локальном хранилище. Когда я попытался отправить код в конвейер gitlab,...

0 Ответы

66 Просмотры

Последнее сообщение Anonymous
17 окт 2024, 16:27
Org.apache.hadoop.fs.RawLocalFileSystem$DeprecatedRawLocalFileStatus невозможно привести к org.apache.spark.sql.executio

Последнее сообщение Гость « 14 мар 2024, 11:45
Добавлено в форуме JAVA

Гость » 14 мар 2024, 11:45 » в форуме JAVA

Получение следующей ошибки при создании дельта-таблицы с помощью scalaspark. _delta_log создается на складе, но после создания _delta_log возникает эта ошибка.
Исключение в потоке main java.lang.ClassCastException: class...

0 Ответы

71 Просмотры

Последнее сообщение Гость
14 мар 2024, 11:45
Net.sf.jsqlparser.parser.ParseException: обнаружен неожиданный токен: "@" "@"

Последнее сообщение Anonymous « 04 июл 2024, 04:48
Добавлено в форуме JAVA

Anonymous » 04 июл 2024, 04:48 » в форуме JAVA

Когда я добавляю такой оператор переменной в свой SQL в mybatis:
set @update_id := 0;

это мое полное заявление:
set @update_id := 0;
UPDATE r_room_seat s
SET s.status = 1,
s.user_id = (
case when s.seat_num = 1
then #{user1.id,jdbcType=BIGINT}...

0 Ответы

20 Просмотры

Последнее сообщение Anonymous
04 июл 2024, 04:48
Класс символьной ссылки недоступен: класс sun.util.calendar.ZoneInfo из интерфейса spark.sql.catalyst.util.SparkDateTime

Последнее сообщение Anonymous « 03 июл 2024, 08:27
Добавлено в форуме JAVA

Anonymous » 03 июл 2024, 08:27 » в форуме JAVA

При попытке записать Spark (v4.0-preview1) Dataframe в таблицу базы данных ( SQL Server ) с помощью драйвера JDBC . Возникает следующая ошибка.
java.lang.IllegalAccessException: symbolic reference class is not accessible: class...

0 Ответы

21 Просмотры

Последнее сообщение Anonymous
03 июл 2024, 08:27

Вернуться в «JAVA»