«TypeError:" Javapackage 'объект не может быть вызовом »в Pyspark

«TypeError:" Javapackage 'объект не может быть вызовом »в Pyspark ⇐ Python

1 сообщение • Страница 1 из 1

Anonymous

«TypeError:" Javapackage 'объект не может быть вызовом »в Pyspark

Цитата

Сообщение Anonymous » 08 июн 2025, 13:37

Ниже приведена информация о моей версии: < /p>
python = 3.11.5
pyspark = 3.4.1

java -version
java version "21.0.1" 2023-10-17 LTS
Java(TM) SE Runtime Environment (build 21.0.1+12-LTS-29)
Java HotSpot(TM) 64-Bit Server VM (build 21.0.1+12-LTS-29, mixed mode, sharing)
< /code>
Я пытаюсь запустить ниже код в ноутбуке Jupyter: < /p>
from pyspark.sql import SparkSession

spark = SparkSession.builder.appName("practice").getOrCreate()

data_path = "pathToFile\TelecomData.csv"
rdd = sc.textFile(data_path)

filteredRdd = rdd.filter(lambda pair: pair.split(",")[3] =='Y' and pair.split(",")[9] =='Y')

for rows in filteredRdd.collect():
print(rows)
< /code>
Ниже приведена ошибка, с которой я сталкиваюсь: < /p>
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
Cell In[3], line 10
7 filteredRdd = rdd.filter(lambda pair: pair.split(",")[3] =='Y' and pair.split(",")[9] =='Y')
9 # print(sc._jvm.functions)
---> 10 for rows in filteredRdd.collect():
11 print(rows)

File ~\anaconda3\envs\spark_latest\Lib\site-packages\pyspark\rdd.py:1814, in RDD.collect(self)
1812 with SCCallSiteSync(self.context):
1813 assert self.ctx._jvm is not None
-> 1814 sock_info = self.ctx._jvm.PythonRDD.collectAndServe(self._jrdd.rdd())
1815 return list(_load_from_socket(sock_info, self._jrdd_deserializer))

File ~\anaconda3\envs\spark_latest\Lib\site-packages\pyspark\rdd.py:5441, in PipelinedRDD._jrdd(self)
5438 else:
5439 profiler = None
-> 5441 wrapped_func = _wrap_function(
5442 self.ctx, self.func, self._prev_jrdd_deserializer, self._jrdd_deserializer, profiler
5443 )
5445 assert self.ctx._jvm is not None
5446 python_rdd = self.ctx._jvm.PythonRDD(
5447 self._prev_jrdd.rdd(), wrapped_func, self.preservesPartitioning, self.is_barrier
5448 )

File ~\anaconda3\envs\spark_latest\Lib\site-packages\pyspark\rdd.py:5243, in _wrap_function(sc, func, deserializer, serializer, profiler)
5241 pickled_command, broadcast_vars, env, includes = _prepare_for_python_RDD(sc, command)
5242 assert sc._jvm is not None
-> 5243 return sc._jvm.SimplePythonFunction(
5244 bytearray(pickled_command),
5245 env,
5246 includes,
5247 sc.pythonExec,
5248 sc.pythonVer,
5249 broadcast_vars,
5250 sc._javaAccumulator,
5251 )

TypeError: 'JavaPackage' object is not callable
< /code>
Пока я проверял установку Spark в Windows; Есть некоторые ответы, когда добавление пути JAR может решить ошибку, но в моем случае я не уверен, какие банки добавить.

Подробнее здесь: https://stackoverflow.com/questions/777 ... in-pyspark

1749379024

Anonymous

 Ниже приведена информация о моей версии: < /p>
python = 3.11.5
pyspark = 3.4.1

java -version
java version "21.0.1" 2023-10-17 LTS
Java(TM) SE Runtime Environment (build 21.0.1+12-LTS-29)
Java HotSpot(TM) 64-Bit Server VM (build 21.0.1+12-LTS-29, mixed mode, sharing)
< /code>
Я пытаюсь запустить ниже код в ноутбуке Jupyter: < /p>
from pyspark.sql import SparkSession

spark = SparkSession.builder.appName("practice").getOrCreate()

data_path  = "pathToFile\TelecomData.csv"
rdd = sc.textFile(data_path)

filteredRdd = rdd.filter(lambda pair: pair.split(",")[3] =='Y' and pair.split(",")[9] =='Y')

for rows in filteredRdd.collect():
print(rows)
< /code>
Ниже приведена ошибка, с которой я сталкиваюсь: < /p>
---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
Cell In[3], line 10
7 filteredRdd = rdd.filter(lambda pair: pair.split(",")[3] =='Y' and pair.split(",")[9] =='Y')
9 # print(sc._jvm.functions)
---> 10 for rows in filteredRdd.collect():
11     print(rows)

File ~\anaconda3\envs\spark_latest\Lib\site-packages\pyspark\rdd.py:1814, in RDD.collect(self)
1812 with SCCallSiteSync(self.context):
1813     assert self.ctx._jvm is not None
-> 1814     sock_info = self.ctx._jvm.PythonRDD.collectAndServe(self._jrdd.rdd())
1815 return list(_load_from_socket(sock_info, self._jrdd_deserializer))

File ~\anaconda3\envs\spark_latest\Lib\site-packages\pyspark\rdd.py:5441, in PipelinedRDD._jrdd(self)
5438 else:
5439     profiler = None
-> 5441 wrapped_func = _wrap_function(
5442     self.ctx, self.func, self._prev_jrdd_deserializer, self._jrdd_deserializer, profiler
5443 )
5445 assert self.ctx._jvm is not None
5446 python_rdd = self.ctx._jvm.PythonRDD(
5447     self._prev_jrdd.rdd(), wrapped_func, self.preservesPartitioning, self.is_barrier
5448 )

File ~\anaconda3\envs\spark_latest\Lib\site-packages\pyspark\rdd.py:5243, in _wrap_function(sc, func, deserializer, serializer, profiler)
5241 pickled_command, broadcast_vars, env, includes = _prepare_for_python_RDD(sc, command)
5242 assert sc._jvm is not None
-> 5243 return sc._jvm.SimplePythonFunction(
5244     bytearray(pickled_command),
5245     env,
5246     includes,
5247     sc.pythonExec,
5248     sc.pythonVer,
5249     broadcast_vars,
5250     sc._javaAccumulator,
5251 )

TypeError: 'JavaPackage' object is not callable
< /code>
Пока я проверял установку Spark в Windows; Есть некоторые ответы, когда добавление пути JAR может решить ошибку, но в моем случае я не уверен, какие банки добавить. 
 

Подробнее здесь: [url]https://stackoverflow.com/questions/77763167/typeerror-javapackage-object-is-not-callable-in-pyspark[/url]

Ответить Пред. тема След. тема

1 сообщение • Страница 1 из 1

Быстрый ответ

Заголовок:

Имя пользователя:

Изменение регистра текста:

Смайлики

Ещё смайлики…

К этому ответу прикреплено по крайней мере одно вложение.

Если вы не хотите добавлять вложения, оставьте поля пустыми. Можно прикреплять файлы, перетаскивая их в окно сообщения.

Максимально разрешённый размер вложения: 15 МБ.

Имя файла:

Комментарий к файлу:

Имя файла	Комментарий к файлу	Размер	Статус

Похожие темы

Ответы

Просмотры

Последнее сообщение

Pyspark Create DataFrame, дающий «typeError: 'javapackage» объект не может быть вызовом'

Последнее сообщение Anonymous « 22 авг 2025, 17:13
Добавлено в форуме Python

Anonymous » 22 авг 2025, 17:13 » в форуме Python

Я стараюсь лучше понять кафку + pyspark и начинать с тестового сообщения, которое я хотел бы добавить к Spark DataFrame. Я могу транслировать данные из KAFKA и прочитать данные из CSVS, но я не могу использовать метод CreateAtaFrame по какой -то...

0 Ответы

2 Просмотры

Последнее сообщение Anonymous
22 авг 2025, 17:13
«TypeError:« Объект Tuple »не является вызовом» в Python, пытаясь получить объект в кортеже путем индексации

Последнее сообщение Anonymous « 10 июл 2025, 16:58
Добавлено в форуме Python

Anonymous » 10 июл 2025, 16:58 » в форуме Python

Я получаю эту ошибку TypeError: 'Cootle' объект не подлежит вызову всякий раз, когда я пытаюсь получить объект в кортеже. Мой код -
import random
import sys

inp = input( Press ENTER to start. )
sys.stdout.write( Rules --\nIn this game, you will...

0 Ответы

4 Просмотры

Последнее сообщение Anonymous
10 июл 2025, 16:58
Существует ли какая -либо разница между вызовом локальной переменной и вызовом переменной экземпляра объекта?

Последнее сообщение Anonymous « 16 фев 2025, 22:19
Добавлено в форуме Python

Anonymous » 16 фев 2025, 22:19 » в форуме Python

Вот код, который у меня есть:

elif line.mesg.startswith('^^'):
recog, score = pull_recog(line)
line.recog = recog
line.score = score

print recog + ' '*(20-len(recog)) + '%2.2f'%score

Этот вопрос действительно сводится к тому, как компилятор...

0 Ответы

25 Просмотры

Последнее сообщение Anonymous
16 фев 2025, 22:19
Эта ошибка продолжает появляться в моем коде {TypeError: 'DataFrame' объект не может быть вызовом}, как это решить?

Последнее сообщение Anonymous « 11 фев 2025, 20:08
Добавлено в форуме Python

Anonymous » 11 фев 2025, 20:08 » в форуме Python

data_features = df.iloc
labels = df .astype('category').cat.codes
dataset = CustomDataset(data_features, labels)
dataloader = DataLoader(dataset, batch_size=batch_size, shuffle=True)

Независимо от того, насколько я пробую эту вещь, продолжает...

0 Ответы

8 Просмотры

Последнее сообщение Anonymous
11 фев 2025, 20:08
FASTAPI повышает «TypeError: <объект генератора get_db на 0x00 ...> не является вызовом объектом» при передаче функции з

Последнее сообщение Anonymous « 16 мар 2025, 10:30
Добавлено в форуме Python

Anonymous » 16 мар 2025, 10:30 » в форуме Python

Я получаю:

file c: \ pythonprojects \ myproject \ routers \ home.py , строка 39, в

@router.get(P /Home , response_class = htmlresponse)
. TypeError ('{! R} не является вызовочным объектом'.format (obj))
typeerror: не является Callable Object...

0 Ответы

35 Просмотры

Последнее сообщение Anonymous
16 мар 2025, 10:30

Вернуться в «Python»