Я читал много вопросов об алгоритме хеширования Spark, но все равно не знаю. не знаю, как получить такое же значение хеш-функции в чистом Python.
- Какой алгоритм хеширования используется в pyspark.sql.functions.hash?
- Хеш-функция в spark
- Библиотека Scala MurmurHash3 не соответствует функции Spark Hash
Подробнее здесь: https://stackoverflow.com/questions/767 ... ing-python
Мобильная версия