Skip to main content

Ctrl+K

Site Navigation

Overview
Getting Started
User Guides
API Reference
Development
Migration Guides

GitHub
PyPI

Site Navigation

Overview
Getting Started
User Guides
API Reference
Development
Migration Guides

GitHub
PyPI

Section Navigation

Spark SQL
Pandas API on Spark
Structured Streaming
MLlib (DataFrame-based)
MLlib (DataFrame-based) for Spark Connect
Spark Streaming (Legacy)
MLlib (RDD-based)
Spark Core
Resource Management
Errors
Testing
- pyspark.testing.assertDataFrameEqual
- pyspark.testing.assertSchemaEqual

API Reference
Spark Streaming (Legacy)
pyspark.streaming.DStream.groupByKey

pyspark.streaming.DStream.groupByKey#

DStream.groupByKey(numPartitions=None)[source]#: Return a new DStream by applying groupByKey on each RDD.

previous

pyspark.streaming.DStream.glom

next

pyspark.streaming.DStream.groupByKeyAndWindow

Copyright @ 2024 The Apache Software Foundation, Licensed under the Apache License, Version 2.0.

Created using Sphinx 4.5.0.

Built with the PyData Sphinx Theme 0.13.3.