При наличии файла, который содержит данные о клиентах в каждой строке в формате, разделенном запятыми.
Один и тот же клиент может иметь несколько адресов электронной почты, поэтому для одного и того же клиента будет несколько строк с разными данными электронной почты, как показано ниже. Одни и те же данные о клиенте всегда будут располагаться последовательно.
Код: Выделить всё
1234,1234a@email.com
1234,1234b@email.com
5678,5678a@email.com
9999,9999a@email.com
9999,9999b@email.com
9999,9999c@email.com
Необходимо прочитать файл и добавить общее количество электронных писем для каждого клиента в каждой строке в нисходящем направлении, как указано ниже.
Код: Выделить всё
1234,1234a@email.com,2
1234,1234b@email.com,2
5678,5678a@email.com,1
9999,9999a@email.com,3
9999,9999b@email.com,3
9999,9999c@email.com,3
Это хороший подход к построению этого конвейера в мгновение ока. (Будут миллионы строк)
Подробнее здесь:
https://stackoverflow.com/questions/783 ... d-in-flink