PySpark · Programare · Narcis Miclaus

.cache() nu e gratis — când să-l folosești, când e o capcană

Publicat pe 11 aprilie 2026

Cache și persist din Spark sună ca niște butoane magice de performanță. Nu sunt. Iată când caching-ul chiar ajută, când face lucrurile mai rele și cum faci diferența.
- #pyspark
- #spark
- #caching
- #performance
Partiționarea: lucrul care îți omoară job-ul Spark pe tăcute

Publicat pe 11 aprilie 2026

Cum se împart datele între executoare, de ce valoarea implicită e aproape mereu greșită și dansul repartition/coalesce de care fiecare job Spark are nevoie până la urmă.
- #pyspark
- #spark
- #partitioning
- #performance