Skip to main content
Narcis Miclaus
  • Home
  • Programare
  • Finanțe
  • Unelte
  • Portofoliu
  • Despre
  • EN English
  • IT Italiano
  • EN English
  • IT Italiano
← Programare

PySpark

DataFrame-uri distribuite, join-uri care nu aruncă clusterul în aer și părțile din Spark care mușcă.

  • .cache() nu e gratis — când să-l folosești, când e o capcană

    Publicat pe 11 aprilie 2026

    Cache și persist din Spark sună ca niște butoane magice de performanță. Nu sunt. Iată când caching-ul chiar ajută, când face lucrurile mai rele și cum faci diferența.

    • #pyspark
    • #spark
    • #caching
    • #performance
  • Partiționarea: lucrul care îți omoară job-ul Spark pe tăcute

    Publicat pe 11 aprilie 2026

    Cum se împart datele între executoare, de ce valoarea implicită e aproape mereu greșită și dansul repartition/coalesce de care fiecare job Spark are nevoie până la urmă.

    • #pyspark
    • #spark
    • #partitioning
    • #performance

Construit cu Astro — fără tracker-e, doar cuvinte și cifre.

© 2026 Narcis Miclaus