Exploratívna dátová analýza (EDA) je proces analýzy dát s cieľom porozumieť vlastnostiam a vzájomným vzťahom medzi dátami s využitím vizualizácií alebo deskriptívnej štatistiky. Pod vizualizáciou si môžeme predstaviť použitie rôznych grafov a tabuliek, ale aj histogramov, boxplotov alebo scatterplotov. Deskriptívna štatistika zohľadňuje parametre akými sú priemer, medián, rozptyl, odchýlka alebo kvartily.

Vďaka metóde EDA dokážeme odhaliť výnimky, odchýlky a nezvyčajné trendy v dátach a vzorcoch a preto je kľúčovou fázou v procese analýzy dát. EDA tak slúži aj na identifikáciu chýbajúcich hodnôt a odhaľovanie nekonzistentnosti v dátach.