Tidy dataLes dades ordenades o 'tidy data', nom alternatiu per a dades en format tabular, són les que s'obtenen a partir d'un procés anomenat 'data tidying' o ordenament de dades.[1] És un dels processos de neteja importants durant el processament de dades massives o 'big data' i és un pas habitual en la ciència de dades. Els conjunts de dades ordenades tenen una estructura que facilita la seva anàlisi posterior, ja que són més senzills de manipular, modelar i visualitzar. Bàsicament, els conjunts de dades 'tidy' estan ordenats de tal manera que cada variable o atribut és una columna i cada observació (o cas) és una fila.[1] CaracterístiquesJeff Leek, en el seu llibre The Elements of Data Analytic Style, resumeix les característiques de les dades ordenades amb els punts següents:[2]
Referències
Information related to Tidy data |