Datakvalitet
Datakvalitet refererer til kvalitative eller kvantitative egenskaber ved information. Der er mange definitioner af datakvalitet, men data bliver generelt betragtet som at have høj kvalitet hvis det "egner sig til den tilsigtede brug i drift, beslutningstagning og planlægning".[1][2][3] Derudover er data af højere kvalitet hvis det korrekt repræsenterer den virkelige verden, som den omhandler. Udover disse definitioner er spørgsmålet om intern datakonsistens blevet mere signifikant i takt med at antallet af datakilder stiger. Der er kan også være uoverensstemmelser imellem folks syn på datakvalitet, selv hvis det omhandler det samme sæt data, der anvendes til det samme formål. I disse tilfælde bruge datastyring til at danne et aftalt sæt definitioner og standarder for datakvalitet. Datavask, inklusive standardisering, kan være nødvendig for at sikre datakvalitet.[4]
Sikring af datakvalitet
Sikring af datakvalitet — det er processen med profilering af data for at identificere afvigelser og andre anomalier i dataene, samt udførelse af datarensning[5] (f.eks. fjernelse af udliggere, interpolation af manglende data) for at forbedre datakvaliteten. Disse handlinger kan udføres som led i et datalager eller som del af databaseadministrationen af eksisterende applikationssoftware.
Berigelse af databasen — alle processer, der har til formål at forbedre kvaliteten, fuldstændigheden og pålideligheden af de oplysninger, der findes i et forretnings- eller markedsføringsinformationssystem. Denne praksis løser et strukturelt problem: databaser forringes naturligt over tid.[6]
Kontrol af datakvalitet
Kontrol af datakvalitet er processen med at overvåge brugen af data i en applikation eller en proces.[7][8] Denne proces udføres både før og efter processen for sikring af datakvalitet (QA),[9] som består i at identificere og rette afvigelser i dataene.
Internationale standarder for datakvalitet
ISO 8000 er en international standard for datakvalitet.[10][11][12] ISO 8000-standarderne, udviklet af Den Internationale Standardiseringsorganisation,[13] omhandler og beskriver
- Generelle aspekter af datakvalitet, herunder principper, terminologi og målemetoder.
- datastyring
- styring af datakvalitet
- vurdering af datakvalitet
- kvalitet af masterdata, herunder udveksling af attributdata og identifikatorer.
- kvalitet af industridata
Kontroller for overholdelse af standarder og integritetskontroller behøver ikke nødvendigvis at blive inkluderet i alle forretningsopgaver; det afhænger fuldstændigt af de valg, der er truffet i databasearkitekturen.
Kvalitet af åbne data
Der findes en række videnskabelige arbejder, der analyserer datakvaliteten i åbne datakilder såsom Wikipedia, Wikidata, DBpedia og andre. I Wikipedia kan kvalitetsanalysen vedrøre hele artiklen. Kvalitetsmodelleringen dér udføres ved hjælp af forskellige metoder. Nogle af dem anvender maskinlæringsalgoritmer, herunder Random Forest, Support Vector Machines og andre. Metoder til vurdering af datakvalitet i Wikidata, DBpedia og andre LOD-kilder varierer.
Referencer
- ^ Redman, Thomas C. (30. december 2013). Data Driven: Profiting from Your Most Important Business Asset. Harvard Business Press. ISBN 978-1-4221-6364-1.
- ^ Fadahunsi, Kayode Philip; Akinlua, James Tosin; O’Connor, Siobhan; Wark, Petra A; Gallagher, Joseph; Carroll, Christopher; Majeed, Azeem; O’Donoghue, John (marts 2019). "Protocol for a systematic review and qualitative synthesis of information quality frameworks in eHealth". BMJ Open. 9 (3): e024722. doi:10.1136/bmjopen-2018-024722. ISSN 2044-6055. PMC 6429947. PMID 30842114.
- ^ Fadahunsi, Kayode Philip; O'Connor, Siobhan; Akinlua, James Tosin; Wark, Petra A.; Gallagher, Joseph; Carroll, Christopher; Car, Josip; Majeed, Azeem; O'Donoghue, John (2021-05-17). "Information Quality Frameworks for Digital Health Technologies: Systematic Review". Journal of Medical Internet Research (engelsk). 23 (5): e23479. doi:10.2196/23479. PMC 8167621. PMID 33835034.
- ^ Smallwood, R.F. (2014). Information Governance: Concepts, Strategies, and Best Practices. John Wiley and Sons. s. 110. ISBN 9781118218303. Arkiveret fra originalen 2020-07-30. Hentet 2020-04-18.
Having a standardized data governance program in place means cleaning up corrupted or duplicated data and providing users with clean, accurate data as a basis for line-of-business software applications and for decision support analytics in business intelligence (BI) applications.
- ^ "Data Quality Assurance". provectus.com. Hentet 2026-01-20.
- ^ "Enrichissement Base de Données B2B : Méthodes Sources RGPD". datapult.ai. Hentet 2026-01-20.
- ^ "Data Quality Management 101". www.dataversity.net. Hentet 2026-01-20.
- ^ "What is Data Quality Monitoring". www.ataccama.com. Hentet 2026-01-20.
- ^ "Quality Control Vs. Quality Assurance in the Era of Smart Quality Management". smartfoodsafe.com. Hentet 2026-01-20.
- ^ "ISO 8000". eccma.org. Hentet 2026-01-20.
- ^ "What Is The ISO 8000 Standart?". www.isoindia.org. Hentet 2026-01-20.
- ^ "ISO 8000: Data quality system to enhance reliability and decision-making". khobara-group.com. Hentet 2026-01-20.
- ^ "ISO 8000 and Data Extraction - Building Reliable Automation With Data Quality Standards". parseur.com. Hentet 2026-01-20.
| Spire Denne artikel om software og programmering er en spire som bør udbygges. Du er velkommen til at hjælpe Wikipedia ved at udvide den. |
Content Disclaimer
Informasi ini disarikan dari Wikipedia dan disajikan kembali untuk tujuan edukasi. Konten tersedia di bawah lisensi CC BY-SA 3.0. Kami tidak bertanggung jawab atas ketidakakuratan data yang bersumber dari kontribusi publik tersebut.
- The information displayed on this website is sourced in part or in whole from Wikipedia and has been adapted for the purpose of restating it. We strive to provide accurate and relevant information, however:
- There is no guarantee of absolute accuracy. Wikipedia is an open, collaborative project that can be edited by anyone, so information is subject to change.
- It is not intended to constitute professional advice. The content displayed is for informational and educational purposes only. For important decisions (e.g., medical, legal, or financial), please consult a professional.
- Content copyright. Wikipedia is licensed under the Creative Commons Attribution-ShareAlike License (CC BY-SA). This means that content may be reused with appropriate attribution and shared under a similar license.
- Responsible use. Any risk arising from the use of information from this website is entirely the responsibility of the user.









