Files
data_science_bd04/dsdm/chapter_6.md

659 B

Chapter 6

Data visualizatie is belangrijk voor primair de volgende redenen:

  • Exploratory data analysis - Om in het begin je dataset te 'leren kennen'
  • Error detection - Door het visualiseren kun je gemakkelijker inzien of je een fout hebt gemaakt bij het verwerken van data
  • Communication - Het 'presenteerbaar' maken van wat je geleerd hebt

Exploratory Data Analysis

Bij het beginnen met een nieuwe dataset worden over het algemeen de volgende stappen gehanteerd:

  1. Basis vragen - Voordat de dataset ook maar wordt geopend is het verstandig om de volgende vragen te beantwoorden:

    1.1 Wie, wanneer en waarom is de dataset gemaakt