diff --git a/dsdm/chapter_5.md b/dsdm/chapter_5.md new file mode 100644 index 0000000..0d0b7f0 --- /dev/null +++ b/dsdm/chapter_5.md @@ -0,0 +1,9 @@ +## Chapter 5 + +Verdelingen: + +* **Binomial** - +* **Normal** - +* Poisson +* Power Law + diff --git a/dsdm/chapter_6.md b/dsdm/chapter_6.md new file mode 100644 index 0000000..e4b0156 --- /dev/null +++ b/dsdm/chapter_6.md @@ -0,0 +1,13 @@ +## Chapter 6 +Data visualizatie is belangrijk voor primair de volgende redenen: + +* *Exploratory data analysis* - Om in het begin je dataset te 'leren kennen' +* *Error detection* - Door het visualiseren kun je gemakkelijker inzien of je een fout hebt gemaakt bij het verwerken van data +* *Communication* - Het 'presenteerbaar' maken van wat je geleerd hebt + +### Exploratory Data Analysis +Bij het beginnen met een nieuwe dataset worden over het algemeen de volgende stappen gehanteerd: + +1. *Basis vragen* - Voordat de dataset ook maar wordt geopend is het verstandig om de volgende vragen te beantwoorden: + + 1.1 *Wie, wanneer en waarom is de dataset gemaakt*