diff --git a/dsdm/chapter_2.md b/dsdm/chapter_2.md new file mode 100644 index 0000000..38e006a --- /dev/null +++ b/dsdm/chapter_2.md @@ -0,0 +1,38 @@ +## Chapter 2 + + +### Probability + + +### Descriptive Statistics +Er bestaan twee catogerieen van *descriptive statistics*, namelijk: + +* **Central tendency measures** - Deze beschrijven het *middenpunt* van de data +* **variation / variability measures** - Deze beschrijven de *spreiding* van de data + +**Central tendency measures** + +* *Mean* - Som van alle waardes gedeeld door $n$ +* *Geometric mean* - de $n$ -wortel van het product van $n$ waardes +* *Median* - Het middelste getal in een gesorteerde lijst +* *Mode* - Het getal dat het meest voorkoomt + + +**Variability Measures** + +Het meest wordt gebruik gemaakt van de *standard deviation* $\sigma$. Deze meet de som van de vierkants-wortel verschillen tussen waardes en het gemiddelde. + +*Variance* $V$ is een gerelateerde statistiek welke gelijk is aan $\sigma^2$ + + +### Correlation Analysis + +* Pearson +* Spearman + +Auto-correlation + + + +### Logarithms + diff --git a/main.tex b/main.tex index 7f6660b..e8ead7a 100644 --- a/main.tex +++ b/main.tex @@ -53,6 +53,10 @@ Martijn Remmen \chapter{Week 1} \markdownInput{week1/hoorcollege.md} + \markdownInput{week1/discussiecollege.md} + + \chapter{Data Science Design Manual} + \markdownInput{dsdm/chapter_2.md} %\printbibliography