Files
data_science_bd04/lesstof/1 - hoorcollege.md
2022-01-29 18:01:38 +01:00

19 lines
1.0 KiB
Markdown

## Hoorcollege
**Data Science** is een multidisciplinair veld dat concepten uit Computer Science (informatica), statistiek/machine learning en data analyze gebruikt om inzichten te creëren in steeds groeiende hoeveelheden data.
Er bestaan twee *paradigms* binnen Data research (en dus data Science), namelijk:
1. **Hypothesis-Driven** - Hierbij zoek je gericht om een bepaalde vraagstelling/probleem te beantwoorden (gedreven door een vraag/probleem)
2. **Data-Driven** - Er zijn gegevens beschikbaar, wat kunnen we hiermee (Gedreven door het feit dat er data is)
Types Machine Learning:
* **Supervised Learning** - De data is voorzien van historische gegevens waarmee getraind kan worden
* **Unsupervised Learning** - Clusteren van data
* **Reinforcement Learning** - Leren door het interacteren met de omgeving
### Types van supervised Learning
* **Classification** - Iets toewijzen tot een discrete set van van mogelijkheden. Zoals spam/geen-spam of bloed type
* **Regressie** - Het voorspellen van een numerieke waarde.