Files
data_science_bd04/lesstof/1 - hoorcollege.md
2022-01-29 18:01:38 +01:00

1.0 KiB

Hoorcollege

Data Science is een multidisciplinair veld dat concepten uit Computer Science (informatica), statistiek/machine learning en data analyze gebruikt om inzichten te creëren in steeds groeiende hoeveelheden data.

Er bestaan twee paradigms binnen Data research (en dus data Science), namelijk:

  1. Hypothesis-Driven - Hierbij zoek je gericht om een bepaalde vraagstelling/probleem te beantwoorden (gedreven door een vraag/probleem)
  2. Data-Driven - Er zijn gegevens beschikbaar, wat kunnen we hiermee (Gedreven door het feit dat er data is)

Types Machine Learning:

  • Supervised Learning - De data is voorzien van historische gegevens waarmee getraind kan worden
  • Unsupervised Learning - Clusteren van data
  • Reinforcement Learning - Leren door het interacteren met de omgeving

Types van supervised Learning

  • Classification - Iets toewijzen tot een discrete set van van mogelijkheden. Zoals spam/geen-spam of bloed type
  • Regressie - Het voorspellen van een numerieke waarde.