Dr. Tom Mitchell, voormalig voorzitter van de afdeling Machine Learning van de Carnegie Mellon University, geeft in zijn boek een elegante definitie van Machine Learning. Hij stelt dat "het vakgebied Machine Learning zich bezighoudt met de vraag hoe je computerprogramma's kunt maken die automatisch beter worden naarmate je meer ervaring hebt" Er bestaan tegenwoordig veel verschillende soorten Machine Learning, maar degene die het meest wordt gebruikt voor zakelijke toepassingen is Supervised Learning. Bij Supervised Learning worden algoritmen zoals lineaire en logistische regressies en multiklasse classificatie gebruikt om een reeks inputvariabelen (X) te analyseren en een output (Y) te produceren via een mapping-functie, bijvoorbeeld y=f(x). De parallel van Supervised Learning is die van een leraar en leerling, waarbij de leerling door de leraar wordt getraind in een onderwerp. Supervised Learning vereist dat de mogelijke resultaten van het algoritme bekend zijn en dat de gegevens die gebruikt worden om het algoritme te trainen gelabeld zijn met de juiste antwoorden. De meeste toepassingen van Supervised Machine Learning omvatten gewoonlijk de volgende stappen:
  1. Verzamelen van de dataset die geëvalueerd moet worden
  2. De set parameters en kenmerken extraheren om voorspellingen te ondersteunen
  3. Kies het Machine Learning-algoritme
  4. Het model trainen
  5. Voorspellingen doen met het gebruikte model
  6. Parameters aanpassen om het model te verfijnen
Stel je voor dat je in de FP&A-groep van een ontwikkelaar van mobiele apps werkt en de toekomstige verkoop van verschillende mobiele apps probeert te voorspellen. Er zijn veel variabelen zoals het ondersteunde platform, de prijs, wereldwijde beschikbaarheid, scores van online critici en gebruikersbeoordelingen die de winstgevendheid van een mobiele app kunnen beïnvloeden, en dit is waar Machine Learning kan worden gebruikt om succes te voorspellen. Het begint allemaal met de beschikbare gegevens die in een model kunnen worden gebruikt. Hoe meer gegevens beschikbaar zijn, hoe groter de kans voor het Machine Learning-algoritme om de correlatie te vinden tussen een reeks kenmerken om toekomstige voorspellingen te verbeteren. Tijdens de fase van modeltraining wordt een Machine Learning-algoritme geselecteerd en gebruikt om de verzamelde gegevens te evalueren. In ons voorbeeld voeren we het model gegevens met geselecteerde kenmerken van een groep hits op mobiele apps en vergelijken deze met de voorspelde uitkomsten van het model. De experimenten kunnen worden herhaald met dezelfde gegevensset, maar met verschillende Machine Learning-algoritmen om te bepalen welk algoritme het meest effectief is in het voorspellen van de resultaten. Een evaluatiemodel wordt gemaakt nadat het initiële trainen van het model is voltooid en wanneer we tevreden zijn over de effectiviteit van het gekozen algoritme. We kunnen nu het evaluatiemodel gebruiken om voorspellingen te doen. Het echte magische of "lerende" aspect is wanneer we de voorspelde waarden van ons evaluatiemodel vergelijken met de werkelijke waarden, zoals die zich in de loop van de tijd voordoen. Door incrementele aanpassingen kunnen we de modelparameters verfijnen, de resolutie van de gegevensset verhogen of verlagen en het evaluatiemodel kan de voorspellingen opnieuw uitvoeren om te bepalen of de aanpassingen aan de parameters (en/of gegevens) de nauwkeurigheid van de voorspelling hebben verbeterd. In het algemeen zullen Machine Learning toepassingen de mogelijkheden van FP&A sterk aanvullen en verbeteren. Deze toepassingen zorgen niet alleen voor effectievere analyses en nauwkeurigere voorspellingsmodellen, maar ook voor meer vertrouwen in voorspellingen. Klik hier voor meer informatie .