Met al het gepraat over machine learning in de afgelopen jaren, is het moeilijk om de wens te negeren om het zelf te proberen. De technologie lijkt in een zeer snel tempo te evolueren en wordt al in veel omgevingen toegepast. Als je wat programmeervaardigheden hebt en een basiskennis hebt van een aantal concepten over statistiek, dan zit je goed wat betreft vaardigheidsvereisten.
U moet echter ook rekening houden met de hardware die u hiervoor nodig heeft. U kunt alles thuis hosten of externe services gebruiken - beide hebben hun voor- en nadelen.
Basisvereisten voor ontwikkeling van machine learning
Je hebt relatief krachtige hardware nodig om dingen op gang te krijgen. Hoewel u de meeste gerelateerde tools op een goedkope laptop kunt gebruiken, wordt uw leerpotentieel ernstig beperkt en duurt alles veel langer dan nodig is.
Uw GPU (Graphics Processing Unit) is hier het belangrijkste onderdeel. Het heeft niets rechtstreeks met afbeeldingen te maken. Het is alleen dat GPU's beter geschikt zijn voor de soorten berekeningen waarop machine learning vertrouwt.
Een GPU die CUDA ondersteunt, zal hier nog beter zijn, hoewel het u meer zal kosten om er een te bemachtigen. Maakt u zich geen zorgen als u dit soort hardware momenteel niet kunt betalen. U kunt uw oplossingen ook op afstand uitvoeren, maar u zult te maken krijgen met de ups en downs van die configuratie.
Lees verder: Wat zijn CUDA-kernen?
Waarom uw kosten mogelijk hoger zijn in 2021
Het is ook vermeldenswaard dat het op dit moment nog uitdagender kan zijn om nieuwe hardware voor machine learning te kopen. Er ontwikkelt zich een lastige mondiale situatie die draait om een tekort aan halfgeleiders die worden gebruikt bij de productie van verschillende consumentenelektronica. Van GPU's tot smartphones en andere apparaten, veel markten zijn getroffen.
Sommige voorspellingen beweren dat dit tekort nog enkele jaren zou kunnen aanhouden, aangezien het het resultaat was van verschillende onverwachte factoren. Tussen de pandemie die de productiemogelijkheden aantast en de vraag stimuleert, en mijnwerkers en scalpers door de hele voorraad uit te kopen, is de situatie een uitdaging geweest voor degenen die gewoon een nieuwe willen kopen GPU.
Verwant: Waarom zijn grafische kaarten op dit moment zo duur?
Het is ook niet duidelijk wanneer de prijzen zullen normaliseren - de prijzen kunnen blijven stijgen. Het zoeken naar een gebruikte GPU zou een betere optie kunnen zijn, maar je kunt niet garanderen dat je iets geschikts zult vinden.
Voordelen en nadelen van gehoste platforms
Met een gehost platform voor de ontwikkeling van machine learning kunt u zich concentreren op het daadwerkelijke ontwikkelingswerk zonder dat u zich zorgen hoeft te maken over hardware-overwegingen. U profiteert van geavanceerde verwerkingskracht en deze platforms kunnen uw oplossingen doorgaans veel sneller uitvoeren dan alles wat u thuis zou kunnen bouwen.
Dit soort stroom is natuurlijk niet gratis. U moet abonnementskosten betalen om de meeste van deze services te gebruiken. Degenen die gratis worden aangeboden, hebben hun eigen beperkingen.
Het is bijvoorbeeld mogelijk dat u uw programma niet op aanvraag kunt uitvoeren en mogelijk in een wachtrij moet wachten. Dit kan met name problematisch zijn bij langere trainingssessies, waarbij je naast een toch al lange wachttijd een paar extra uren moet toevoegen.
En dan voelen sommige mensen zich gewoon meer op hun gemak in hun werk als ze alles ter plaatse beschikbaar hebben. Het kan zeker handiger zijn om op deze manier met machine learning te werken als sommige modellen meerdere gigabytes groot kunnen zijn en het even kan duren om ze van en naar de juiste servers over te dragen.
Het beste van beide werelden
Je zou een gemengde benadering kunnen gebruiken. Voer het grootste deel van uw ontwikkeling lokaal uit, zoals het daadwerkelijke werk aan uw algoritmen en modellen, en gebruik een gehoste service voor omvangrijke, dure verwerking.
U kunt uw gegevens meestal in batches indienen om ze in één keer gedurende een bepaalde periode te laten verwerken, en u hoeft alleen maar terug te komen om uw resultaten achteraf op te halen. Dit kan goed werken als u geen onmiddellijke resultaten nodig heeft, en het kan u in staat stellen om dure trainingen uit te voeren tegen relatief lage kosten.
Dit is de benadering waar de meeste mensen tegenwoordig voor kiezen. Als u niet te veel aan hardware wilt uitgeven, maar het prima vindt om hier wat geld aan uit te geven, is dit waarschijnlijk waar u naar moet kijken.
Er zijn verschillende aanbiedingen op de markt, waarvan sommige gericht zijn op mensen met een kleiner budget, dus kijk eens rond en kijk wat er allemaal beschikbaar is. Soms kun je er mee wegkomen dat je projecten voor verrassend weinig worden gehost, zolang ze maar geen complexe vereisten hebben.
Wees voorzichtig met gevoelige gegevens
Bedenk dat bij machine learning vaak moet worden gewerkt met gevoelige gegevens. U kunt bijvoorbeeld worden belast met het verwerken van medische dossiers of andere persoonlijke informatie. Het zou vanzelfsprekend moeten zijn dat u in deze situaties veel voorzichtiger moet zijn als u werkt met op afstand gehoste services.
U moet zich bewust zijn van de implicaties van het verzenden van die gegevens naar externe servers. Soms is het mogelijk dat u in strijd bent met bepaalde wettelijke kaders zonder dat u het zelf beseft. In de Europese Unie moet je bijvoorbeeld heel voorzichtig zijn met GDPR.
Het is een goed idee om een juridisch specialist te raadplegen als uw machine learning-oefeningen enige vorm van gevoelige gegevens zullen bevatten. Beter nog, u zou dit soort gegevens waarschijnlijk niet in de eerste plaats moeten gebruiken voor uw eerste trainingsprojecten. Ga gewoon voor iets dat veiliger en gemakkelijker te hanteren is.
Zelf machine leren
Thuis machinaal leren is mogelijk en heeft veel voordelen. Maar het heeft ook enkele negatieve implicaties waarmee u rekening moet houden, en u moet er uiteindelijk voor zorgen dat u een evenwichtige aanpak vindt. Besteed speciale aandacht aan details, zoals het werken met gevoelige gegevens, en maak uzelf altijd vertrouwd met eventuele wettelijke vereisten die uw situatie aan u zou kunnen stellen.
Uiteindelijk kan dit een erg leuke en productieve ervaring zijn die je een geweldige positie op de arbeidsmarkt kan geven.
Python is buitengewoon veelzijdig, met toepassingen die variëren van webontwikkeling tot gegevensanalyse.
Lees Volgende
- Technologie verklaard
- Cloud computing
- Machine leren
Stefan is een schrijver met een passie voor het nieuwe. Hij studeerde oorspronkelijk af als geologisch ingenieur, maar besloot in plaats daarvan te gaan schrijven als freelancer.
Abonneer op onze nieuwsbrief
Word lid van onze nieuwsbrief voor technische tips, recensies, gratis e-boeken en exclusieve deals!
Nog een stap…!
Bevestig uw e-mailadres in de e-mail die we u zojuist hebben gestuurd.