Wanneer een mens naar een scène of een afbeelding kijkt, begrijpt hij het - welke objecten erin zitten en wat er gebeurt als er actie plaatsvindt. Een computer daarentegen verwerkt alleen digitale gegevens die de kleurwaarde van elke pixel beschrijven. Voor een mens is het herkennen van een pizza op een rommelige tafel moeiteloos. Maar tot voor kort waren computers niet in staat om dezelfde taak uit te voeren.

Computervisie, of CV, stelt een computer in staat om belangrijke informatie uit visuele input te halen en nauwkeurige voorspellingen en aanbevelingen te doen op basis van die informatie.

Hoe werkt computervisie?

Voordat iemand met computervisie een programma kon maken dat een bepaald beeld herkende, moest hij urenlang handmatig beenwerk doen. Ten eerste zou een database met vergelijkbare afbeeldingen moeten worden verzameld.

Vervolgens zouden deze afbeeldingen handmatig moeten worden geanalyseerd, gemeten en geannoteerd met relevante gegevens waarvan de onderzoeker dacht dat het het object in kwestie kon identificeren (zoals kleur, afmetingen en vorm). Alleen dan kon software worden gebruikt om voorspellingen te doen.

Aan de andere kant automatiseert computervisie dit hele proces met behulp van een machine learning-aanpak die bekend staat als deep learning. Deep learning maakt gebruik van een meerlagig neuraal netwerk met honderden potentiële lagen. In het geval van afbeeldingen is dit meestal een convolutioneel neuraal netwerk (CNN).

In detail uitleggen hoe deep learning en neurale netwerken werken, valt ver buiten het bestek van dit artikel. In principe worden grote hoeveelheden gegevens in het neurale netwerk ingevoerd. Het neurale netwerk analyseert de gegevens herhaaldelijk totdat het er nauwkeurige voorspellingen over kan doen.

In het geval van een CNN die wordt gebruikt voor een computervisietaak, doorloopt het neurale netwerk de gegevens via verschillende stappen. Ten eerste vouwt het de afbeelding samen in verschillende stukken (afzonderlijke pixels of groepen pixels die vooraf zijn getagd).

Vervolgens maakt het voorspellingen over wat zich in verschillende delen van de afbeelding bevindt (zoals harde randen of specifieke objecten). Het controleert herhaaldelijk de nauwkeurigheid van deze voorspellingen en wijzigt elke keer delen van het algoritme lichtjes totdat het zeer nauwkeurig wordt.

Computers zijn nu zo krachtig dat ze een afbeelding veel sneller kunnen analyseren dan het menselijk brein, vooral als ze eenmaal hebben geleerd bepaalde patronen te herkennen. Op deze manier is het gemakkelijk te zien hoe een deep learning-algoritme de menselijke capaciteiten zou kunnen overtreffen.

Wat zijn de soorten computervisie?

Computervisie omvat het analyseren en begrijpen van afbeeldingen en de output van relevante voorspellingen of beslissingen over de afbeeldingen. Er zijn verschillende taken die computervisie zal gebruiken om deze doelen te bereiken. Enkele hiervan zijn:

  • Afbeeldingsclassificatie: Het type afbeelding wordt herkend. Of het bijvoorbeeld een gezicht, landschap of object van een persoon is. Dit soort taken kan worden gebruikt om afbeeldingen snel te identificeren en te classificeren. Een gebruik hiervoor is het automatisch herkennen en blokkeren van ongepaste inhoud op sociale media.
  • Object herkenning: Net als bij beeldclassificatie kan objectherkenning een bepaald object binnen een scène identificeren, zoals een pizza op een rommelige tafel.
  • Rand detectie: Een veelgebruikt gebruik van computervisie, en meestal de eerste stap bij objectdetectie, is het identificeren van de harde randen in een afbeelding.
  • Objectidentificatie: Dit is de herkenning van individuele voorbeelden van een object of afbeelding, zoals het identificeren van een bepaalde persoon, vingerafdrukken of voertuig.
  • Objectdetectie: Detectie is de identificatie van een bepaald kenmerk binnen een afbeelding, zoals een gebroken bot in een röntgenfoto.
  • Objectsegmentatie: Dit is de identificatie van welke pixels in de afbeelding bij het betreffende object horen.
  • Object volgen: Zodra een object in een videosequentie is herkend, kan het gemakkelijk door de hele video worden gevolgd.
  • Beeldherstel: Vervaging, ruis en andere beeldartefacten kunnen worden verwijderd door nauwkeurig te bepalen waar het object versus de achtergrond zich in het beeld bevindt.

Voorbeelden van computervisie

Kunstmatige intelligentie is al in verschillende industrieën gebruikt met een verbluffend effect, wat geldt voor computervisie. Hier zijn een paar voorbeelden van cv's die vandaag al worden gebruikt.

Gezichtsherkenning

Gezichtsherkenning is een van de belangrijkste manieren waarop computervisie tegenwoordig wordt gebruikt. In vergelijking met databases van bekende gezichten kunnen computervisie-algoritmen zeer nauwkeurig individuele mensen identificeren.

  • Social media analyseert afbeeldingen en tagt automatisch gebruikers waarvoor het een goede selectie afbeeldingen heeft.
  • Laptops, telefoons en beveiligingsapparaten kunnen mensen identificeren om toegang te verlenen.
  • Rechtshandhaving gebruikt gezichtsherkenning in CCTV-systemen om verdachten te identificeren.

Geneesmiddel

Computervisie wordt momenteel gebruikt in de gezondheidszorg om snellere en nauwkeurigere diagnoses te stellen dan experts kunnen maken. Veel toepassingen omvatten het analyseren van röntgen-, CT- of MRI-beelden voor bepaalde aandoeningen, waaronder neurologische aandoeningen, tumoren en gebroken of gebroken botten.

Zelfrijdende auto's

Autonome voertuigen moeten hun omgeving begrijpen veilig te rijden. Dit betekent het herkennen van wegen, rijstroken, verkeerslichten, andere voertuigen, voetgangers en meer. Al deze taken maken in realtime gebruik van computervisiesystemen om botsingen te voorkomen en veilig te rijden.

Computervisie is uitdagend

De huidige toepassingen van computervisie beginnen de manier waarop we werken in verschillende industrieën al te veranderen. Van het kunnen detecteren van defecte of kapotte apparatuur tot het nauwkeurig diagnosticeren van kanker, computervisie heeft de mogelijkheid om systemen te verbeteren en levens te redden.

Maar het is niet zonder uitdagingen. Computervisie is nog verre van wat menselijke visie is. We hebben duizenden jaren van evolutie waardoor we bijna alles wat er om ons heen gebeurt in realtime kunnen herkennen en begrijpen. Maar we hebben geen idee hoe menselijke hersenen deze taken uitvoeren.

Deep learning is een enorme stap in de goede richting, maar het vereist nog steeds een verbazingwekkende hoeveelheid werk om een ​​systeem te creëren dat een taak kan uitvoeren die mensen heel gemakkelijk kunnen doen, zoals het identificeren van een auto op de weg. Dit komt omdat computers beperkte taken zeer effectief uitvoeren. Het ontwikkelen van een computer die de totale complexiteit van de visuele wereld kan begrijpen, is een heel ander balspel.

Naarmate er meer onderzoek wordt gedaan naar zowel AI-toepassingen als menselijke biologie, zullen we in de nabije toekomst waarschijnlijk een explosie van mogelijke toepassingen voor computervisie zien.

E-mail
Wat zijn machine learning-algoritmen? Hier is hoe ze werken

Algoritmen voor machinaal leren zijn ontworpen om het leven gemakkelijker te maken en systemen te verbeteren, maar ze kunnen misgaan met slechte gevolgen.

Lees volgende

Gerelateerde onderwerpen
  • Technologie uitgelegd
  • Programmeren
  • Kunstmatige intelligentie
  • Neurale netwerken
Over de auteur
Jake Harfield (16 artikelen gepubliceerd)

Jake Harfield is een freelance schrijver gevestigd in Perth, Australië. Als hij niet aan het schrijven is, is hij meestal in de bush om de plaatselijke fauna te fotograferen. Je kunt hem bezoeken op www.jakeharfield.com

Meer van Jake Harfield

Abonneer op onze nieuwsbrief

Word lid van onze nieuwsbrief voor technische tips, recensies, gratis e-boeken en exclusieve deals!

Nog een stap…!

Bevestig uw e-mailadres in de e-mail die we u zojuist hebben gestuurd.

.