Heb je je ooit afgevraagd hoe Shazam de muziek die je speelt 'hoort' en deze zo nauwkeurig identificeert? Nou, je bent niet de enige.
De technologie die de muziekherkenningsservice aandrijft, is voor velen een raadsel, vooral omdat de service jaren voordat smartphones en machine learning iets werden, werd gelanceerd.
In dit artikel gaan we kijken hoe Shazam werkt en hoe het muziek nauwkeurig kan herkennen.
Wat is Shazam?
Shazam is een populaire app voor muziekherkenning die u kunt gebruiken om informatie te vinden over een nieuw nummer dat u leuk vindt, maar waarvan u de titel of de naam van de artiest niet kent.
Stel dat u zich in een coffeeshop bevindt of om een winkel op de hoek loopt, en u hoort een nieuw nummer dat u graag in uw muziekbibliotheek zou willen hebben. Shazam helpt je het nummer gemakkelijk te vinden. Het enige dat u hoeft te doen, is een paar seconden van het nummer opnemen in de app.
De Shazam-app maakt gebruik van geavanceerde audioherkenningstechnologie om de muziek die je hoort te identificeren seconden zodat je de naam van de artiest en het nummer kunt achterhalen, video's kunt bekijken en zelfs het nummer kunt kopen of streamen op je apparaat.
Downloaden: Shazam voor iOS |Android (Vrij)
Hoe werkt Shazam?
Afbeelding 1 van 4
Afbeelding 2 van 4
Afbeelding 3 van 4
Afbeelding 4 van 4
Shazam gebruikt een gepatenteerde technologie die is ontwikkeld door Avery Lin-Chun Wang, de mede-oprichter van de app en chief data scientist, om overeenkomsten te identificeren voor nummers die op zijn platform worden opgevraagd. De technologie maakt vingerafdrukken voor audio-opnames, de geheime saus achter Shazam's geweldige herkenningsvaardigheden.
Shazam maakt audio-vingerafdrukken en slaat deze op, bestaande uit verzamelingen van numerieke gegevens voor elk meer dan 15 miljard nummers. Wanneer een gebruiker een nummer 'shazamt', maakt Shazam snel een audio-vingerafdruk van het geluid dat wordt ontvangen van de smartphone of pc-microfoon.
Zodra het klaar is met het maken van de audiovingerafdruk voor de opname, uploadt Shazam de audiovingerafdruk (niet de audio) naar zijn server, waar het een databasezoekopdracht uitvoert voor overeenkomsten. Als er een overeenkomst wordt gevonden, wordt de nummerinformatie geretourneerd met opties over waar deze kan worden gestreamd of gekocht, samen met de identificerende informatie.
Wat is een audiovingerafdruk?
Een audiovingerafdruk is een verkorte digitale samenvatting van audiosignalen. Ze worden gebruikt om een audiovoorbeeld te identificeren of om vergelijkbare items in een audiodatabase te lokaliseren.
De audio-vingerafdruktechnologie van Shazam kan niet-gelabelde stukjes audio-inhoud matchen met overeenkomstige overeenkomsten in de audiodatabase. Shazam identificeert de titel van het nummer dat je hebt opgenomen (een niet-gelabelde audio-inhoud) door de vingerafdruk van het nummer te vergelijken met de vingerafdruk van nummers in de database.
Shazam maakt unieke vingerafdrukken voor nummers in zijn database door bepaalde gegevenspunten te gebruiken die zijn geïdentificeerd met behulp van een spectrogram.
Wat is een spectrogram?
Een spectrogram is een driedimensionale grafiek die wordt gebruikt als weergave van geluid. Het spectrogram toont de verandering in frequenties over een periode en houdt ook rekening met de amplitude of het volume. De onderstaande foto is een voorbeeld van een spectrogramlezing.
In een interview uit 2003 met Wetenschappelijke Amerikaan, Avery Wang onthulde dat het Shazam-algoritme spectrogram-punten gebruikt die tonen met de hoogste energie vertegenwoordigen om audio-vingerafdrukken te genereren.
Door de meeste informatie in een nummer te negeren en alleen te focussen op de weinige bepalende noten, kan Shazam de database doorzoeken en met een ongelooflijke snelheid nauwkeurige overeenkomsten voor songquery's leveren.
Hoe kan Shazam liedjes op lawaaierige plaatsen herkennen?
Shazam gebruikt songopnames zonder achtergrondruis en vervorming om vingerafdrukken voor zijn database te maken. Wanneer je een nummer opneemt met de app op een lawaaierige plek, wordt er een audio-vingerafdruk van je opname gemaakt door de noten met de hoogste energie op de opname te identificeren.
Het zoekt vervolgens in de database naar een match voor de audiovingerafdrukken van uw opname, op voorwaarde dat het achtergrondruisniveau was niet hoog genoeg om de gegevens die werden gebruikt om de audio te creëren, te vervormen vingerafdruk.
Tijden waarop Shazam je niet kan helpen bij het identificeren van een nummer
Shazam is geweldig in het matchen van nummers, zelfs in obscure muziek waarvan je denkt dat die niet in de database staat. Maar zijn er momenten waarop Shazam een nummer niet kan identificeren?
Vervormde opname
Wanneer u een nummer shazamt op een plaats waar het achtergrondruisniveau te hoog is, vervormt de ruis de gegevens op het spectrogram. Daarom zal de audio-vingerafdruk van uw opname anders zijn dan die van het originele nummer.
Als dat gebeurt, geeft Shazam het Nummer niet bekend dialoog omdat het geen match kan vinden voor de audio-vingerafdruk.
Live muziek
Shazam schiet tekort in zijn vermogen om muziek te onderscheiden van live optredens. Dit komt doordat de audio die je opneemt tijdens live optredens vaak verschilt van de originele versie van het nummer dat Shazam gebruikt om audio-vingerafdrukken te maken.
De enige manier waarop Shazam een nummer kan identificeren tijdens een live optreden, is als de band bekwaam genoeg is om het nummer precies uit te voeren zoals het is opgenomen. Veel succes met de band die dat probeert te doen...
Uw spraakopname
"Kan ik Shazam zover krijgen dat hij een lied herkent dat ik aan het zingen was als ik echt een goede zanger was?"
Kortom, nee.
Het Shazam-algoritme kan alleen vooraf opgenomen muziek identificeren. Om Shazam een nummer te laten identificeren dat je aan het zingen bent, moet je dezelfde vocalen hebben met de instrumentalen in het exacte tempo met de originele opname van het nummer.
Je neuriën
Shazam kan geen overeenkomsten voor brommen identificeren, omdat het algoritme exacte frequenties en amplitudes gebruikt om audiovingerafdrukken te maken voor de nummers in de database.
Als je een nummer neuriet, maakt Shazam er een vingerafdruk voor. Maar omdat een brom slechts een poging is om een nummer opnieuw te synthetiseren, komt het algoritme niet overeen met de opname.
Is Shazam de enige app voor muziekidentificatie?
Shazam was de eerste muziekidentificatiedienst en is momenteel de meest gebruikte app voor nummeridentificatie. Er zijn echter andere apps die u kunt gebruiken om een nummer te identificeren om je heen spelen. Sommigen kunnen zelfs een nummer identificeren dat u zingt of neuriet.
Drie van de meest populaire Shazam-alternatieven zijn SoundHound, Musixmatch Lyrics en Genius. Musixmatch en Genius helpen je voornamelijk bij het identificeren van songteksten voor muziek die om je heen wordt afgespeeld, terwijl SoundHound de grootste concurrent van Shazam is.
Verwant: De beste muziekherkenningsapps om nummers op hun melodie te vinden
Je kunt de SoundHound-app gebruiken om vrijwel alles te doen wat Shazam doet. Het grote voordeel ten opzichte van Shazam is dat het de toegevoegde functionaliteit heeft om liedjes te identificeren die je zingt of neuriet.
Afbeelding tegoed: Sulastri Sulastri / Shutterstock.com
Vraagt u zich af hoe u een nummer uit een YouTube-video kunt herkennen? Hier is een YouTube-nummerzoeker-walkthrough om muziek uit video's te identificeren.
Lees Volgende
- Technologie verklaard
- Shazam
- Muziek ontdekken
- SoundHound
- Musixmatch
John is van nature een liefhebber van technologie, een maker van digitale inhoud door training en een Tech Lifestyle Writer van Profession. John gelooft in het helpen van mensen bij het oplossen van problemen en hij schrijft artikelen die precies dat doen.
Abonneer op onze nieuwsbrief
Word lid van onze nieuwsbrief voor technische tips, recensies, gratis e-boeken en exclusieve deals!
Nog een stap…!
Bevestig uw e-mailadres in de e-mail die we u zojuist hebben gestuurd.