Advertentie

Onlangs werkte ik aan een verhaal over een persoon die een telefoontje pleegde en dat werd opgenomen. Die persoon weigerde later toe te geven dat ze ooit hadden gebeld.

Met de opgenomen stem van het telefoongesprek en een clip van de persoon die de beschuldiging ontkende, ging ik aan de slag om een ​​manier te vinden om te bewijzen dat de stemmen dezelfde waren.

Ik geef toe dat ik een beetje geobsedeerd ben door spraaktechnologieën. Dit is waarom ik heb gewacht Google Voice Hoe Google Voice te gebruiken om via de telefoon te bloggen Lees verder om geavanceerder te worden met zijn spraakherkenningstechnologie, en daarom hou ik van pc-spraakbesturingsapps zoals Tazti Schakel spraak-naar-tekst en stembesturing in door spraakherkenning in Windows in te stellenSpraakherkenning blijft krachtiger dan Cortana. Het stuurt spraak naar tekst en spraakbesturing. Dit artikel laat zien wat spraakherkenning kan doen, hoe u het kunt instellen, trainen en gebruiken. Lees verder . Maar als het gaat om het digitaal vergelijken van stemmen, had ik geen idee. Je hebt waarschijnlijk die spionagefilms gezien waarbij de computer automatisch de stem van een bekende crimineel kan identificeren met alleen de stemafdruk.

Om eerlijk te zijn, toen ik Sonogram Visible Speech ontdekte, realiseerde ik me dat spectrogram-stemtechnologie eigenlijk is momenteel een haalbare manier om een ​​persoon stevig te identificeren met alleen zijn stem.

Spectrogram begrijpen

Als u op de hoogte bent van chemische isotopen, dan weet u dat chemici met isotopen de chemische samenstelling ervan kunnen identificeren verbindingen door de basiselementen te isoleren en de uitsplitsing te gebruiken om de afzonderlijke componenten van eender welke te identificeren mengsel. Op dezelfde manier splitst een audiospectrogram het audiogeluid op in basisfrequenties. Het interessante van de menselijke stem is dat niemand in één frequentie spreekt. Je mond, neusholtes en de structuur van je stembox bepalen de mix van frequenties waaruit je ietwat unieke stem bestaat.

Sonogram Visible Speech is een gratis spectrogramsoftwaretoepassing die video- of audiobestanden opneemt en afbreekt de audiotrack door het hele spectrum - alle frequenties gedurende het hele tijdsbestek van de spoor. Een voltooid spectrogram lijkt op de onderstaande afbeelding.

correcte spectrogramprogramma's

Zoals je kunt zien, lijkt het onderste nummer op de basisgeluidsgolf die je zou zien in een programma zoals Audacity 3 Audacity-tips om uw opgenomen interviews te verbeterenHeldere audio is essentieel voor elke podcast of opname die je wilt publiceren. Verhoog uw audiokwaliteit met Audacity in drie eenvoudige stappen. Lees verder het middelste deelvenster geeft echter elk segment van het geluidsbestand weer in zijn volledige frequentie-indeling. Het verbazingwekkende van deze software is dat er veel andere golfvormen zijn die u kunt gebruiken om uw geluidsbestand te onderzoeken. Deze zijn speciaal voor gevorderde gebruikers.

correcte spectrogramprogramma's

U kunt configureren hoe elk van deze golfvormen wordt weergegeven door naar het menu "Opties" te gaan en "Algemeen" te selecteren Aanpassing." Hier kunt u definiëren hoe de logaritmische grafieken de output berekenen en de algemene weergave-instellingen van alle beschikbare grafieken.

digitaal geluidsspectrogram

Als het geluid redelijk zacht is of als de stem die je analyseert een fluistering is, kun je overwegen om de logaritmische frequentieweergave te gebruiken. U schakelt het in via het menu "Opties" en selecteert "Logaritmische frequentie". Dit zal de significante frequentiegebieden in het spectrogram enigszins "vergroten".

digitaal geluidsspectrogram

Dit kan echt helpen om duidelijke frequentiepatronen te identificeren die iemand herkennen aan het geluid van hun stem. Als je helemaal verdwaald bent en je weet niet waar je moet beginnen, zal het klikken op "Help" en naar "Online Help" de zeer goed geschreven Sonogram Online Help-handleiding openen. Dit is een geweldige plek om te beginnen als u nog niet bekend bent met spectrogram audio-analyse.

digitaal geluidsspectrogram

Een experiment met spectrogrammen met Ghost Hunting

Het mooie van deze software is dat het goed is voor veel verschillende toepassingen. Een van de artefacten die vaak naar voren komt in de spookjacht, een persoonlijk belang van mij, is "Elektronisch stemfenomeen" - waar de stem van een verschijning of geest naar verluidt op audio verschijnt opnames. Deze opnames zijn verspreid over het web, dus besloot ik er een paar van de spookjager-websites te halen en een spectrogramanalyse te doen.

Sonogram zichtbare stem - Krachtige spraakspectrogramsoftware sono6

Het spectrogram laat zien dat de frequenties van de stem over het algemeen laag zijn, maar om een ​​beter beeld te krijgen van de stemmen in de opname, moet je de extra golfvormen openen. De Autocorrelation View berekent de "toonhoogte" in het tijdsbestek waarin u met de muis zweeft.

Sonogram zichtbare stem - Krachtige spraakspectrogramsoftware sono7

De "geest" heeft een gemiddelde toonfrequentie van ongeveer 129,0 Hz. Scrol naar het einde van de opname waar je de stem van de onderzoeker hoort, de berekende toonhoogte frequentie is ongeveer 208.0 hz (wat logisch is omdat het een vrouwenstem is en de spookopname klinkt mannetje.)

Sonogram zichtbare stem - Krachtige spraakspectrogramsoftware sono8

Het openen van het Fast Fourier-display onthult nog meer details over de stemmen. Deze grafiek splitst snel de primaire frequenties op en geeft ze weer in een kleurcode.

Sonogram zichtbare stem - Krachtige spraakspectrogramsoftware sono9

In dit geval is de uitsplitsing van frequenties uit elkaar gespreid, met enkele hoge, maar ook een groot aantal lage frequenties in de mix. De onderzoeker in de kamer spreekt echter duidelijk met een stem die in frequentie is geclusterd naar het hogere deel van het bereik, zoals hier wordt getoond.

Sonogram zichtbare stem - Krachtige spraakspectrogramsoftware sono10

Deze snelle analyse bewees dat de twee stemmen heel verschillend zijn, maar dit is slechts een basisvoorbeeld van de mogelijkheden van deze krachtige software. Kortom, elke situatie waarbij een uitsplitsing van de frequenties van een geluidsgolf kan helpen - dit is de software voor jou. Het is gemakkelijk te leren, snel in te stellen en te configureren en het presteert even goed of beter dan welke betaalde spectrogramsoftware dan ook op de markt.

Heeft u projecten die een spectrogram zouden kunnen gebruiken? Heb je ooit Sonogram Visible Speech geprobeerd? Deel uw inzicht in de opmerkingen hieronder.

Ryan heeft een BSc-graad in elektrotechniek. Hij heeft 13 jaar in automatiseringstechniek gewerkt, 5 jaar in IT en is nu een Apps Engineer. Hij was een voormalig hoofdredacteur van MakeUseOf, hij sprak op nationale conferenties over datavisualisatie en was te zien op nationale tv en radio.