We kennen het allemaal wel eens: u typt de naam van een website in de adresbalk van uw favoriete browser, of misschien klikt u op het resultaat van een Google-zoekopdracht. Dan verschijnt er plotseling een reeks schijnbaar willekeurige woorden en symbolen aan het einde van de site-URL. Je hebt natuurlijk geen idee waarom het daar is, maar je bent blij dat je veilig Amazon-vermeldingen, Google-zoekresultaten of welke website dan ook kunt bekijken.
Voor het ongetrainde oog kan het eruitzien als gebrabbel, maar elk teken in een URL heeft een doel. Laten we de anatomie van een website-URL opsplitsen, van protocol tot queryreeks.
De 5 belangrijkste componenten van een URL
Een URL kan in drie hoofddelen worden verdeeld: het protocol, de domeinnaam en het pad. U kunt dan een querytekenreeks overstag gaan of fantasie krijgen met een ankertag.
1. Protocol
Het eerste onderdeel van een URL is het protocol. Het is de methode die wordt gebruikt om toegang te krijgen tot een bron op internet. Het meest gebruikelijke protocol voor surfen op het web is HTTP (Hypertext Transfer Protocol). Het stuurt een verzoek van de browser van de gebruiker naar de server die de website host, en de server stuurt vervolgens de gevraagde bron terug als antwoord.
HTTP heeft een beveiligde versie genaamd HTTPS (HTTP Secure), die codering gebruikt om een extra beveiligingslaag toe te voegen. HTTPS wordt gebruikt wanneer gevoelige gegevens, zoals wachtwoorden of creditcardgegevens, via internet worden verzonden. Je website heeft een SSL-certificaat nodig om het HTTPS-protocol in zijn URL's te gebruiken.
2. Domeinnaam
De domeinnaam is de unieke identificatie van een website op internet. Het bestaat uit twee delen: het topleveldomein (TLD) en het domein op het tweede niveau. Het TLD geeft de websitecategorie aan, zoals .com voor commerciële websites, .edu voor onderwijsinstellingen en .org voor non-profitorganisaties. Het domein op het tweede niveau is de unieke naam die door de website-eigenaar is gekozen.
In de domeinnaam www.makeuseof.com is 'makeuseof' bijvoorbeeld het domein op het tweede niveau en '.com' het TLD. Domeinnamen worden geregistreerd bij domeinregistreerders en kunnen voor een bepaalde periode worden gekocht, meestal een jaar, maar soms ook langer.
3. Pad
Het URL-pad specificeert de locatie van een bron op een website. Het komt meestal achter de domeinnaam en begint met een schuine streep (/). Het pad wordt gebruikt om inhoud op een website te organiseren en het voor gebruikers gemakkelijk te maken om te navigeren.
In de URL www.example.com/blog/post1 is 'blog' bijvoorbeeld de directory die de blogberichten bevat en is 'post1' het specifieke blogbericht. Het pad kan ook worden gebruikt voor zoekmachineoptimalisatie (SEO) door relevante zoekwoorden op te nemen.
4. Zoekreeks
De queryreeks maakt deel uit van de URL die begint met een vraagteken (?) en bevat sleutel-waardeparen gescheiden door een ampersand (&). Het wordt gebruikt om gegevens tussen webpagina's door te geven en kan informatie bevatten zoals zoektermen of gebruikersvoorkeuren.
Bijvoorbeeld in de URL www.example.com/search? q=example&category=books, bevat de zoekreeks twee sleutel-waardeparen: "q=example" geeft aan dat de zoekterm "example" is en "category=books" geeft aan dat er naar boeken wordt gezocht. Wanneer u door websites bladert waarop u uw zoekresultaten kunt filteren, of websites die trackinggegevens willen vastleggen, ziet u gewoonlijk zoekreeksen met een stapel zoekparameters.
5. Ankertag
Een ankertag is een fragment-ID die na de URL komt en begint met een hekje (#). Het linkt naar een specifiek deel van een webpagina en kan worden gebruikt om een inhoudsopgave te maken of om naar een bepaald deel van een lang artikel te linken.
In een gids van 5000 woorden kan de auteur bijvoorbeeld een navigatiemenu opnemen om de inhoud op te splitsen:
- Definities
- Geschiedenis
- Uitdagingen in de branche
- Veelgestelde vragen
Als u de muisaanwijzer op een van die links plaatst, kan de URL een ankertag bevatten, zoals "#definitions", die de browser aangeeft om omlaag te scrollen naar het gedeelte met die ID in de HTML.
Wat is URL-codering?
URL's bevatten tekens uit de ASCII-tekenset, een subset van de Unicode-tekenset. Unicode is een internationale coderingsstandaard voor tekens in verschillende talen en alfabetten. Wanneer een teken buiten de ASCII-tekenset wordt gebruikt in een URL, moet het worden gecodeerd om ervoor te zorgen dat de browser het goed begrijpt.
URL-codering is het proces waarbij tekens buiten de ASCII-tekenset worden omgezet in hun ASCII-equivalent. Het Unicode-teken 'é' zou bijvoorbeeld worden gecodeerd als '%e9'. URL-codering wordt ook gebruikt voor speciale tekens zoals spaties, die zijn gecodeerd als '+' of '%20'.
Maak je geen zorgen over het onthouden van elke mogelijke coderingscombinatie. De W3Schools URL-coderingsreferentie gids is een handige bron voor dit onderwerp.
Wat zijn URL-omleidingen?
Soms, wanneer u een URL invoert in de adresbalk van uw browser, wordt de webpagina omgeleid naar een andere webpagina. Dit komt omdat er verschillende manieren zijn waarop URL's kunnen worden gestructureerd, en sommige werken mogelijk niet zoals verwacht. Wanneer dit gebeurt, reageert de server met een HTTP-statuscode die aangeeft dat deze moet omleiden naar een andere URL (meestal 301 of 302). De nieuwe locatie kan vervolgens worden opgegeven in de antwoordkop.
De statuscodes en hun betekenis omvatten:
- 200 - Oké: Het verzoek is gelukt.
- 301 is permanent verhuist: De aangevraagde resource is permanent verplaatst naar een nieuwe locatie en zou daar in toekomstige verzoeken moeten worden opgehaald.
- 302 - Gevonden (tijdelijke omleiding): Dit geeft aan dat de pagina zich tijdelijk op een andere URL bevindt en niet mag worden gecached door zoekmachines of gebruikt als een gezaghebbende bron van informatie over de inhoud ervan. Het kan ook duiden op serveronderhoud, waar pagina's worden omgeleid terwijl updates worden uitgevoerd of wanneer bestemmingspagina's alternatieve URL's moeten weergeven voor trackingdoeleinden, zoals A/B-testen of splitsen testen.
De bovenstaande statuscodes zijn specifiek voor de geldigheid van de URL zelf en u zult waarschijnlijk niet eens weten dat ze bestaan als u terloops een functionele website bekijkt.
Wanneer er zich echter problemen voordoen met de URL, de website of de onderliggende webhosting, ziet u een andere reeks codes:
- 403 verboden: Dit geeft aan dat u niet bevoegd bent om de webpagina te bekijken. Dit kan te wijten zijn aan onjuiste machtigingen of een gebrek aan authenticatiereferenties.
- 404 Niet Gevonden: Dit geeft aan dat de gevraagde bron niet bestaat op de server en moet worden verwijderd uit alle bladwijzers of pagina's met zoekresultaten van zoekmachines (SERP's).
- 500+ - Serverfouten: Deze geven aan dat er een fout is opgetreden tijdens het verwerken van uw verzoek en wordt meestal veroorzaakt door een probleem met de serverconfiguratie, zoals coderingsfouten in scripts, databaseproblemen, enz.
Websitefouten kunnen vervelend zijn, maar zijn niet het einde van de wereld. Probeer eerst een geforceerde vernieuwing van de webpagina. Controleer vervolgens uw adresbalk op door mensen gemaakte fouten. Heb je een letter toegevoegd? Spelt het merk een van de woorden onconventioneel? Is je kat over het toetsenbord gelopen? Als geen van bovenstaande werkt en het jouw website is, neem dan contact op met je host. Als de website van iemand anders is, moet je helaas even wachten.
Inzicht in URL's van protocollen tot paden
Een URL bestaat uit vele componenten die elk een doel dienen. Door de anatomie van een URL te begrijpen, kunt u gemakkelijker door websites navigeren en de beschikbare functies optimaal benutten. Of u nu informatie zoekt of online winkelt, het begrijpen van URL's kan u helpen het meeste uit internet te halen.