ASCII is een acroniem dat je misschien hebt gehoord met betrekking tot computertekst, maar het is een term die snel buiten gebruik raakt dankzij een krachtigere nieuwkomer. Maar wat is ASCII en waarvoor wordt het gebruikt?
Waar staat ASCII voor?
Misschien is de gemakkelijkste plaats om te beginnen het acroniem zelf, dus laten we het uitbreiden:
EENmerican Standard Code voor iknformatie ikverandering
Deze mondvol van een zin geeft niet echt het volledige beeld, maar sommige delen bieden onmiddellijk enkele aanwijzingen, met name de eerste twee woorden. ASCII is een Amerikaanse norm, waarvan de betekenis binnenkort duidelijk zal worden.
"Code voor informatie-uitwisseling" suggereert dat we het hebben over een indeling voor het heen en weer sturen van gegevens. In het bijzonder behandelt ASCII tekstuele gegevens: tekens die woorden vormen in een typisch voor mensen leesbare taal.
ASCII lost het probleem op van het toewijzen van waarden aan letters en andere tekens, zodat wanneer ze dat zijn opgeslagen als enen en nullen in een bestand, kunnen ze weer in letters worden vertaald wanneer het bestand wordt gelezen later. Als verschillende computersystemen overeenkomen om dezelfde code te gebruiken, kan dergelijke informatie betrouwbaar worden uitgewisseld.
Verwant: Symbolen zoeken en hun betekenis opzoeken
Hulp nodig bij het identificeren van een symbool? Hier leest u hoe u elk symbool per afbeelding kunt vinden, hoe u in symboolbibliotheken kunt zoeken en meer.
De geschiedenis van ASCII
ASCII, ook wel US-ASCII genoemd, was een Amerikaanse innovatie die in de jaren zestig werd ontwikkeld. De standaard heeft veel herzieningen ondergaan sinds, voornamelijk in 1977 en 1986, toen ASCII voor het laatst werd bijgewerkt.
Uitbreidingen en variaties zijn in de loop der jaren voortgebouwd op ASCII, voornamelijk om rekening te houden met het feit dat ASCII veel tekens weglaat die worden gebruikt of zelfs vereist door andere talen dan het Amerikaans-Engels. ASCII voorziet niet eens in het Britse valutasymbool ("£"), hoewel het pond wel aanwezig is in Latin-1, een 8-bits extensie ontwikkeld in de jaren tachtig, die ook verschillende andere valuta codeert.
ASCII werd enorm uitgebreid en opgevolgd door Unicode, een veel uitgebreidere en ambitieuzere standaard, die hieronder wordt besproken. In 2008 haalde Unicode ASCII in populariteit in voor online gebruik.
Welke tekens vertegenwoordigt ASCII?
Voor een computer is de letter 'A' net zo onbekend als de kleur paars of het gevoel van jaloezie. Computers werken in enen en nullen, en het is aan mensen om te beslissen hoe ze die enen en nullen gebruiken om getallen, woorden, afbeeldingen en al het andere weer te geven.
Je kunt ASCII zien als de morsecode van de digitale wereld - hoe dan ook de eerste poging. Terwijl morsecode wordt gebruikt om slechts 36 verschillende karakters weer te geven (26 letters en 10 cijfers), is ASCII ontworpen om tot 128 verschillende karakters in 7 bits gegevens weer te geven.
ASCII is hoofdlettergevoelig, wat betekent dat het 52 hoofdletters en kleine letters uit het Engelse alfabet vertegenwoordigt. Naast dezelfde 10 cijfers is dat ongeveer de helft van de gebruikte ruimte.
Interpunctie, wiskundige en typografische symbolen nemen de rest in beslag, en een verzameling controletekens, die speciale niet-afdrukbare codes zijn met functionele betekenissen - zie hieronder voor meer informatie.
Hier zijn enkele typische tekens die ASCII codeert:
Binair | Decimale | Karakter |
---|---|---|
010 0001 | 33 | ! |
011 0000 | 48 | 0 |
011 1001 | 57 | 9 |
011 1011 | 59 | ; |
100 0001 | 65 | EEN |
100 0010 | 66 | B |
101 1010 | 90 | Z |
101 1011 | 91 | [ |
110 0001 | 97 | een |
110 0010 | 98 | b |
111 1101 | 125 | } |
Merk op dat de gekozen waarden enkele nuttige eigenschappen hebben, in het bijzonder:
- Letters van hetzelfde hoofdlettergebruik kunnen altijd numeriek worden gesorteerd, aangezien ze in volgorde zijn. A heeft bijvoorbeeld een lagere waarde dan B, die een lagere waarde heeft dan Z.
- Letters van verschillende gevallen worden gecompenseerd door precies 32. Dit maakt het heel gemakkelijk om te vertalen tussen kleine letters en hoofdletters, aangezien voor elke letter in beide gevallen slechts een enkele bit hoeft te worden gewisseld.
Controle karakters
Anders dan letters, interpunctie en cijfers, kan ASCII een aantal controletekens vertegenwoordigen, speciale codepunten die dat wel doen produceer geen uitvoer van één teken, maar geef in plaats daarvan alternatieve betekenissen over de gegevens voor alles wat ze zou kunnen gebruiken.
ASCII 000 1001 is bijvoorbeeld het horizontale tab-teken. Het vertegenwoordigt de ruimte die u krijgt als u op de TAB-toets drukt. Dergelijke tekens zul je doorgaans niet rechtstreeks zien, maar hun effect zal vaak worden getoond. Hier zijn nog enkele voorbeelden:
Binair | Decimale | Karakter |
---|---|---|
000 1001 | 9 | Horizontaal tabblad |
000 1010 | 10 | Lijntoevoer |
001 0111 | 23 | Einde van transmissieblok |
Hoe zit het met andere personages?
ASCII was enorm succesvol tijdens de vroege dagen van computergebruik, omdat het eenvoudig was en op grote schaal werd toegepast. In een wereld met een meer internationale blik is één schrijfsysteem echter niet voldoende. Moderne communicatie moet mogelijk zijn in het Frans, Japans - in feite elke taal waarin we tekst willen opslaan.
De Unicode-tekenset kan in totaal 1.112.064 verschillende tekens adresseren, hoewel slechts ongeveer een tiende daarvan momenteel is gedefinieerd. Dat klinkt misschien als veel, maar de codering is niet alleen bedoeld voor tienduizenden Chinezen karakters, het omvat ook emoji (bijna anderhalf duizend) en zelfs uitgestorven schrijfsystemen zoals Jurchen.
Verwant: De 100 meest populaire emoji's uitgelegd
Unicode erkende de dominantie van ASCII bij de keuze van de eerste 128 tekens: ze zijn precies hetzelfde als ASCII. Hierdoor kunnen ASCII-gecodeerde bestanden worden gebruikt in situaties waarin Unicode wordt verwacht, wat achterwaartse compatibiliteit biedt.
Overzicht
ASCII-tekst vertegenwoordigt de 26 letters van het Engelse alfabet, met cijfers, interpunctie en een paar andere symbolen erin gegooid. Het heeft zijn doel zeer goed gediend gedurende het beste deel van een halve eeuw,
Het is nu vervangen door Unicode, dat een groot aantal talen en andere symbolen ondersteunt, waaronder emoji. UTF-8 is, voor alle praktische doeleinden, de codering die moet worden gebruikt om Unicode-tekens online weer te geven.
Hier leest u hoe u gratis, met korting of via alternatieve software toegang krijgt tot veelgebruikte illegale apps.
- Technologie verklaard
- Jargon
- Webcultuur
- Unicode
Bobby is een technologieliefhebber die het grootste deel van twee decennia als softwareontwikkelaar heeft gewerkt. Hij is gepassioneerd door gamen, werkt als recensie-editor bij Switch Player Magazine en is ondergedompeld in alle aspecten van online publiceren en webontwikkeling.
Abonneer op onze nieuwsbrief
Word lid van onze nieuwsbrief voor technische tips, recensies, gratis e-boeken en exclusieve deals!
Nog een stap…!
Bevestig uw e-mailadres in de e-mail die we u zojuist hebben gestuurd.