Advertentie
De het dossier is een van de fundamentele onderdelen van de computerervaring. Maar wat is eigenlijk een "bestand"? Het is een pictogram op uw bureaublad, een vermelding in een lijst die uw budget opent als een spreadsheet en een naam die u aan uw laatste selfie kunt geven. Aan het eind van de dag is een "bestand" een verzameling bits (nullen en enen) gerangschikt in een patroon dat sommige toepassingen begrijpen.
Ontwikkelaars kunnen deze patronen geheim houden, waardoor gebruikers een bepaald programma kunnen behouden ondanks alternatieven De complete Microsoft Office-gids voor bestandsconversieAls je ooit een tekstbestand, zoals PDF naar Word, hebt geconverteerd, ben je bekend met de uitdaging. Soms is het net zo eenvoudig als printen, soms heb je speciaal gereedschap nodig. Voer deze convertergids in. Lees verder . Andere ontwikkelaars kunnen de acceptatie van hun formaten zelfs aanmoedigen. In sommige gevallen kunt u het formaat gemakkelijk openen en interpreteren, of het kan onmogelijk zijn om het buiten de oorspronkelijke toepassing te gebruiken. We zullen voorbeelden van al het bovenstaande in dit artikel onderzoeken.
Tekstgebaseerd vs. Binaire bestandsindelingen
Het eerste belangrijke aspect van verschillende bestandstypen is of het binair of op tekst gebaseerd is. Laten we elk van deze een voor een bekijken.
Op tekst gebaseerde indelingen
Het tekstbestand is het meest elementaire bestandsformaat dat er is. Het kan door zowat elk systeem met een processor worden gelezen. Dit formaat is een reeks bits (enen en nullen) die voldoet aan de ASCII-standaard (we zien Unicode voor het moment), wat betekent dat een computer elke byte (8 bits) kan interpreteren als een teken uit de volgend op:
- A-Z (inclusief hoofdletters en kleine letters)
- 0-9
- spatie teken
- Een selectie van symbolen (bijv. interpunctie)
- Controletekens (bijv. "DEL")
Aangezien de gegevens als tekst worden opgeslagen, kunt u de inhoud van een bestand bekijken door het te openen in a tekstverwerker, zelfs eenvoudige zoals Windows Kladblok 2 Minimalistische teksteditors waar u waarschijnlijk nog nooit van heeft gehoord [Windows]Afgezien van het feit dat ze bij voorkeur gebaseerd zijn op snelle laadtijden, hebben sommige applicaties gewoon niet al te veel resource-intensieve functies nodig. Minimalistische applicaties zijn klein en schoon, en zolang ze de klus klaren, kun je... Lees verder (of equivalenten voor) Mac De beste HTML-teksteditors voor uw MacEen nieuwe teksteditor voor je Mac nodig? We kijken naar de beste gratis en betaalde HTML-teksteditors voor macOS. Lees verder , Linux Geavanceerde Linux-teksteditors vergeleken: kate vs geditElke Linux-gebruiker zal je vertellen dat een goede teksteditor een essentieel onderdeel is van een computersysteem, of je nu een nieuwe gebruiker of een ervaren professional bent. Tijdens het gebruik van een Terminal-tekst... Lees verder , iOS Schrijf-app: een prachtige iOS-teksteditor met ondersteuning voor markdown en tientallen actiesSchrijf-apps voor de iPad en iPhone zijn er in overvloed. We hebben het geluk te leven in een tijd waarin ontwikkelaars nieuwe manieren bedenken om tekst te bewerken met behulp van unieke functies in nieuwe apps. Dit... Lees verder , en Android 7 afleidingsvrije teksteditors voor Android vergeleken: wat is het beste?Krijg wat echt werk gedaan op je Android-apparaat door een van deze geweldige teksteditors te gebruiken. Lees verder ). Aangezien bijna alle computerplatforms worden geleverd met een eenvoudige teksteditor, kunt u wat (tekst)informatie in een van deze bestanden plaatsen en erop vertrouwen dat u er altijd toegang toe zult hebben. Andere applicaties hoeven verder niets te weten om de gegevens in ieder geval goed te kunnen lezen.
Het wordt echter ingewikkelder wanneer u iets als het tekstlettertype of een automatisch ingevulde datum op het voorblad moet weergeven. In deze gevallen dragen ASCII-tekens bij aan a op tekst gebaseerd formaat zoals afwaardering Wat is afwaarderen? 4 redenen waarom je het nu zou moeten lerenBen je de HTML- en WYSIWYG-editors beu? Dan is Markdown het antwoord voor jou, wie je ook bent. Lees verder of XML. Hoewel dit de voordelen biedt van platte tekst zoals transparantie, hebben deze bestanden vaak meer ruimte nodig voor elementen zoals tags. Beschouw het volgende bestand van één zin in platte tekst en vervolgens in de "Flat ODT" (FODT) -indeling van Open Document Format, die XML gebruikt. De onderstaande afbeelding laat zien dat de platte tekstversie 53 bytes is, terwijl de ODT-versie is 25.000 bytes.
Binaire formaten
In tegenstelling tot, binaire formaten Wat is binair? [Technologie uitgelegd]Aangezien binair zo absoluut fundamenteel is voor het bestaan van computers, lijkt het vreemd dat we het onderwerp nog nooit eerder hebben aangepakt - dus vandaag dacht ik dat ik een kort overzicht zou geven van wat binair ... Lees verder zijn bestanden die een toepassing het beetje bij beetje zal construeren. Je kunt proberen deze bestanden te openen met een teksteditor, maar hij weet waarschijnlijk niet hoe hij ze moet interpreteren. Hieronder ziet u het resultaat van het openen van een Microsoft Excel-bestand met een teksteditor.
De applicatie moet de gegevens in een binair bestand op een specifieke manier verwerken. Bij het openen van een XLS-bestand moet een toepassing de eerste zestien bytes van het bestand behandelen als de "begin van het bestand" (BOF)-markering. Binnen die markering is het vijfde item een enkel bit dat aangeeft of het bestand voor het laatst is bewerkt op het Windows-platform (“fWin”). Het komt na vier andere items, elk twee bytes, wat betekent dat het "fWin" -item het 65e bit in het Excel-bestand is.
Zoals we zagen, als je het probeert te openen met een applicatie die de 65e bit niet als de "fWin" -vlag verwerkt, zal die applicatie het niet correct openen. Het kan veel onleesbare tekens op het scherm weergeven (hierboven weergegeven), het netjes afhandelen met een foutmelding (ook hierboven weergegeven, omdat Linux) of crasht. In ieder geval zal het niet weten hoe het de gegevens correct moet lezen, en zal het dus ook niet correct weergeven. Maar toepassingen kunnen, eenmaal geprogrammeerd, zoveel bestandsformaten aan als gewenst.
Openen versus Gepatenteerde formaten
De volgende overweging is of een bestandsformaat open is (d.w.z. beschikbaar is voor eenvoudig gebruik door anderen) of propriëtair is. Merk op dat "eigendom" niet hetzelfde is als gesloten, althans niet in alle gevallen. Terwijl de "tekst vs. binair” debat hierboven was een technisch debat, “open vs. propriëtair” heeft meer te maken met de licentievoorwaarden van een bestandsformaat. Meer hierover in de volgende paragrafen.
Open formaten
Open formaten zijn formaten waarbij de licentie gebruikers toestaat ze voor hun eigen toepassingen te gebruiken. Een of andere normorganisatie zou ook toezicht moeten houden op hun voortdurende ontwikkeling door een gemeenschap van bijdragers voor de formaten om wees echt "open". Open formaten zijn ook vrij van licentiekosten en beperkingen - ze kunnen door iedereen en voor elk doel worden gebruikt. Misschien wel het meest bekende open formaat is het Open Document Formaat (ODF) 9 zeldzame Office-bestandsindelingen die u moet kennenBen je ooit vreemde bestandsindelingen tegengekomen in je kantoorsuite? We geven u een korte introductie over zeldzame, maar nuttige Office-bestandstypen en waarvoor u ze kunt gebruiken. Lees verder , voor het eerst uitgebracht in 2005 door OASE. Het doel was om een alternatief te bieden voor het slot dat Microsoft had op de productiviteitsmarkt.
Met open formaten hoeft u nooit bang te zijn dat uw informatie in een bepaald bestand is opgesloten. Overweeg het volgende, dat ons Flat ODT-formaatbestand laat zien. Hoewel er veel externe informatie omheen zit, kun je de werkelijke gegevens daar zien, helder als de dag.
Een ander voordeel van open formaten is hun grondige documentatie. Het is één ding dat een bestand gemakkelijk leesbaar is. Een programmeur zal nog steeds (met vallen en opstaan) moeten uitzoeken wat elke functie precies doet. Maar in het geval van ODF, de versie 1.2 specificatie geeft een programmeur alles wat hij moet weten om de ondersteuning ervoor efficiënt te implementeren.
Gepatenteerde formaten
Ten slotte worden eigen formaten beschermd door hun ontwikkelaars. Het kan zijn omdat ze handelsgeheimen bevatten, voor (gepercipieerde) veiligheid, of gewoon omdat de ontwikkelaar zijn werk niet wil delen. Wat de reden ook is, deze formaten zijn eigendom op grond van: Licentieovereenkomsten voor eindgebruikers (EULA's) of andere termen die de gebruiker verbieden om te proberen het bestandsformaat te reverse-engineeren of anderszins te "kraken".
Eens slechts ‘verboden’, Digitale millenniumwet op auteursrecht Wat is de Wet op het auteursrecht op digitale media? Lees verder (DCMA) heeft dingen veranderd. Ontwikkelaars hebben nu de juridische steun om achter degenen aan te gaan die hun werk reverse-engineeren. U moet aan de toekomst denken voordat u investeert in een toepassing die een eigen formaat gebruikt. Moet u die informatie in de toekomst ergens anders naartoe migreren? Zo ja, hoe pijnlijk zal het zijn? Zal het bedrijf over een jaar of vijf nog bestaan? U moet overwegen of de functies van een app de moeite waard zijn als dit ook betekent dat u opgesloten bent in die ontwikkelaar vanwege eigen indelingen.
Voorbeelden van bestandsindelingen
Als je naar het bovenstaande kijkt, zullen een aantal combinaties je opvallen. Het is waar dat op tekst gebaseerde bestandsindelingen lenen zich om open te zijn. Evenzo, als het doel van een formaat is om propriëtair te zijn, is het gemakkelijker om het zo te houden door het binair te maken. Maar dit is niet altijd het geval.
Het XCF-beeldformaat van de GIMP is een open formaat dat ook binair is. Het project omvat een gedetailleerde beschrijving van hoe het formaat de afbeeldingen, tekst en lagen bevat waaruit een GIMP-bestand bestaat als onbewerkte bits en bytes (hieronder weergegeven). Ontwikkelaars kunnen dit gebruiken om hun eigen implementatie te coderen, zodat externe applicaties zoals de AfbeeldingMagick Eenvoudig afbeeldingen bijsnijden en vergroten/verkleinen in LinuxAls je wat basis bijsnijden en vergroten/verkleinen wilt doen op Linux - misschien om te helpen met een project of om een afbeelding gemakkelijker te kunnen uploaden naar je favoriete sociale netwerken - probeer dan deze... Lees verder toolkit kan ze importeren.
Omgekeerd is het nieuwste Microsoft Visio-formaat (VSDX) een op XML gebaseerd (en dus op tekst gebaseerd) formaat. Het publiceert een gedetailleerde referentie van de samenstelling van deze bestanden. In het referentiedocument wordt echter opgemerkt dat Microsoft "patenten heeft die mogelijk uw implementatie dekken" van .VSDX-ondersteuning. tevens de Bibliotheek van het Congres stelt het gebruik van de VSDX-specificatie "garandeert geen royaltyvrije licentie van alle relevante patenten" als u deze gebruikt. Dit is een andere manier om te zeggen dat je de dobbelstenen kunt gooien en deze ondersteuning kunt opnemen. Maar Microsoft kan wel of niet willen dat u er later voor betaalt, afhankelijk van hoe nauw het concurreert met Visio.
Als je denkt dat die ingewikkeld zijn, wat dacht je van het niet-platte ODT-formaat. Het is een ZIP-bestand (binair en open, tenzij je ook de codering ervan gebruikt) die de tekst van een document bevat (inhoud.xml, open op tekst gebaseerde indeling) en afbeeldingen (bijv. PNG, binair maar open).
Hoe belangrijk zijn bestandsindelingen eigenlijk?
Dit is een moeilijke vraag. Aan de ene kant hebben sommige besturingssystemen, zoals iOS, geprobeerd te voorkomen dat gebruikers überhaupt met bestanden omgaan. Je hebt de app die het bestand heeft gemaakt om het te openen, wie geeft er om de structuur of wat de extensie is? Toch hebben veel organisaties (vooral regeringen) erop aangedrongen om ervoor te zorgen dat openbare gegevens in een open formaat zijn.
Als je een software-idealist bent (niet dat daar iets mis mee is), zorg er dan tijdens het evalueren van nieuwe apps voor dat ze in een open (bij voorkeur) op tekst gebaseerd formaat zijn. Als u gewoon aan de slag wilt, dan zijn propriëtaire formaten misschien geen probleem voor u.
Wat denk je? Eist u dat uw informatie in open, op tekst gebaseerde formaten staat die u kunt converteren en verifiëren? Of zijn de formaten die de ontwikkelaars gebruiken, propriëtair of niet, genoeg voor u? Laat het ons hieronder weten in de comments!
Afbeeldingscredits: Edilus/Shutterstock
Aaron zit al vijftien jaar diep in de technologie als bedrijfsanalist en projectmanager, en is bijna net zo lang een trouwe Ubuntu-gebruiker (sinds de Breezy Badger). Zijn interesses omvatten open source, toepassingen voor kleine bedrijven, integratie van Linux en Android en computergebruik in platte tekst.