Leer hoe u een groot bestand kunt splitsen in meerdere kleinere bestanden met behulp van de opdracht splitsen op Linux.
Linux biedt een breed scala aan commando's voor tekstmanipulatie en -verwerking, inclusief het splitscommando. Met splitsen kunt u eenvoudig grote bestanden splitsen in kleinere of specifieke delen van een bestand extraheren op basis van bepaalde criteria.
Laten we eens kijken hoe we de opdracht splitsen kunnen gebruiken om bestanden in Linux te splitsen. Of u nu specifieke delen van een groot bestand moet extraheren of een bestand in kleinere stukken moet splitsen, met de opdracht splitsen kunt u uw doelen gemakkelijk bereiken.
Wat is het gesplitste commando?
De opdracht split is een populaire Linux-opdrachtregeltool gemaakt door Torbjorn Granlund en Richard M. Stallman. Zoals de naam al aangeeft, wordt het splitscommando gebruikt om een bestand op te splitsen in kleinere subbestanden.
Deze opdracht is handig voor het beheren van grote bestanden of bij het overdragen van bestanden via netwerken met beperkte bandbreedte. Door een groot bestand op te splitsen in kleinere delen, kunt u de hoeveelheid gegevens verminderen die op een bepaald moment moet worden overgedragen of opgeslagen. U kunt de opdracht splitsen ook omkeren om meerdere bestanden tot één bestand te combineren.
De gesplitste opdrachtsyntaxis
De basissyntaxis van het splitscommando is:
splitsen [OPTIE]... [BESTAND] [VOORBEELD]
- [KEUZE]: De opdracht splitsen heeft verschillende opties om te beslissen hoe u het bestand wilt splitsen en andere specifieke functies die u mogelijk wilt toevoegen.
- [BESTAND]: Dit is het pad naar het bestand dat u wilt splitsen.
- [VOORVOEGSEL]: Dit verwijst naar het voorvoegsel van de subbestanden.
Hoe het splitscommando te gebruiken
U kunt de opdracht splitsen gebruiken om een groot bestand op grootte of lengte in kleinere bestanden te verdelen. U kunt zelfs het specifieke aantal kleinere bestanden kiezen dat u wilt.
Voor demonstratie gebruiken we een tekstbestand met de naam grootbestand.txt. Kies een tekstbestand met meerdere regels en een redelijk groot formaat voor deze tutorial. Als je dat niet hebt, kun je gebruiken een Linux-teksteditor of de cat-opdracht om een grote tekst in te plakken en op te slaan.
Splits grote bestanden op basis van het aantal regels
U kunt de opdracht splitsen gebruiken om een groot bestand op te splitsen in kleinere bestanden op basis van een bepaald aantal regels per bestand. Dit is de syntaxis:
split -l [aantal regels] [invoerbestand] [voorvoegsel uitvoerbestand]
U wilt bijvoorbeeld een bestand met 210 regels splitsen in bestanden van elk 50 regels; je zou vijf kleinere bestanden krijgen. De eerste vier bestanden zouden elk 50 regels bevatten en het vijfde bestand zou slechts 10 regels bevatten.
Voer deze opdracht uit om een bestand met de naam "largefile.txt" op te splitsen in kleinere bestanden van elk 100 regels:
split -l 100 grootbestand.txt kleinbestand
Maak een lijst van de inhoud van de map met behulp van het ls-commando, en je zou de gesplitste bestanden zien.
Splits grote bestanden op basis van grootte
U kunt ook de opdracht splitsen gebruiken om een groot bestand op te splitsen in kleinere bestanden op basis van een specifieke bestandsgrootte. Dit is de basissyntaxis:
split -b [grootte in bytes] [invoerbestand] [voorvoegsel uitvoerbestand]
Splits largefile.txt in kleinere bestanden van elk 300 bytes door deze opdracht uit te voeren:
split -b 300 grootbestand.txt kleinbestand
Dit is het resultaat:
Splits een groot bestand op in een specifiek aantal bestanden
U kunt een bestand ook splitsen in een vast aantal bestanden, ongeacht het aantal bestanden en bytes erin. Dit doe je aan de hand van de -N keuze. Hier is de syntaxis:
split -n [aantal bestanden] [invoerbestand] [voorvoegsel uitvoerbestand]
Voer deze opdracht uit om een groot bestand in vijf delen te splitsen:
split -n 5 grootbestand.txt kleinbestand
Het resultaat zou er zo uit moeten zien:
Wijzig de lengte van het achtervoegsel van de gesplitste bestanden
Zoals je misschien hebt gemerkt, is de standaardlengte van de achtervoegsels die aan de naam van het uitvoerbestand zijn gekoppeld, twee. Bijvoorbeeld klein bestandaa, klein bestandab, klein bestandac, enz.
Om de lengte van het achtervoegsel te wijzigen, gebruikt u de -A keuze. Dit is de syntaxis voor het wijzigen van de lengte van het achtervoegsel:
split -a [lengte achtervoegsel] [invoerbestand] [voorvoegsel uitvoerbestand]
U kunt deze optie voor de lengte van het achtervoegsel naast andere splitsopdrachten gebruiken. Voer deze opdracht uit om het bestand largefile.txt in 10 delen met een achtervoegsellengte van 4 te splitsen:
split -a 4 -n 10 grootbestand.txt kleinbestand
Wanneer u de inhoud van de map opsomt, zou de uitvoer er als volgt uit moeten zien:
Meerdere bestanden samenvoegen met cat
Het goede nieuws is dat je gesplitste bestanden altijd weer kunt samenvoegen om het originele bestand te produceren. Om gesplitste bestanden weer samen te voegen in het originele bestand, gebruik het kat-commando. Hier is de syntaxis om dat te doen:
cat [bestanden splitsen] > [uitvoerbestand]
Wanneer u de opdracht cat gebruikt om gesplitste bestanden samen te voegen, is het belangrijk om de juiste volgorde van de gesplitste bestanden op te geven.
De opdracht cat voegt de bestanden eenvoudig in de opgegeven volgorde samen, dus als de bestanden niet in de juiste volgorde staan, wordt het samengevoegde bestand beschadigd.
In een scenario waarin u veel gesplitste bestanden heeft, bijvoorbeeld honderd gesplitste bestanden, zou het omslachtig zijn om elk bestand achter elkaar en in de juiste volgorde in te typen.
Dit is waar het voorvoegsel om de hoek komt kijken. Door gewoon een sterretje (*) toe te voegen, kunt u alle bestanden samenvoegen die beginnen met dat voorvoegsel.
cat-voorvoegsel* > [uitvoerbestand]
Hier is een voorbeeldopdracht die gesplitste bestanden samenvoegt kleinbestand, kleinbestandab, kleinbestandac, En kleinbestand in een enkel bestand genaamd groot bestand.txt:
kat klein bestand* > groot bestand.txt
Deze opdracht voegt de inhoud samen van alle gesplitste bestanden die overeenkomen met het patroon klein bestand* en stuur de uitvoer om naar een nieuw bestand met de naam bigfile.txt. Het zal ook de gesplitste bestanden in natuurlijke volgorde weergeven op basis van hun naam, wat de juiste volgorde voor samenvoegen zou moeten zijn.
De opdracht splitsen is slechts een van de vele tools die Linux biedt om u te helpen grote bestanden efficiënt te beheren door ze op te splitsen in kleinere, beter beheersbare brokken.
Door Linux-tekstverwerkingsopdrachten onder de knie te krijgen, kunt u tijd en middelen besparen en efficiënter worden.