Pandas is een open-source Python-bibliotheek die voornamelijk wordt gebruikt voor gegevensmanipulatie en -analyse. Het is gebouwd bovenop de NumPy-bibliotheek en biedt krachtige, gebruiksvriendelijke datastructuren en data-analysetools voor de programmeertaal Python.
In dit artikel leert u hoe u 6 basisbewerkingen uitvoert met Panda's.
Voorbeelden van panda's gebruiken
U kunt de voorbeelden in dit artikel uitvoeren met behulp van computationele notebooks zoals Jupyter-notitieboekje, Google Colab, enzovoort. U kunt de voorbeelden ook uitvoeren door de code rechtstreeks in de Python-interpreter in interactieve modus in te voeren.
Als je de volledige broncode wilt zien die in dit artikel wordt gebruikt, kun je hier toegang krijgen tot het Python Notebook-bestand GitHub-opslagplaats.
1. Panda's importeren als pd en het versienummer afdrukken
U moet de gebruiken importeren trefwoord om elke bibliotheek in Python te importeren. Panda's worden meestal geïmporteerd onder de pd alias. Met deze benadering kunt u het Pandas-pakket noemen als: pd in plaats van panda's.
panda's importeren als pd
afdrukken (pd.__versie__)
Uitgang:
1.2.4
2. Hoe maak je een serie in Panda's
Pandas Series is een eendimensionale array die gegevens van elk type bevat. Het is als een kolom in een tabel. U kunt een reeks maken met behulp van numpy-arrays, numpy-functies, lijsten, woordenboeken, scalaire waarden, enz.
De waarden van de reeks zijn gelabeld met hun indexnummer. Standaard heeft de eerste waarde index 0, de tweede waarde index 1, enzovoort. Om uw eigen labels een naam te geven, moet u de inhoudsopgave argument.
Een lege serie maken
s = pd. Serie (dtype='float64')
s
Uitgang:
Serie([], dtype: float64)
In het bovenstaande voorbeeld is een lege reeks met de vlot gegevenstype wordt gemaakt.
Een serie maken met NumPy Array
panda's importeren als pd
importeer numpy als np
d = np.array([1, 2, 3, 4, 5])
s = pd. Serie (d)
s
Uitgang:
0 1
1 2
2 3
3 4
4 5
dtype: int32
Verwant: NumPy-bewerkingen voor beginners
Een serie maken met behulp van een lijst
d = [1, 2, 3, 4, 5]
s = pd. Serie (d)
s
Uitgang:
0 1
1 2
2 3
3 4
4 5
dtype: int64
Een serie maken met index
Om een serie met een index te maken, moet je de inhoudsopgave argument. Het aantal indexen moet gelijk zijn aan het aantal elementen in de reeks.
d = [1, 2, 3, 4, 5]
s = pd. Reeks (d, index=["één", "twee", "drie", "vier", "vijf"])
s
Uitgang:
een 1
twee 2
drie 3
vier 4
vijf 5
dtype: int64
Een serie maken met behulp van een woordenboek
De sleutels van het woordenboek worden de labels van de serie.
d = {"een": 1,
"twee": 2,
"drie": 3,
"vier": 4,
"vijf": 5}
s = pd. Serie (d)
s
Uitgang:
een 1
twee 2
drie 3
vier 4
vijf 5
dtype: int64
Een serie maken met behulp van scalaire waarde
Als u een reeks wilt maken met behulp van een scalaire waarde, moet u de inhoudsopgave argument.
s = pd. Reeks (1, index = ["a", "b", "c", "d"])
s
Uitgang:
een 1
b 1
c 1
d 1
dtype: int64
3. Een dataframe maken in Panda's
Een DataFrame is een tweedimensionale gegevensstructuur waarin gegevens worden uitgelijnd in de vorm van rijen en kolommen. Een DataFrame kan worden gemaakt met behulp van woordenboeken, lijsten, een lijst met woordenboeken, numpy-arrays, enz. In de echte wereld worden DataFrames gemaakt met behulp van bestaande opslag zoals CSV-bestanden, Excel-bestanden, SQL-databases, enz.
Het DataFrame-object ondersteunt een aantal attributen en methoden. Als u meer over hen wilt weten, kunt u de officiële documentatie van panda's dataframe.
Een leeg dataframe maken
df = pd. DataFrame()
afdrukken (df)
Uitgang:
Leeg gegevensframe
Kolommen: []
Inhoudsopgave: []
Een dataframe maken met behulp van lijst
listObj = ["MUO", "technologie", "vereenvoudigd"]
df = pd. DataFrame (listObj)
afdrukken (df)
Uitgang:
0
0 MUO
1 technologie
2 vereenvoudigd
Een dataframe maken met behulp van Dictionary of ndarray/Lists
batmanData = {'Filmnaam': ['Batman Begins', 'The Dark Knight', 'The Dark Knight Rises'],
'Jaar van uitgave': [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
afdrukken (df)
Uitgang:
Filmnaam Jaar van uitgave
0 Batman begint 2005
1 De donkere ridder 2008
2 The Dark Knight Rises 2012
Een dataframe maken met behulp van een lijst met lijsten
gegevens = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (gegevens, kolommen = ['Naam', 'Rolnr.'])
afdrukken (df)
Uitgang:
Naam Rolnr.
0 Alex 601
1 Bob 602
2 Cataline 603
Een dataframe maken met behulp van een lijst met woordenboeken
data = [{'Naam': 'Alex', 'Rolnummer': 601},
{'Naam': 'Bob', 'Rolnummer': 602},
{'Naam': 'Cataline', 'Rolnr.': 603}]
df = pd. DataFrame (gegevens)
afdrukken (df)
Uitgang:
Naam Rolnr.
0 Alex 601
1 Bob 602
2 Cataline 603
Verwant: Een lijst converteren naar een woordenboek in Python
Een dataframe maken met de functie zip()
Gebruik de zip() functie om lijsten in Python samen te voegen.
Naam = ['Alex', 'Bob', 'Cataline']
Rolnr = [601, 602, 603]
listOfTuples = lijst (zip (Naam, RollNo))
df = pd. DataFrame (listOfTuples, kolommen = ['Name', 'Roll No.'])
afdrukken (df)
Uitgang:
Naam Rolnr.
0 Alex 601
1 Bob 602
2 Cataline 603
4. CSV-gegevens lezen in Panda's
Een bestand met door komma's gescheiden waarden (CSV) is een tekstbestand met scheidingstekens dat een komma gebruikt om waarden te scheiden. U kunt een CSV-bestand lezen met de lees_csv() methode bij panda's. Als u het volledige DataFrame wilt afdrukken, gebruikt u de to_string() methode.
In dit en de volgende voorbeelden is dit CSV-bestand zal worden gebruikt om de bewerkingen uit te voeren.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.to_string())
Uitgang:
5. Gegevensframes analyseren met behulp van de methoden head(), tail() en info()
Gegevens bekijken met behulp van de head()-methode
De hoofd() methode is een van de beste manieren om snel een overzicht van het DataFrame te krijgen. Deze methode retourneert de koptekst en het opgegeven aantal rijen, te beginnen vanaf de bovenkant.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.kop (10))
Uitgang:
Als u het aantal rijen niet opgeeft, worden de eerste 5 rijen geretourneerd.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
afdrukken (df.head())
Uitgang:
Gegevens bekijken met de tail()-methode
De staart() methode retourneert de kop en het opgegeven aantal rijen, beginnend vanaf de onderkant.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.staart (10))
Uitgang:
Als u het aantal rijen niet opgeeft, worden de laatste 5 rijen geretourneerd.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
afdrukken (df.tail())
Uitgang:
Informatie over de gegevens krijgen
De informatie() methoden retourneren een korte samenvatting van een DataFrame inclusief de index dtype en kolom dtypes, niet-null-waarden en geheugengebruik.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
afdrukken (df.info())
Uitgang:
6. Hoe JSON-gegevens in Panda's te lezen
JSON (JavaScript Object Notation) is een lichtgewicht formaat voor gegevensuitwisseling. U kunt een JSON-bestand lezen met de read_json() methode bij panda's. Als u het volledige DataFrame wilt afdrukken, gebruikt u de to_string() methode.
In het onderstaande voorbeeld is dit JSON-bestand wordt gebruikt om de bewerkingen uit te voeren.
Verwant: Wat is JSON? Het overzicht van een leek
df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
print (df.to_string())
Uitgang:
Vernieuw uw Python-kennis met ingebouwde functies en methoden
Functies helpen uw code in te korten en de efficiëntie te verbeteren. Functies en methoden zoals verminderen(), splitsen(), opsommen(), eval(), ronde(), enzovoort. kan uw code robuust en gemakkelijk te begrijpen maken. Het is altijd goed om te weten over ingebouwde functies en methoden, omdat deze uw programmeertaken aanzienlijk kunnen vereenvoudigen.
De Python Standard Library bevat veel functies om u te helpen bij uw programmeertaken. Leer meer over de meest bruikbare en maak robuustere code.
Lees volgende
- Programmeren
- Python
- Webontwikkeling
- Programmeren
- Gegevensanalyse

Yuvraj is een student Computerwetenschappen aan de Universiteit van Delhi, India. Hij is gepassioneerd door Full Stack Web Development. Als hij niet aan het schrijven is, onderzoekt hij de diepte van verschillende technologieën.
Abonneer op onze nieuwsbrief
Word lid van onze nieuwsbrief voor technische tips, recensies, gratis e-boeken en exclusieve deals!
Klik hier om je te abonneren