6 Panda's-operaties voor beginners

Pandas is een open-source Python-bibliotheek die voornamelijk wordt gebruikt voor gegevensmanipulatie en -analyse. Het is gebouwd bovenop de NumPy-bibliotheek en biedt krachtige, gebruiksvriendelijke datastructuren en data-analysetools voor de programmeertaal Python.

In dit artikel leert u hoe u 6 basisbewerkingen uitvoert met Panda's.

Voorbeelden van panda's gebruiken

U kunt de voorbeelden in dit artikel uitvoeren met behulp van computationele notebooks zoals Jupyter-notitieboekje, Google Colab, enzovoort. U kunt de voorbeelden ook uitvoeren door de code rechtstreeks in de Python-interpreter in interactieve modus in te voeren.

Als je de volledige broncode wilt zien die in dit artikel wordt gebruikt, kun je hier toegang krijgen tot het Python Notebook-bestand GitHub-opslagplaats.

1. Panda's importeren als pd en het versienummer afdrukken

U moet de gebruiken importeren trefwoord om elke bibliotheek in Python te importeren. Panda's worden meestal geïmporteerd onder de pd alias. Met deze benadering kunt u het Pandas-pakket noemen als: pd in plaats van panda's.

instagram viewer

panda's importeren als pd
afdrukken (pd.__versie__)

Uitgang:

1.2.4

2. Hoe maak je een serie in Panda's

Pandas Series is een eendimensionale array die gegevens van elk type bevat. Het is als een kolom in een tabel. U kunt een reeks maken met behulp van numpy-arrays, numpy-functies, lijsten, woordenboeken, scalaire waarden, enz.

De waarden van de reeks zijn gelabeld met hun indexnummer. Standaard heeft de eerste waarde index 0, de tweede waarde index 1, enzovoort. Om uw eigen labels een naam te geven, moet u de inhoudsopgave argument.

Een lege serie maken

s = pd. Serie (dtype='float64')
s

Uitgang:

Serie([], dtype: float64)

In het bovenstaande voorbeeld is een lege reeks met de vlot gegevenstype wordt gemaakt.

Een serie maken met NumPy Array

panda's importeren als pd
importeer numpy als np
d = np.array([1, 2, 3, 4, 5])
s = pd. Serie (d)
s

Uitgang:

0 1
1 2
2 3
3 4
4 5
dtype: int32

Verwant: NumPy-bewerkingen voor beginners

Een serie maken met behulp van een lijst

d = [1, 2, 3, 4, 5]
s = pd. Serie (d)
s

Uitgang:

0 1
1 2
2 3
3 4
4 5
dtype: int64

Een serie maken met index

Om een serie met een index te maken, moet je de inhoudsopgave argument. Het aantal indexen moet gelijk zijn aan het aantal elementen in de reeks.

d = [1, 2, 3, 4, 5]
s = pd. Reeks (d, index=["één", "twee", "drie", "vier", "vijf"])
s

Uitgang:

een 1
twee 2
drie 3
vier 4
vijf 5
dtype: int64

Een serie maken met behulp van een woordenboek

De sleutels van het woordenboek worden de labels van de serie.

d = {"een": 1,
"twee": 2,
"drie": 3,
"vier": 4,
"vijf": 5}
s = pd. Serie (d)
s

Uitgang:

een 1
twee 2
drie 3
vier 4
vijf 5
dtype: int64

Een serie maken met behulp van scalaire waarde

Als u een reeks wilt maken met behulp van een scalaire waarde, moet u de inhoudsopgave argument.

s = pd. Reeks (1, index = ["a", "b", "c", "d"])
s

Uitgang:

een 1
b 1
c 1
d 1
dtype: int64

3. Een dataframe maken in Panda's

Een DataFrame is een tweedimensionale gegevensstructuur waarin gegevens worden uitgelijnd in de vorm van rijen en kolommen. Een DataFrame kan worden gemaakt met behulp van woordenboeken, lijsten, een lijst met woordenboeken, numpy-arrays, enz. In de echte wereld worden DataFrames gemaakt met behulp van bestaande opslag zoals CSV-bestanden, Excel-bestanden, SQL-databases, enz.

Het DataFrame-object ondersteunt een aantal attributen en methoden. Als u meer over hen wilt weten, kunt u de officiële documentatie van panda's dataframe.

Een leeg dataframe maken

df = pd. DataFrame()
afdrukken (df)

Uitgang:

Leeg gegevensframe
Kolommen: []
Inhoudsopgave: []

Een dataframe maken met behulp van lijst

listObj = ["MUO", "technologie", "vereenvoudigd"]
df = pd. DataFrame (listObj)
afdrukken (df)

Uitgang:

 0
0 MUO
1 technologie
2 vereenvoudigd

Een dataframe maken met behulp van Dictionary of ndarray/Lists

batmanData = {'Filmnaam': ['Batman Begins', 'The Dark Knight', 'The Dark Knight Rises'],
'Jaar van uitgave': [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
afdrukken (df)

Uitgang:

 Filmnaam Jaar van uitgave
0 Batman begint 2005
1 De donkere ridder 2008
2 The Dark Knight Rises 2012

Een dataframe maken met behulp van een lijst met lijsten

gegevens = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (gegevens, kolommen = ['Naam', 'Rolnr.'])
afdrukken (df)

Uitgang:

 Naam Rolnr.
0 Alex 601
1 Bob 602
2 Cataline 603

Een dataframe maken met behulp van een lijst met woordenboeken

data = [{'Naam': 'Alex', 'Rolnummer': 601},
{'Naam': 'Bob', 'Rolnummer': 602},
{'Naam': 'Cataline', 'Rolnr.': 603}]
df = pd. DataFrame (gegevens)
afdrukken (df)

Uitgang:

 Naam Rolnr.
0 Alex 601
1 Bob 602
2 Cataline 603

Verwant: Een lijst converteren naar een woordenboek in Python

Een dataframe maken met de functie zip()

Gebruik de zip() functie om lijsten in Python samen te voegen.

Naam = ['Alex', 'Bob', 'Cataline']
Rolnr = [601, 602, 603]
listOfTuples = lijst (zip (Naam, RollNo))
df = pd. DataFrame (listOfTuples, kolommen = ['Name', 'Roll No.'])
afdrukken (df)

Uitgang:

 Naam Rolnr.
0 Alex 601
1 Bob 602
2 Cataline 603

4. CSV-gegevens lezen in Panda's

Een bestand met door komma's gescheiden waarden (CSV) is een tekstbestand met scheidingstekens dat een komma gebruikt om waarden te scheiden. U kunt een CSV-bestand lezen met de lees_csv() methode bij panda's. Als u het volledige DataFrame wilt afdrukken, gebruikt u de to_string() methode.

In dit en de volgende voorbeelden is dit CSV-bestand zal worden gebruikt om de bewerkingen uit te voeren.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.to_string())

Uitgang:

5. Gegevensframes analyseren met behulp van de methoden head(), tail() en info()

Gegevens bekijken met behulp van de head()-methode

De hoofd() methode is een van de beste manieren om snel een overzicht van het DataFrame te krijgen. Deze methode retourneert de koptekst en het opgegeven aantal rijen, te beginnen vanaf de bovenkant.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.kop (10))

Uitgang:

Als u het aantal rijen niet opgeeft, worden de eerste 5 rijen geretourneerd.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
afdrukken (df.head())

Uitgang:

Gegevens bekijken met de tail()-methode

De staart() methode retourneert de kop en het opgegeven aantal rijen, beginnend vanaf de onderkant.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.staart (10))

Uitgang:

Als u het aantal rijen niet opgeeft, worden de laatste 5 rijen geretourneerd.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
afdrukken (df.tail())

Uitgang:

Informatie over de gegevens krijgen

De informatie() methoden retourneren een korte samenvatting van een DataFrame inclusief de index dtype en kolom dtypes, niet-null-waarden en geheugengebruik.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
afdrukken (df.info())

Uitgang:

6. Hoe JSON-gegevens in Panda's te lezen

JSON (JavaScript Object Notation) is een lichtgewicht formaat voor gegevensuitwisseling. U kunt een JSON-bestand lezen met de read_json() methode bij panda's. Als u het volledige DataFrame wilt afdrukken, gebruikt u de to_string() methode.

In het onderstaande voorbeeld is dit JSON-bestand wordt gebruikt om de bewerkingen uit te voeren.

Verwant: Wat is JSON? Het overzicht van een leek

df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
print (df.to_string())

Uitgang:

Vernieuw uw Python-kennis met ingebouwde functies en methoden

Functies helpen uw code in te korten en de efficiëntie te verbeteren. Functies en methoden zoals verminderen(), splitsen(), opsommen(), eval(), ronde(), enzovoort. kan uw code robuust en gemakkelijk te begrijpen maken. Het is altijd goed om te weten over ingebouwde functies en methoden, omdat deze uw programmeertaken aanzienlijk kunnen vereenvoudigen.

DeelTweetenE-mail

20 Python-functies die u moet kennen

De Python Standard Library bevat veel functies om u te helpen bij uw programmeertaken. Leer meer over de meest bruikbare en maak robuustere code.

Lees volgende

Gerelateerde onderwerpen

Programmeren
Python
Webontwikkeling
Programmeren
Gegevensanalyse

Over de auteur

Yuvraj Chandra (69 artikelen gepubliceerd)

Yuvraj is een student Computerwetenschappen aan de Universiteit van Delhi, India. Hij is gepassioneerd door Full Stack Web Development. Als hij niet aan het schrijven is, onderzoekt hij de diepte van verschillende technologieën.

Meer van Yuvraj Chandra

Abonneer op onze nieuwsbrief

Word lid van onze nieuwsbrief voor technische tips, recensies, gratis e-boeken en exclusieve deals!

Klik hier om je te abonneren

About Technology - denizatm.com

6 Panda's-operaties voor beginners

Voorbeelden van panda's gebruiken

1. Panda's importeren als pd en het versienummer afdrukken

2. Hoe maak je een serie in Panda's

Een lege serie maken

Een serie maken met NumPy Array

Een serie maken met behulp van een lijst

Een serie maken met index

Een serie maken met behulp van een woordenboek

Een serie maken met behulp van scalaire waarde

3. Een dataframe maken in Panda's

Een leeg dataframe maken

Een dataframe maken met behulp van lijst

Een dataframe maken met behulp van Dictionary of ndarray/Lists

Een dataframe maken met behulp van een lijst met lijsten

Een dataframe maken met behulp van een lijst met woordenboeken

Een dataframe maken met de functie zip()

4. CSV-gegevens lezen in Panda's

5. Gegevensframes analyseren met behulp van de methoden head(), tail() en info()

Gegevens bekijken met behulp van de head()-methode

Gegevens bekijken met de tail()-methode

Informatie over de gegevens krijgen

6. Hoe JSON-gegevens in Panda's te lezen

Vernieuw uw Python-kennis met ingebouwde functies en methoden

Abonneer op onze nieuwsbrief

Categorieën

Recent Post

Moet een metalen pc-behuizing worden geaard?

Kan ik dit bestand veilig van mijn Windows XP-pc verwijderen?

Waarom kan mijn Samsung Wave 525 niet upgraden?