Artikel in volgende knop: 899988

Jupyter Notebook is dé tool voor datawetenschappers. Het biedt een interactieve webinterface die kan worden gebruikt voor datavisualisatie, eenvoudige analyse en samenwerking.

Met gegevensvisualisatie kunt u context voor uw gegevens vinden door middel van kaarten of grafieken. Deze tutorial biedt een inzichtelijke gids voor interactie met grafieken in Jupyter Notebook.

Vereisten

Jij moet hebben Jupyter geïnstalleerd op uw machine. Als dit niet het geval is, kunt u het installeren door de volgende code in uw opdrachtregel in te voeren:

 $ pip jupyter installeren

Je hebt ook het panda's en matplotlib bibliotheek:

$ pip panda's installeren
$ pip installeer matplotlib

Start de Jupyter Notebook-server nadat de installaties zijn voltooid. Typ de onderstaande opdracht in uw terminal om dit te doen. Een Jupyter-pagina met bestanden in de huidige map wordt geopend in de standaardbrowser van uw computer.

$ jupyter notebook

Opmerking: Sluit het terminalvenster waarin u deze opdracht uitvoert niet. Uw server stopt als u dat doet.

Eenvoudig perceel

Voer deze code uit in een nieuwe Jupyter-pagina:

importeer matplotlib.pyplot als plt
x = [1,2,3,4,5,6,7,8]
y = [2,4,6,8,10,12,14,16]
plt. plot (x, y)
plt.show ()

De code is voor een eenvoudige lijnplot. De eerste regel importeert het pyplot grafische bibliotheek uit de matplotlib API. De derde en vierde regel definiëren respectievelijk de x- en y-assen.

De verhaal() methode wordt aangeroepen om de grafiek te plotten. De tonen() methode wordt vervolgens gebruikt om de grafiek weer te geven.

Stel dat u in plaats daarvan een curve wilt tekenen. Het proces is hetzelfde. Verander gewoon de waarden van de python-lijst voor de y-as.

importeer matplotlib.pyplot als plt
x = [3,4,5,6,7,8,9,10,11,12]
y = [9,16,25,36,49,64,81,100,121,144]
plt. plot (x, y)
plt.show ()

Let op iets belangrijks: in beide grafieken is er geen expliciete schaaldefinitie. De schaal wordt automatisch berekend en toegepast. Dit is een van de vele interessante functies die Juypter biedt, waarmee u zich kunt concentreren op uw werk (gegevensanalyse) in plaats van u zorgen te maken over code.

Als u ook waakzaam bent, ziet u misschien dat het aantal waarden voor de x- en y-as hetzelfde is. Als een van hen kleiner is dan de andere, wordt er een fout gemarkeerd wanneer u de code uitvoert en wordt er geen grafiek weergegeven.

Beschikbare types

In tegenstelling tot de lijngrafiek en curve hierboven, moeten andere grafische visualisaties (bijv. Een histogram, staafdiagram, enz.) Expliciet worden gedefinieerd om te worden weergegeven.

Staafdiagram

Om een ​​staafdiagram weer te geven, moet u de bar() methode.

importeer matplotlib.pyplot als plt
x = [3,4,5,6,7,8,9,10,11,12]
y = [9,16,25,36,49,64,81,100,121,144]
plt. balk (x, y)
plt.show ()

Verspreidingsdiagram

Het enige dat u hoeft te doen, is het verstrooien() methode in de vorige code.

importeer matplotlib.pyplot als plt
x = [3,4,5,6,7,8,9,10,11,12]
y = [9,16,25,36,49,64,81,100,121,144]
plt. verstrooiing (x, y)
plt.show ()

Cirkeldiagram

Een taartplot is een beetje anders dan de rest hierboven. Lijn 4 is van bijzonder belang, dus bekijk de functies daar eens.

vijgenmaat wordt gebruikt om de aspectverhouding in te stellen. U kunt dit instellen op wat u maar wilt (bijv. (9,5)), maar de officiële Pandas-documenten adviseren dat u een aspectverhouding van 1 gebruikt.

importeer matplotlib.pyplot als plt
x = [4,9,16,25,36]
fig = plt.figure (figsize = (9, 5)) # regel 4
plt.pie (x)
plt.show ()

Er zijn enkele parameters die het cirkeldiagram heeft die opmerkelijk zijn:

etiketten - Dit kan worden gebruikt om een ​​label te geven aan elk segment in het cirkeldiagram.

kleuren - Dit kan worden gebruikt om voorgedefinieerde kleuren aan elk van de plakjes te geven. U kunt kleuren zowel in tekstvorm (bijvoorbeeld "geel") of in hex-vorm (bijvoorbeeld "# ebc713") specificeren.

Zie onderstaand voorbeeld:

importeer matplotlib.pyplot als plt
x = [4,9,16,25,36]
fig = plt.figure (figsize = (5.5, 5.5))
plt.pie (x, labels = ("Guaves", "Berries", "Mangoes", "Apples", "Avocado"),
colours = ("# a86544", "# eb5b13", "# ebc713", "# bdeb13", "# 8aeb13"))
plt.show ()

Er zijn ook andere percelen zoals hist, Oppervlakte en kde dat je kan lees meer over op Pandas-documenten.

Plotopmaak

In de bovenstaande plots zijn er geen aspecten zoals labels. Hier is hoe dat te doen.

Om een ​​titel toe te voegen, neemt u de onderstaande code op in uw Jupyter Notebook:

matplotlib.pyplot.title ("Mijn grafiektitel")

De x- en y-assen kunnen respectievelijk worden gelabeld zoals hieronder:

matplotlib.pyplot.xlabel ("mijn x-as-label")
matplotlib.pyplot.ylabel ("mijn y-as-label")

Meer leren

U kunt het helpen() commando in uw notitieblok voor interactieve hulp bij Jupyter-commando's. Om meer informatie over een bepaald object te krijgen, kunt u gebruik maken van helpen (object).

U zult het ook een goede gewoonte vinden om grafieken te tekenen met behulp van datasets uit csvfiles. Leren hoe u gegevens kunt visualiseren, is een krachtig hulpmiddel om uw bevindingen te communiceren en te analyseren, dus het is de moeite waard om wat tijd te nemen om uw vaardigheden op te bouwen.

E-mail
Excel-gegevens importeren in Python-scripts met panda's

Voor geavanceerde gegevensanalyse is Python beter dan Excel. Hier leest u hoe u uw Excel-gegevens kunt importeren in een Python-script met Panda's!

Lees Volgende

Gerelateerde onderwerpen
  • Programmeren
  • Python
  • Zelfstudies over codering
  • Gegevensanalyse
Over de auteur
Jerome Davidson (5 Artikelen gepubliceerd)

Jerome is een stafschrijver bij MakeUseOf. Hij behandelt artikelen over programmeren en Linux. Hij is ook een cryptoliefhebber en houdt de crypto-industrie altijd in de gaten.

Meer van Jerome Davidson

Abonneer op onze nieuwsbrief

Word lid van onze nieuwsbrief voor technische tips, recensies, gratis e-boeken en exclusieve deals!

Nog een stap…!

Bevestig uw e-mailadres in de e-mail die we u zojuist hebben gestuurd.

.