Weet je nog de dagen dat je een fysieke wereldbol gebruikte of door een groot, zwaar boek bladerde om de naam van verschillende regio's en landen te vinden? Met de vooruitgang in technologie, met name internet, is al deze informatie nu beschikbaar met één klik op de knop.

Maar wat als u een stap verder wilt gaan en essentiële gegevens over een land wilt vinden, zoals de hoofdstad, geografische coördinaten of valuta? Zoek niet verder dan de verbazingwekkende Country Info-module van Python, die het werk binnen enkele seconden kan doen.

Wat is de CountryInfo-module?

Porimol Chandro ontwikkelde de Land Info moduul. Het heeft functies om de hoofdstad van een land, geografische coördinaten, tijdzone, gebied, bevolking en meer op te halen.

Om deze module te installeren, opent u uw terminal en voert u uit:

Pip installeren landeninfo

Je kan ook haal de live weergegevens op van elk land of elke regio en gebruik het samen met de informatie en verbeter uw dataset.

Hoe de functies van de module te gebruiken

instagram viewer

U kunt informatie ophalen met behulp van de verschillende functies van de Landinfo moduul als volgt.

1. Alternatieve namen of spellingen van een land verkrijgen

U kunt de alternatieve namen of spellingen van een land als volgt ophalen:

van landeninfo importeren Landinfo
naam = 'Indië'
country = CountryInfo (naam)
data1 = land.alt_spelling()
afdrukken(gegevens1)

Begin met het importeren van de Landinfo klas uit de landeninfo moduul. U kunt vervolgens een instantie van CountryInfo maken door er een string aan door te geven die de naam van een land bevat.

U kunt verschillende API-methoden aanroepen op het CountryInfo-object dat u hebt gemaakt. Bijvoorbeeld, alt_spelling() geeft een lijst met alternatieve namen van het land terug.

Het Python-fragment voor het ophalen van de alternatieve namen van een land produceert de volgende uitvoer:

2. De hoofdstad en de geografische coördinaten verkrijgen

Je kunt gebruiken hoofdstad() om de hoofdstad van een land te krijgen. Het retourneert een string die de naam van de hoofdstad vertegenwoordigt:

data2 = land.hoofdstad()
afdrukken(gegevens2)

Dit Python-fragment produceert de volgende uitvoer:

Gebruik de API-methode captial_latlng() om de geografische coördinaten van de hoofdstad van een land op te halen. Deze methode retourneert een lijst met twee elementen, elk een getal met drijvende komma:

data3 = country.capital_latlng()
afdrukken(gegevens3)

Het Python-fragment voor het verkrijgen van de breedtegraad en breedtegraad van een land produceert de volgende uitvoer:

3. De oppervlakte van een land, zijn provincies en de omliggende grenslanden verkrijgen

U kunt de API-methode gebruiken, gebied() om de oppervlakte van een land in vierkante kilometers te krijgen. Implementeer de code als:

data4 = land.gebied()
afdrukken(gegevens4)

Het Python-fragment voor het verkrijgen van de oppervlakte van een land levert de volgende uitvoer op:

U kunt een lijst met provincies van een land krijgen met behulp van provincies(). Elk element in de lijst is een tekenreeks die een provincie vertegenwoordigt. Implementeer de code als:

data5 = land.provincies()
afdrukken(gegevens5)

Het Python-fragment voor het ophalen van de provincies van een land produceert de volgende uitvoer:

U kunt de namen van aangrenzende landen ophalen met behulp van de API-methode, grenzen(). Elk element in de lijst is een landcode in ISO-3-indeling, een reeks van drie hoofdletters. Implementeer de code als:

data6 = land.grenzen()
afdrukken(gegevens6)

Het Python-fragment voor het verkrijgen van de naam van grenslanden produceert de volgende uitvoer:

4. De belcodes van een land verkrijgen

U kunt de internationale belcodes van een land ophalen met behulp van belcodes(). Dit retourneert een lijst met tekenreeksen, elk met het numerieke telefoonvoorvoegsel dat u nodig hebt om het land vanuit een ander land te bellen:

data7 = country.calling_codes()
afdrukken(gegevens7)

Het Python-fragment voor het verkrijgen van de belcodes van een land produceert de volgende uitvoer:

5. Valuta, bevolking en tijdzones ophalen

Haal het officiële valutaformaat van een land op met behulp van de API-methode, valuta(). Deze methode retourneert een andere lijst met tekenreeksen:

data8 = land.valuta()
afdrukken(gegevens8)

Het Python-fragment voor het ophalen van de valuta van een land produceert de volgende uitvoer:

Haal het geschatte aantal mensen op dat in een land woont met behulp van bevolking(). Deze methode retourneert een int. Gebruik het zo:

data9 = land.bevolking()
afdrukken(gegevens9)

Het Python-fragment voor het verkrijgen van de bevolking van een land produceert de volgende uitvoer:

Een land kan een of meer tijdzones hebben, afhankelijk van de grootte. U kunt de verschillende tijdzones van een land ophalen met behulp van de tijdzones() API-methode als:

data10 = land.tijdzones()
afdrukken(gegevens10)

Het Python-fragment voor het ophalen van de verschillende tijdzones van een land produceert de volgende uitvoer:

6. De regio en subregio van een land verkrijgen

Haal de algemene regio of het continent op waartoe een land behoort met behulp van de regio() API-methode. Implementeer de code als:

data11 = land.regio()
afdrukken(gegevens11)

Het Python-fragment voor het ophalen van de regio van een land produceert de volgende uitvoer:

Evenzo kunt u een meer specifieke regio gebruiken waartoe het land behoort subregio() als:

data12 = land.subregio()
afdrukken(gegevens12)

Het Python-fragment voor het ophalen van de subregio van een land produceert de volgende uitvoer:

7. De Wikipedia-URL van een land ophalen

Wikipedia is een van de beste informatiebronnen voor alles op internet. U kunt de Wikipedia-pagina van een land ophalen met behulp van de API-methode, wiki(). Implementeer de code als:

data13 = land.wiki()
afdrukken(gegevens13)

Het Python-fragment voor het ophalen van de Wikipedia-pagina van een land produceert de volgende uitvoer:

8. Het topniveaudomein voor een land verkrijgen

Een ccTLD is een landcode top-level domeinnaam die een land of een geografisch gebied van de website aangeeft. Het is meestal twee letters lang, zoals .in voor Indië en .ca voor Canada. U kunt het topniveaudomein voor een land ophalen met behulp van tld() als:

data14 = land.tld()
afdrukken(gegevens14)

Het Python-fragment voor het ophalen van het topniveaudomein van een land levert de volgende uitvoer op:

9. Alle beschikbare informatie over een land verkrijgen

U kunt alle beschikbare informatie van een land ophalen met behulp van de API-methode, info(). Het retourneert een woordenboek met sleutel-/naamwaarden, die u kunt herhalen met een for-lus:

data15 = land.info()
voorsleutel, waardeingegevens15.items():
afdrukken (sleutel, ":", waarde)

Het Python-fragment voor het verkrijgen van alle beschikbare informatie over een land produceert de volgende uitvoer:

10. De informatie van alle landen verkrijgen en een gegevensset maken

De CountryInfo-module biedt een API-methode genaamd alle() dat geeft een woordenboek terug met alle informatie voor alle landen ter wereld:

van landeninfo importeren Landinfo
importeren panda's als pd
land = CountryInfo()
data = land.all()

U kunt de panda's-module gebruiken om deze gegevens te manipuleren. De pandas-module biedt veel opdrachten voor het werken met DataFrames, waaronder een om gegevens op te slaan in CSV-indeling:

df = pd. DataFrame (gegevens)
df.naar_csv("Country_Data_Fetcher.csv")

Gegevens ophalen van websites

Hoewel deze handige Python-module alle essentiële informatie van elk land biedt, is het ophalen van schone gegevens geen gemakkelijke taak. Kennis van webschrapen helpt u bij het ophalen van gegevens van elke website op internet. Die data kun je vervolgens analyseren en gebruiken in je applicaties.

Python heeft een krachtige module genaamd BeautifulSoup die u kunt installeren om webscraping uit te voeren en uren werk te besparen.