Hier leest u hoe u de ingebouwde hulpprogramma's van Excel kunt gebruiken om statistische analyse eenvoudiger te maken.

Restplots spelen een essentiële rol bij regressieanalyse. Ze vertellen u hoe nauwkeurig uw regressielijn de relatie tussen twee variabelen weergeeft. In de volgende gids wordt uitgelegd hoe u Excel-residuen op twee manieren kunt berekenen en plotten.

Maar voordat we naar de goede dingen gaan, laten we kort de residuen en hun belang in een regressieanalyse begrijpen.

Wat zijn residuen en waarom zijn ze belangrijk?

Een residu is een verschil tussen de waargenomen (werkelijke) waarde en de voorspelde waarde. In eenvoudiger bewoordingen is een residu een fout. Als de waargenomen waarde bijvoorbeeld 10 is en uw model gaf een waarde van 8, dan zou de restwaarde 2 zijn.

Aan de andere kant is een residuplot een spreidingsplot waarin de onafhankelijke variabele (leeftijd) op de horizontale as wordt uitgezet en de residuen (fouten) op de verticale as worden uitgezet.

Oké, je weet wat residuen zijn, maar waarom zijn ze belangrijk? Om dat te begrijpen, beschouwen we het volgende geval:

instagram viewer

We willen de relatie tussen leeftijd en spaarquote begrijpen. Daarvoor zullen we een regressielijn uitzetten. We weten echter niet zeker of de regressielijn de relatie tussen de twee variabelen nauwkeurig weergeeft. Dat is waar residuen binnenkomen. We gebruiken een residuplot om de nauwkeurigheid van de regressielijn te controleren.

Nu u weet wat residuen zijn, gaan we kijken hoe u een residuplot kunt maken in Excel:

Een residuaal plot maken met behulp van een trendlijnvergelijking

De eerste methode voor het plotten van residuen in Excel gebruikt een trendlijnvergelijking om de voorspelde waarden voor onze gegevens te berekenen. Zodra we dat hebben, kunnen we de residuen berekenen door de voorspelde waarden af ​​te trekken van de waargenomen waarden. Ten slotte maken we een spreidingsplot met de voorspellers op de horizontale as en de residuen op de verticale as.

Hoewel deze methode meer stappen vereist dan de tweede methode, is het een geweldige manier om het concept te begrijpen. Als je eenmaal een goed begrip hebt, kun je de tweede methode gebruiken, die minder tijd en moeite kost.

Laten we u stap voor stap door het proces leiden:

Stap 1: voer de gegevens in

We beginnen met het invoeren van de waarden voor de predictor (onder de X kolom) en de waargenomen waarden (onder de Y kolom):

Stap 2: Maak een scatterplot van de gegevens

Nu maken we een spreidingsplot van de gegevens door de onderstaande stappen te volgen:

Als u niet bekend bent met spreidingsdiagrammen, vindt u hier een uitgebreid artikel over een scatterplot maken in Excel en uw gegevens presenteren. Je kunt het ook leren gebruik een spreidingsdiagram in Excel om gegevensgedrag te voorspellen.

  1. Selecteer de gegevens (onder X En Y kolommen).
  2. Ga naar de Excel-lint en klik Invoegen.
  3. In de Grafieken sectie, klik op de pijl onder de Scatterplot keuze.
  4. Selecteer de eerste Scatterplot (Scatter met alleen markeringen).
  5. U krijgt een spreidingsplot vergelijkbaar met het volgende diagram:

Stap 3: Voeg een trendlijn toe en geef de trendlijnvergelijking weer op Scatterplot

Volg de onderstaande stappen om een ​​trendlijn aan de scatterplot toe te voegen:

  1. Klik op de spreidingsplot.
  2. Ga naar de Excel-lint en klik Lay-out.
  3. In de Achtergrond sectie, klikt u op de pijl onder de Trendlijn icoon.
  4. Selecteer de Lineaire trendlijn keuze.

Je ziet nu een lijn (trendlijn) die de stippen op je spreidingsdiagram snijdt. Volg de onderstaande stappen om de trendlijnvergelijking op de scatterplot weer te geven:

  1. Ga weer naar de Trendlijn pictogram en klik op de pijl eronder.
  2. Klik Meer trendlijnopties.
  3. A Trendlijn opmaken dialoogvenster verschijnt.
  4. Controleer de Geef de vergelijking weer op de kaart optie onderaan de Trendlijn opmaken dialoog venster. De trendlijnvergelijking wordt weergegeven in de grafiek.

Stap 4: Bereken de voorspelde waarden

Om de voorspelde waarden te berekenen, maakt u een andere kolom (Z) naast uw gegevens en volgt u de onderstaande stappen:

  1. Voer de trendlijnformule in die in de grafiek wordt weergegeven en plak deze onder de Z-kolom (cell C2). Verander de X in de formule met waarden onder de X-kolom.
  2. Dus voor de eerste voorspelde waarde zou de formule als volgt worden gegeven:
    =1,5115*A2+23,133
  3. Vervangen A2 met A3 in de trendlijnformule voor de tweede voorspelde waarde.
  4. Vervang voor de derde voorspelde waarde A3 met A4, enzovoort, totdat u alle voorspelde waarden voor hun overeenkomstige voorspellers hebt.

Stap 5: zoek de restwaarden

Nu we de voorspelde waarden hebben, kunnen we de restwaarden vinden door de voorspelde waarden af ​​te trekken van de waargenomen (werkelijke) waarden onder de Y-kolom. De formule voor de eerste restwaarde zou zijn =B2-C2. Voor de tweede zou de formule zijn =B3-C3, enzovoort.

Stap 6: Maak de resterende plot

Om een ​​residuplot te maken, hebben we de predictor en residuwaarden nodig. Nu we beide hebben, volgt u de onderstaande stappen:

  1. Selecteer kolommen Y En Z.
  2. Klik met de rechtermuisknop en selecteer Verbergen.
  3. Selecteer nu de X En Residuen kolommen.
  4. Ga naar de Invoegen tabblad in het Excel-lint.
  5. Klik op de pijl onder de Verstrooien icoon.
  6. Selecteer de Scatter met alleen markeringen keuze.
  7. U krijgt uw restperceel, zoals hieronder weergegeven.

Voor de tweede methode hoef je Excel alleen maar de gegevens te verstrekken en het doet al het werk. Met een paar klikken maak je een restkavel aan. Maar daarvoor moet u Excel's Analysis Toolpak laden. Laten we beginnen:

  1. Ga naar de Bestand tabblad en klik Opties.
  2. De Excel-opties dialoogvenster verschijnt.
  3. Ga naar de Beheren vak (onderaan), selecteer Excel-invoegtoepassingenen klik Gaan.
  4. Een Invoegtoepassingen dialoogvenster verschijnt.
  5. Controleer de Analyse ToolPak vak en klik OK.
  6. Ga nu naar de Excel-lint en klik Gegevens.
  7. Je vindt de Gegevensanalyse pictogram in de Analyse sectie.

Stap 2: voer de gegevens in

  1. Selecteer kolommen A En Den klik met de rechtermuisknop. Klik Zichtbaar maken.
  2. Kopieer nu de X En Y kolommen.

    U zult merken dat de grafiek is veranderd nadat de kolommen zichtbaar zijn gemaakt. Om het terug te zetten naar het oorspronkelijke restperceel, moeten we het verbergen Y En Z kolommen (door de Y En Z kolommen, klik met de rechtermuisknop en selecteer Verbergen).

  3. Open een nieuw Excel-blad en plak het X En Y kolommen.
  4. Klik op het nieuw verschenen Gegevensanalyse optie in de Analyse gedeelte van de Gegevens tabblad.
  5. A Gegevensanalyse dialoogvenster verschijnt.
  6. Zoek en selecteer Regressie onder Analyse hulpmiddelen.
  7. Klik OK. De Regressie dialoogvenster verschijnt.
  8. Voer de waarden in de Y kolom (de voorspellers, B2:B11) in de Voer Y-bereik in veld.
  9. Voer het celbereik in de X kolom (de onafhankelijke variabelen, A2:A11) in de Voer X-bereik in veld.

Stap 3: Maak de resterende plot

In de Regressie dialoogvenster, onder de Uitvoer opties, rekening Nieuwe werkbladlaagen klik OK.

Excel maakt automatisch de residuele plot samen met de volgende uitvoer die u kunt gebruiken om de betrouwbaarheid van uw regressiemodel te controleren:

  • Regressie Statistieken
  • ANOVA-tabel
  • Coëfficiënten tabel
  • Restopbrengst

Excel's Analysis ToolPak biedt een scala aan waardevolle statistische functionaliteit die u kunt gebruiken om uw datasets te analyseren. Nadat je de residuele plot hebt gemaakt met behulp van Excel's Analysis ToolPak, zou je je hoofd kunnen krabben terwijl je naar alle ingewikkelde tabellen kijkt. Maar als u eenmaal leert hoe u fundamentele gegevensanalyse in Excel kunt uitvoeren, zien de cijfers er niet zo eng uit.