Effectieve data-analyse vereist een duidelijk begrip van de relatie tussen de betrokken variabelen en grootheden. En als je goede data hebt, kun je die zelfs gebruiken om datagedrag te voorspellen.
Tenzij u echter een wiskundige bent, is het onmogelijk om een vergelijking te maken op basis van een dataset. Maar met Microsoft Excel kan bijna iedereen dit doen door een spreidingsdiagram te gebruiken. Hier is hoe.
Een spreidingsdiagram maken in Microsoft Excel
Voordat we een trend kunnen gaan voorspellen, moet je dat eerst doen maak een spreidingsdiagram om er een te vinden. De spreidingsplot geeft de relatie weer tussen twee variabelen langs de twee assen van het diagram, waarbij de ene variabele onafhankelijk is en de andere afhankelijk.
De onafhankelijke variabele wordt meestal weergegeven op de horizontale as van het diagram, terwijl u de afhankelijke variabele op de verticale as kunt vinden. De relatie daartussen wordt dan weergegeven door de grafieklijn
Volg de onderstaande stappen om een spreidingsdiagram op een Excel-blad te maken:
- Open het werkblad met de gegevens die u in het spreidingsdiagram wilt plotten.
- Plaats de onafhankelijke variabele in de linkerkolom en de afhankelijke variabele in de rechterkolom.
- Selecteer de waarde van beide kolommen die u wilt plotten.
- Klik op de Invoegen Tab en ga naar Grafieken groep. Klik nu op Spreidingsdiagram (X, Y) of bellendiagram invoegen.
- Hier vindt u verschillende stijlen van het spreidingsdiagram. Kies er een uit door erop te klikken.
- Het zal de kaart op het scherm weergeven. Wijzig de naam van de assen en de grafiektitel.
Een trendlijn tekenen op een spreidingsgrafiek
Om de relatie tussen de variabelen van de grafiek weer te geven, is een trendlijn vereist. De trendlijn moet vergelijkbaar zijn met of overlappen met gegevenswaarden op het diagram om de relatie tussen de variabelen nauwkeurig te kunnen schatten. Om een trendlijn op het spreidingsdiagram te tekenen:
- Klik met de rechtermuisknop op een gegevenspunt in het spreidingsdiagram.
- Selecteer in de lijst met opties die verschijnt Trendlijn toevoegen.
- A Trendlijn opmaken venster verschijnt aan de rechterkant met de Lineair optie standaard geselecteerd.
Hiermee wordt een trendlijn (rechte stippellijn) aan uw spreidingsdiagram toegevoegd.
Trendlijnopties opmaken om de gegevenswaarden te laten passen
We willen de trendlijn zo dicht mogelijk bij de curveplot passen. Op die manier kunnen we inzicht krijgen in de benaderende relatie tussen de variabelen. Volg hiervoor de onderstaande stappen:
- Kies verschillende bochten uit TRENDLINE-OPTIES in de Trendlijn opmaken venster naar curve passen op de trendlijn met een curveplot.
- Kruis de... aan Geef de vergelijking weer op de kaart selectievakje aan om de curve fit-vergelijking op het spreidingsdiagram weer te geven.
Voorspelling van voorwaartse en achterwaartse waarden op basis van trends
Na het aanpassen van de curve kunt u deze trendlijn gebruiken om de vorige en toekomstige waarden te voorspellen die geen deel uitmaken van deze dataset. U kunt dit bereiken door een waarde toe te wijzen onder het gedeelte Prognose van het venster Trendlijn opmaken. Voeg uw gewenste periodes toe onder de Vooruit En Achteruit opties om de verwachte waarden op het spreidingsdiagram te observeren.
Voorspellen van de relatie tussen meerdere onafhankelijke en afhankelijke variabelen om een vergelijking te formuleren
Gegevens bevatten soms meerdere onafhankelijke variabelen die resulterende waarden creëren. In dergelijke gevallen is de trend misschien niet eenvoudig. Om de relatie te identificeren, moet u mogelijk zoeken naar trends tussen de afhankelijke hoeveelheid en individuele onafhankelijke variabelen.
In de onderstaande afbeelding hebben we een dataset die twee onafhankelijke variabelen bevat. In de grafiek stelt de horizontale as de variabele voor u en de verticale as vertegenwoordigt de resulterende afhankelijke variabele. Elke lijn op de grafiek is ook een functie van variabele T.
Hier zullen we een manier vinden om de geschatte relatie tussen de afhankelijke variabele te vinden J(U, T) (of resulterende waarde) en onafhankelijke variabelen U En T. Dit zou ons in staat stellen om deze variabele waarden te extrapoleren om het gegevensgedrag te voorspellen.
Volg hiervoor de onderstaande stappen:
- Eerst zullen we de relatie vinden tussen één onafhankelijke variabele (U) en de resulterende afhankelijke Y. Behoud de waarde van andere onafhankelijke waarden (T) constant door slechts één kolom tegelijk te kiezen.
- Selecteer Cellen B3 naar B10 selecteren U en Cellen C3 naar C10 (resulterende waarde bij T=1) en gebruik een spreidingsdiagram om ze uit te zetten.
- Teken nu de trendlijn en gebruik de best passende trendlijn die wordt weergegeven in de Trendlijn opmaken venster dat bij de dataset past. In dit geval hebben we waargenomen dat de "lineaire" trendlijn het beste bij de curve past.
- Klik op Toon vergelijking op grafiek in de Trendlijn opmaken lijn venster.
- Hernoem de assen van het diagram volgens gegevensvariabelen.
- Vervolgens moet u een spreidingsdiagram maken voor alle andere variabelen onder T. Volg stap één tot en met vijf, maar kies kolommen D3 naar D10 (T=2), E3 naar E10 (T=5), F3 naar F10 (T=7), G3 naar G10 (T=10), H3 naar H10 (T=15), I3 naar ik10 (T=20)en J3 naar J10 (T=20) afzonderlijk met variabele U cellen bevatten B3 naar B10.
- U zou de volgende vergelijkingen in de grafieken moeten vinden.We kunnen zien dat alle vergelijkingen lineair zijn en dezelfde coëfficiënt op de variabele hebben U. Het brengt ons dichter bij de conclusie dat Y is gelijk aan 2U en enkele andere verschillende waarden die een functie van variabele kunnen zijn T.
T
Y
T=1
Y=2U+12,2
T=2
Y=2U+21,2
T=5
Y=2U+48,2
T=7
Y=2U+66,2
T=10
Y=2U+93,2
T=15
Y=2U+138,2
T=20
Y=2U+183,2
T=25
Y=2U+228,2
- Noteer deze waarden afzonderlijk en rangschik ze zoals hieronder getoond (elke waarde met zijn genoteerde variabele waarde, zoals 12,2 met T=1 En 228 met T=25, enz.). Verspreid nu deze waarden en geef de vergelijking weer die de relatie tussen deze waarden met variabele weergeeft T.
- Eindelijk kunnen we ons verhouden J(U, T) als
Y(U, T)=2U+9T+3,2
U kunt deze waarden verifiëren door deze vergelijking uit te zetten voor verschillende waarden van U En T. Op dezelfde manier kun je het gedrag van voorspellen J(U, T) voor verschillende waarden van variabelen U En T niet beschikbaar met deze dataset.
U hoeft geen deskundige wiskundige te zijn om trends in Microsoft Excel te voorspellen
Nu je weet hoe je de relatie tussen een functie en zijn afhankelijke voorwaarden kunt vinden, kun je geldige conclusies trekken over het gedrag van de functie. Op voorwaarde dat u over alle noodzakelijke variabelen beschikt die van invloed zijn op de wiskundige functie, kunt u de waarde ervan nauwkeurig voorspellen onder de gegeven omstandigheden.
Microsoft Excel is een geweldig hulpmiddel waarmee u ook multivariabele functies kunt plotten. Nu u uw gegevens heeft, moet u ook de verschillende manieren onderzoeken waarop u krachtige grafieken en diagrammen kunt maken om ze te presenteren.