Finns det statistiskt signifikanta skillnader i era data?
Vem som helst kan se skillnad på två tal, men att ta reda på om skillnaden faktiskt är statistiskt signifikant kan vara lite svårare.
Anta att du har gjort en enkät om kundnöjdhet för företagets räkning, och du har massor av resultat att analysera. Du frågar chefen vad du ska börja med, och hon säger att hon vill veta om kvinnor och män ger olika svar. Får företaget till exempel i genomsnitt en lägre Net Promoter Score℠ (NPS) av män än av kvinnor?
När du tittar närmare på informationen ser du att det genomsnittliga betyget från män var 9, jämfört med ett genomsnittligt betyg på 12 från kvinnor. Hur ska du veta om 9 skiljer sig signifikant från 12? Det är här t-testet kommer in i bilden.
T-testet är ett sätt att avgöra om de båda talen skiljer sig signifikant från varandra. Det finns flera olika sorters t-test, och de beräknas alla utifrån olika formler.
1. Ensidigt t-test: I det här testet tittar man på om genomsnittet för data från en grupp (i det här fallet NPS-poängen) skiljer sig från ett värde du anger.
Exempel: Företagets mål är en NPS-poäng som är avsevärt högre än branschstandarden på 5. I er senaste enkät hamnade er NPS-poäng på 10. Är en NPS på 10 signifikant högre än branschstandarden på 5?
2. Tvåsidigt t-test: I det här testet tittar man på om genomsnittet för två oberoende grupper skiljer sig avsevärt från varandra.
Exempel: Din hypotes är att män ger företaget en lägre NPS-poäng än kvinnor. Män ger er i genomsnitt 9 i betyg, medan det genomsnittliga betyget från kvinnor är 12. Skiljer sig 9 signifikant från 12?
3. Parat t-test: I det här testet ger man en grupp samma enkät två gånger. Med ett parat t-test får du veta om genomsnittet har förändrats mellan det första och andra enkättillfället.
Exempel: Du har skickat en enkät till samma kundgrupp två gånger, en gång i april och en andra gång i maj efter att de sett en annons för ert företag. Ändrades företagets NPS efter att kunderna sett annonsen?
Tänk på att även om t-tester kan avslöja om det finns signifikanta skillnader, så är det upp till dig att avgöra om skillnaderna är betydelsefulla. Små skillnader kan vara statistiskt betydelsefulla om provgruppsstorleken är stor nog.
Ett t-test omfattar fyra steg:
1. Beräkna t-värdet:
Varje typ av t-test har sin egen formel för att beräkna t-värdet (du hittar alla tre formlerna längst ner på sidan).
2. Beräkna frihetsgraderna:
Frihetsgraderna är det antal sätt genomsnittet kan variera på. I det här fallet är frihetsgraderna antalet NPS-betyg som ni kan få i en viss grupp svarande. I likhet med t-värdet kan formeln för frihetsgrader också variera beroende på vilken typ av t-test som utförs.
3. Fastställ det kritiska värdet:
Det kritiska värdet är det tröskelvärde vid vilket skillnaden mellan de två talen anses vara statistiskt signifikant.
4. Jämför det absoluta t-värdet med det kritiska värdet:
Om t-värdet är större än det kritiska värdet är skillnaden signifikant. Om t-värdet är mindre är de båda talen, statistiskt sett, omöjliga att särskilja.
Vi går igenom exemplet från början. Din hypotes är att män ger företaget en lägre NPS-poäng än kvinnor. Män ger er i genomsnitt 9 i betyg, medan det genomsnittliga betyget från kvinnor är 12. Skiljer sig 9 signifikant från 12? I det här exemplet passar det att använda det tvåsidiga t-testet.
1. Beräkna t-värdet:
Nedan visas formeln för det tvåsidiga t-testet, där:
2. Beräkna frihetsgraderna:
Den här formeln måste användas för att fastställa frihetsgraderna i tvåsidiga t-tester. Formlerna för andra typer av tester visas nedan.
3. Fastställ det kritiska värdet:
Enligt den här tabellen är det kritiska värdet för ett tvåsidigt test med en alfanivå på 0,05 och 41 frihetsgrader 2,02. Tänk på att de flesta analytiker använder ett tvåsidigt test istället för ett ensidigt, eftersom det är mer konservativt. Mer information om skillnaderna mellan ensidiga och tvåsidiga tester finns i den här videon från Khan Academy.
4. Jämför det absoluta t-värdet med det kritiska värdet:
Eftersom det absoluta t-värdet är 0,86, vilket inte är större än det kritiska värdet på 2,02, så kan du dra slutsatsen att män inte ger avsevärt lägre NPS-betyg än kvinnor.
Du kommer förmodligen att utföra t-testerna i ett kalkylblad eller ett statistikprogram (som Excel eller SPSS), men om du vill räkna för hand hittar du formlerna för de andra två typerna av t-tester nedan.
Om du bestämmer dig (som de flesta gör) för att utföra t-tester i ett kalkylblad eller ett statistikprogram är processen något annorlunda. Istället för att jämföra t-värdet med det kritiska värdet beräknar de flesta program ett p-värde, som sedan jämförs med alfanivån (den vanligaste nivån är 0,05). I det här fallet visar ett p-värde som är lägre än alfanivån att talen skiljer sig signifikant från varandra.
Net Promoter Score är ett varumärke som tillhör Bain & Company, Inc., Satmetrix Systems, Inc. och F. Reichheld.
Insiktsansvariga kan använda det här verktygskitet för att leverera övertygande, användbara insikter som stöd för intressenter och för att nå rätt målgrupper.
Produkter och tjänster för konsumenter – inklusive snabbrörliga konsumentvaror, resor och hotell – förlitar sig på SurveyMonkey-insikter.
Ta reda på hur SurveyMonkey hjälper företag att hitta rätt bland nya marknadstrender, utveckla framgångsrika produkter och skapa omtyckta varumärken.
Se hur organisationer inom professionella tjänster använder SurveyMonkey för att få insikter om kunder och marknader.