Vad är ett t-test? Jämför enkätresultat med tillförlitlighet

T-tester – en guide i hur du analyserar enkätresultat

Läs om hur du identifierar statistiskt signifikanta skillnader i gruppmedelvärden, enkätresultat och A/B-tester med ett enkelt t-test.

Kom igång

Vem som helst kan se skillnad på två tal, men att ta reda på om skillnaden faktiskt är statistiskt signifikant kan vara lite svårare.

Anta att du har gjort en kundnöjdhetsenkät på jobbet. Chefen vill analysera om män ger företaget en lägre NPS-poäng än kvinnor.

När du tittar närmare på informationen ser du att det genomsnittliga betyget från män var 9 jämfört med ett genomsnittligt betyg på 12 från kvinnor. Hur ska du avgöra om 9 skiljer sig signifikant från 12? Det är här t-testet kommer in i bilden.

I den här artikeln beskriver vi t-tester och deras användningsområden, delar exempel på t-tester samt förklarar hur du tolkar resultaten.

Vad är t-tester?

Ett t-test är ett statistiskt test som avgör om skillnaden mellan två medelvärden är signifikant med hjälp av t-fördelning. Det gör det enklare att avgöra om en observerad skillnad mellan grupper är verklig eller bara beror på slumpen.

Det är vanligt att kontrollera statistisk signifikans inom koncepttestning och produkttestning. I koncepttestning används ofta A/B-tester för att avgöra om ett annonskoncept fungerar bättre än ett annat. På samma sätt kan produkttester visa om en produkt kommer att klara sig på marknaden vid lansering.

Formler för t-tester

I t-tester används särskilda formler för att jämföra medelvärden och avgöra om en skillnad är statistiskt signifikant. Det tvåsidiga t-testet är det vanligaste inom enkätanalys:

Det här är formlerna för det ensidiga t-testet och det parade t-testet:

I både det ensidiga och det parade t-testet jämförs det beräknade t-värdet med ett kritiskt värde från t-fördelningen för att avgöra signifikansen.

Vad används ett t-test till?

Använd ett t-test när du vill veta om två medelvärden i ett enkätresultat faktiskt skiljer sig åt och inte bara är numeriskt olika. Med hjälp av t-tester kan du enklare jämföra gruppmedelvärden, utvärdera urvalsskillnader och avgöra om en skillnad är statistiskt signifikant utifrån p-värdet och konfidensnivån.

Det här är några vanliga enkätscenarier:

Jämföra två grupper. Använd ett tvåsidigt t-test (oberoende urval) för att se om segment som män/kvinnor, nya/återkommande kunder eller olika medarbetargrupper svarar olika.
Testa ett koncept eller en behandlingsgrupp mot en kontrollgrupp. Vid A/B-testning eller koncepttestning blir det enklare att avgöra om en version fungerar bättre än en annan med hjälp av ett t-test.
Utvärdera skillnader i poäng. Jämför mått som Net Promoter Score® (NPS), kundnöjdhetspoäng (CSAT) eller kundinsatspoäng (CES) för att avgöra om en grupps medelbetyg är högre eller lägre på ett statistiskt signifikant sätt.
Kontrollera förändringar över tid. Ett parat t-test visar om samma svarandes poäng har förändrats efter ett evenemang, en lansering eller en kampanj.

Använd ett t-test när du behöver bedöma skillnader i medelvärden, testa en jämförelse med ett referensvärde eller bekräfta en hypotes med en liten provgruppsstorlek. Här är t-testet ett tillförlitligt val för enkätanalys, A/B-testning och situationer där du behöver belägg för att skillnaden i data är verklig.

Snabb kontroll av antaganden innan du utför ett t-test

Innan du utför ett t-test kontrollerar du att de data du har uppfyller ett antal grundläggande förutsättningar så att resultatet blir tillförlitligt.

Oberoende svar. Varje svar ska komma från en unik person och inte påverka andra svar. Undvik dubbletter, delade enheter och dold klustring.
Ungefär normalfördelat medelvärde. T-test fungerar bäst när medelvärdets urvalsfördelning är ungefär normal, vilket oftast gäller när provgruppsstorleken är cirka 30 eller fler.
Rimlig varians. Om varianserna i de två grupperna skiljer sig mycket åt eller om provgruppsstorlekarna är ojämna, bör du använda Welchs t-test i stället för ett vanligt tvåsidigt t-test.

Med en snabb kontroll av de här grunderna kan du försäkra sig om att de skillnader du ser faktiskt speglar en verklig effekt och inte bara är databrus.

Tre vanliga typer av t-tester och när du ska använda dem

Det finns tre typer av t-tester som ofta används av forskare. De här t-testerna tjänar olika syften som förklaras nedan.

1. Ensidigt t-test

I det ensidiga t-testet tittar man på om genomsnittet för data från en grupp (i det här fallet NPS-poängen) skiljer sig från ett värde du anger.

Exempel: Företagets nuvarande genomsnittliga kundinsatspoäng är 4,2. Är en kundinsatspoäng på 4,2 signifikant sämre än branschstandardens 5,0?

2. Tvåsidigt t-test

I ett tvåsidigt t-test tittar man på om genomsnittet för två oberoende grupper skiljer sig avsevärt från varandra. Om gruppvarianserna skiljer sig åt eller om provgruppsstorlekarna är ojämna bör du byta till Welchs t-test (finns i de flesta verktyg), eftersom det inte utgår från att varianserna är lika.

Exempel: Din hypotes är att män ger företaget en lägre NPS-poäng än kvinnor. Män ger er i genomsnitt 9 i betyg, medan det genomsnittliga betyget från kvinnor är 12. Skiljer sig 9 signifikant från 12?

3. Parat t-test

I det här testet ger man en grupp samma enkät två gånger. Med ett parat t-test får du veta om genomsnittet har förändrats mellan det första och andra enkättillfället.

Exempel: Du har skickat en enkät till samma kundgrupp två gånger, en gång i april och en andra gång i maj efter att de sett en annons för ert företag. Ändrades företagets NPS efter att kunderna sett annonsen?

Så genomför du ett t-test i fyra steg (med exempel)

Kvinna som tittar på diagram på en bärbar dator

Ett t-test genomförs i fyra steg.

I det här avsnittet går vi igenom de fyra stegen med hjälp av exemplet med NPS-poäng från inledningen:

Din hypotes är att män ger företaget en lägre NPS-poäng än kvinnor. Män ger er i genomsnitt 9 i betyg, medan det genomsnittliga betyget från kvinnor är 12. Skiljer sig 9 signifikant från 12? I det här exemplet passar det att använda det tvåsidiga t-testet.

Vi tittar närmare på de olika stegen och exemplen för t-test.

1. Beräkna t-värdet

Varje typ av t-test har en egen formel för att beräkna t-värdet. I det här exemplet använder vi formeln för det tvåsidiga t-testet där:

t är t-värdet
x₁ är det genomsnittliga NPS-betyget för män → 9
x₂ är genomsnittet för kvinnor → 12
n₁ är antalet män som svarade på NPS-frågan → anta till exempel att 20 män besvarade enkäten
n₂ är antalet kvinnor → 23 kvinnor svarade
s₁ är standardavvikelsen för NPS för män → anta att den beräknade standardavvikelsen är 12,48
s₂ är standardavvikelsen för NPS hos kvinnor → den beräknade standardavvikelsen är 10,51

Du kommer förmodligen att utföra t-testerna i ett kalkylblad eller ett statistikprogram (som Excel eller SPSS), men om du vill räkna för hand hittar du formlerna för de andra två typerna av t-tester nedan.

2. Beräkna frihetsgraderna

Frihetsgraderna är det antal sätt genomsnittet kan variera på. I det här fallet är frihetsgraderna antalet NPS-betyg som ni kan få i en viss grupp svarande. I likhet med t-värdet kan formeln för frihetsgrader också variera beroende på vilken typ av t-test som utförs.

Den här formeln måste användas för att bestämma frihetsgrader vid tvåsidiga t-test.

3. Fastställ det kritiska värdet

Det kritiska värdet är det tröskelvärde vid vilket skillnaden mellan de två talen anses vara statistiskt signifikant.

Enligt den här tabellen är det kritiska värdet för ett tvåsidigt test med en alfanivå på 0,05 och 41 frihetsgrader 2,02. Tänk på att de flesta analytiker använder ett tvåsidigt test i stället för ett ensidigt, eftersom det är mer konservativt.

Mer information om skillnaderna mellan ensidiga och tvåsidiga tester finns i den här videon från Khan Academy.

4. Jämför det absoluta t-värdet med det kritiska värdet

Om t-värdet är större än det kritiska värdet är skillnaden signifikant. Om t-värdet är mindre är de båda talen, statistiskt sett, omöjliga att särskilja.

I vårt exempel är det absoluta t-värdet 0,86, vilket inte är större än det kritiska värdet på 2,02, och därför kan du dra slutsatsen att män inte ger avsevärt lägre NPS-betyg än kvinnor.

Hur ska resultatet från ett t-test tolkas?

När du ska tolka resultatet från ett t-test behöver du granska t-värdet, p-värdet och konfidensintervallet för att förstå om skillnaden mellan grupperna är verklig eller bara en slumpmässig variation. Sammantaget visar de här måtten hur stor skillnaden är, hur starka bevisen är och hur säker du kan var på utfallet (konfidensnivån). Frågorna och svaren nedan förklarar vad de olika delarna avslöjar och hur du analyserar resultatet från ett t-test.

Vad visar t-värdet?

T-värdet visar hur stor skillnaden mellan gruppmedelvärdena är i förhållande till variabiliteten i data. Ett högre absolut t-värde betyder att skillnaden är verklig, medan ett lägre t-värde tyder på att den kan bero på slumpen.

Vad är ett p-värde i enkätanalys?

P-värdet anger sannolikheten för att du skulle få det här resultatet om nollhypotesen (ingen verklig skillnad) vore sann. Många team använder en gräns på 0,05, där p ≤ 0,05 tyder på en statistiskt signifikant skillnad, medan p > 0,05 tyder på att det inte finns någon meningsfull skillnad i provgruppen.

Vad är ett konfidensintervall och varför är det viktigt?

Ett konfidensintervall anger inom vilket intervall den verkliga skillnaden i medelvärden troligtvis ligger, vilket bidrar med ett större sammanhang än bara ja/nej. Om intervallet spänner över noll är effekten inte avgörande, men om det ligger helt över eller under noll är resultatet signifikant på den valda konfidensnivån.

Hur vet du om en skillnad är meningsfull?

En meningsfull skillnad är både statistiskt signifikant och praktiskt viktig. Titta på den uppskattade effektstorleken och konfidensintervallet för att få en bild av hur stor skillnaden kan vara och om den är relevant för beslutet.

Hur påverkar provgruppsstorleken signifikansen för t-testet?

Större provgrupper minskar variabiliteten, ger snävare konfidensintervall och gör det lättare att identifiera verkliga skillnader. Mindre provgrupper ger större osäkerhet och gör det svårare att tolka gränsfall.

Presentera resultat från t-tester

En tydlig resultatöversikt över t-testet visar varför du gjorde jämförelsen, vad testet avslöjade och hur säker du kan vara på skillnaden mellan grupperna. Din uppgift är att översätta det statistiska resultatet till vanlig svenska, koppla det till ursprungsfrågan och lyfta fram utfallets betydelse för de beslut som ska tas.

Ta med följande viktiga element när du sammanfattar resultatet av ett t-test:

Redovisa syftet. Börja med att förklara varför du genomförde ett t-test och vad syftet var. Du kan till exempel förklara att du använder ett t-test för att undersöka om det finns en statistiskt signifikant skillnad mellan medelvärdena för två grupper i ett enkätresultat.
Dela beskrivande statistik. Lyft fram medelvärde och standardavvikelse för varje grupp som utvärderas. Då får intressenterna det sammanhang som behövs för att förstå de observerade skillnaderna. Ange också provgruppsstorlekarna för respektive grupp som ytterligare bakgrund.
Presentera resultatet av t-testet. Redovisa t-värde, frihetsgrader, p-värde samt analys av konfidensintervallet (om du har gjort en sådan).
Dela slutsatserna. Till sist är det dags att dela slutsatserna med intressenterna. Diskutera kortfattat om skillnaden var statistiskt signifikant och vad det innebär för hypotesen eller forskningsfrågan.
Föreslå nästa steg. Förklara för intressenterna vad forskningsresultatet betyder för företaget. Berätta vilka åtgärder eller beslut som kan påverkas av resultatet.

Vanliga misstag med t-tester i enkäter

Om du kan undvika vissa enkla misstag kan du få mer tillförlitliga och tydliga resultat utifrån enkätdata i t-testet.

Att jaga låga p-värden utan att undersöka den faktiska skillnaden. Ett resultat kan vara ”statistiskt signifikant” även om skillnaden mellan grupperna är för liten för att spela någon roll. Beakta storleken på skillnaden och konfidensintervallet för att avgöra om den är meningsfull.
Att jämföra många grupper utan att justera metodiken. Om du testar många segment eller frågor ökar risken att du av en slump hittar en skillnad. Börja med bredare tester som variansanalys eller använd enkla korrigeringar när du gör flera t-tester.
Att avbryta A/B-tester för tidigt. Om du kollar resultatet ofta och avslutar testet så fort det ser lovande ut kan det leda till felaktiga slutsatser. Bestäm dig för en provgruppsstorlek eller tidsram innan du börjar.
Att använda t-test för fel typ av data. Om frågan använder rankning eller betygsskalor som gett mycket snedvrida resultat passar ett t-test sällan bra, eftersom medelvärdena kan vara missvisande. Se till att data är jämnt fördelade och inte är snedvridna.
Att hoppa över de grundläggande förutsättningarna. T-tester fungerar bäst när svaren är oberoende och grupperna har hyfsat likartad variabilitet. Om spridningen mellan grupperna är stor väljer du i stället Welchs t-test för ett mer tillförlitligt resultat.

Vanliga frågor om t-tester

T-tester jämfört med variansanalys
Z-tester jämfört med t-tester
Z-tester och t-tester liknar varandra eftersom båda fastställer den statistiska signifikansen, men z-tester används oftast vid större provgruppsstorlekar (n > 30). Detta beror på att provgruppens medelfördelning blir mer normal vid större provgrupper. Z-tester är mer tillförlitliga för stora grupper eftersom de använder standardnormalfördelning.
En annan skillnad mellan z-tester och t-tester är att standardavvikelsen för populationen (σ) måste vara känd för ett z-test. Du använder t-test när standardavvikelsen för populationen är okänd och uppskattar variabiliteten med standardavvikelsen för provgruppen (s). T-tester är mycket vanligare, eftersom standardavvikelsen för populationen sällan är känd vid verkliga datainsamlingar.

Bygg bättre enkäter för analys med SurveyMonkey

T-tester används för att avgöra om skillnaden i medelvärden mellan två provgrupper är statistiskt signifikant. Du kan använda t-tester vid analys av enkätdata för att visa hur tillförlitliga data är.

Med SurveyMonkey kan du effektivisera arbetet med att skapa och skicka enkäter till provgrupper för organisationens forskningsbehov. Med SurveyMonkey kan du ta fram marknadsundersökningar och frågeformulär från grunden eller välja bland våra fler än 400 färdiga enkätmallar.

Kom igång med att samla in enkätdata för analys redan idag och hjälp organisationen att fatta bättre beslut och utvecklas. Skapa ett kostnadsfritt konto idag.

Redo att sätta igång?

Registrera dig gratis

NPS, Net Promoter och Net Promoter® Score är registrerade varumärken som tillhör Satmetrix Systems, Inc., Bain & Company och Fred Reichheld.

Hitta fler resurser

Kvinna med hijab som tittar på forskningsinsikter på en bärbar dator

Lösningar för din roll

SurveyMonkey kan hjälpa dig att göra ett bättre jobb. Ta reda på hur du får större genomslag med vinnande strategier, produkter, upplevelser och mycket mer.

Läs mer

En man och kvinna tittar på en artikel på en bärbar dator och skriver information på notislappar

Hornblower förbättrar kundupplevelserna globalt

Upptäck hur Hornblower använder SurveyMonkey och AI för att få ut mesta möjliga av NPS-data, samla in kundinsikter och förbättra kundupplevelsen.

Läs mer

Leende man med glasögon som använder en bärbar dator

Enkätmall för varumärkesspårning

Förbättra varumärket med vår mall för enkäter om varumärkesspårning. Ställ de rätta frågorna som rekommenderas av experter för att mäta ert varumärkeskapital.

Läs mer

Kvinna som tittar på information på sin bärbara dator

Se SurveyMonkeys lösningar för konsumentprodukter och -tjänster

Produkter och tjänster för konsumenter – inklusive snabbrörliga konsumentvaror, resor och hotell – förlitar sig på SurveyMonkey-insikter.

Läs mer