T-tester – en guide i hur du analyserar enkätresultat

Läs om hur du identifierar statistiskt signifikanta skillnader i gruppmedelvärden, enkätresultat och A/B-tester med ett enkelt t-test.

kvinna som arbetar med t-testdiagram

Vem som helst kan se skillnad på två tal, men att ta reda på om skillnaden faktiskt är statistiskt signifikant kan vara lite svårare.

Anta att du har gjort en kundnöjdhetsenkät på jobbet. Chefen vill analysera om män ger företaget en lägre NPS-poäng än kvinnor.

När du tittar närmare på informationen ser du att det genomsnittliga betyget från män var 9 jämfört med ett genomsnittligt betyg på 12 från kvinnor. Hur ska du avgöra om 9 skiljer sig signifikant från 12? Det är här t-testet kommer in i bilden.

I den här artikeln beskriver vi t-tester och deras användningsområden, delar exempel på t-tester samt förklarar hur du tolkar resultaten.

Ett t-test är ett statistiskt test som avgör om skillnaden mellan två medelvärden är signifikant med hjälp av t-fördelning. Det gör det enklare att avgöra om en observerad skillnad mellan grupper är verklig eller bara beror på slumpen.

Det är vanligt att kontrollera statistisk signifikans inom koncepttestning och produkttestning. I koncepttestning används ofta A/B-tester för att avgöra om ett annonskoncept fungerar bättre än ett annat. På samma sätt kan produkttester visa om en produkt kommer att klara sig på marknaden vid lansering.

I t-tester används särskilda formler för att jämföra medelvärden och avgöra om en skillnad är statistiskt signifikant. Det tvåsidiga t-testet är det vanligaste inom enkätanalys:

formel för t-test

Det här är formlerna för det ensidiga t-testet och det parade t-testet:

ensidigt t-test och parat t-test

I både det ensidiga och det parade t-testet jämförs det beräknade t-värdet med ett kritiskt värde från t-fördelningen för att avgöra signifikansen.

Använd ett t-test när du vill veta om två medelvärden i ett enkätresultat faktiskt skiljer sig åt och inte bara är numeriskt olika. Med hjälp av t-tester kan du enklare jämföra gruppmedelvärden, utvärdera urvalsskillnader och avgöra om en skillnad är statistiskt signifikant utifrån p-värdet och konfidensnivån.

Det här är några vanliga enkätscenarier:

  • Jämföra två grupper. Använd ett tvåsidigt t-test (oberoende urval) för att se om segment som män/kvinnor, nya/återkommande kunder eller olika medarbetargrupper svarar olika.
  • Testa ett koncept eller en behandlingsgrupp mot en kontrollgrupp. Vid A/B-testning eller koncepttestning blir det enklare att avgöra om en version fungerar bättre än en annan med hjälp av ett t-test.
  • Utvärdera skillnader i poäng. Jämför mått som Net Promoter Score® (NPS), kundnöjdhetspoäng (CSAT) eller kundinsatspoäng (CES) för att avgöra om en grupps medelbetyg är högre eller lägre på ett statistiskt signifikant sätt.
  • Kontrollera förändringar över tid. Ett parat t-test visar om samma svarandes poäng har förändrats efter ett evenemang, en lansering eller en kampanj.

Använd ett t-test när du behöver bedöma skillnader i medelvärden, testa en jämförelse med ett referensvärde eller bekräfta en hypotes med en liten provgruppsstorlek. Här är t-testet ett tillförlitligt val för enkätanalys, A/B-testning och situationer där du behöver belägg för att skillnaden i data är verklig.

Innan du utför ett t-test kontrollerar du att de data du har uppfyller ett antal grundläggande förutsättningar så att resultatet blir tillförlitligt.

  • Oberoende svar. Varje svar ska komma från en unik person och inte påverka andra svar. Undvik dubbletter, delade enheter och dold klustring.
  • Ungefär normalfördelat medelvärde. T-test fungerar bäst när medelvärdets urvalsfördelning är ungefär normal, vilket oftast gäller när provgruppsstorleken är cirka 30 eller fler.
  • Rimlig varians. Om varianserna i de två grupperna skiljer sig mycket åt eller om provgruppsstorlekarna är ojämna, bör du använda Welchs t-test i stället för ett vanligt tvåsidigt t-test.

Med en snabb kontroll av de här grunderna kan du försäkra sig om att de skillnader du ser faktiskt speglar en verklig effekt och inte bara är databrus.

Det finns tre typer av t-tester som ofta används av forskare. De här t-testerna tjänar olika syften som förklaras nedan.

I det ensidiga t-testet tittar man på om genomsnittet för data från en grupp (i det här fallet NPS-poängen) skiljer sig från ett värde du anger.

Exempel: Företagets nuvarande genomsnittliga kundinsatspoäng är 4,2. Är en kundinsatspoäng på 4,2 signifikant sämre än branschstandardens 5,0?

I ett tvåsidigt t-test tittar man på om genomsnittet för två oberoende grupper skiljer sig avsevärt från varandra. Om gruppvarianserna skiljer sig åt eller om provgruppsstorlekarna är ojämna bör du byta till Welchs t-test (finns i de flesta verktyg), eftersom det inte utgår från att varianserna är lika.

Exempel: Din hypotes är att män ger företaget en lägre NPS-poäng än kvinnor. Män ger er i genomsnitt 9 i betyg, medan det genomsnittliga betyget från kvinnor är 12. Skiljer sig 9 signifikant från 12?

I det här testet ger man en grupp samma enkät två gånger. Med ett parat t-test får du veta om genomsnittet har förändrats mellan det första och andra enkättillfället.

Exempel: Du har skickat en enkät till samma kundgrupp två gånger, en gång i april och en andra gång i maj efter att de sett en annons för ert företag. Ändrades företagets NPS efter att kunderna sett annonsen?

Kvinna som tittar på diagram på en bärbar dator

Ett t-test genomförs i fyra steg.

I det här avsnittet går vi igenom de fyra stegen med hjälp av exemplet med NPS-poäng från inledningen:

Din hypotes är att män ger företaget en lägre NPS-poäng än kvinnor. Män ger er i genomsnitt 9 i betyg, medan det genomsnittliga betyget från kvinnor är 12. Skiljer sig 9 signifikant från 12? I det här exemplet passar det att använda det tvåsidiga t-testet.

Vi tittar närmare på de olika stegen och exemplen för t-test.

Varje typ av t-test har en egen formel för att beräkna t-värdet. I det här exemplet använder vi formeln för det tvåsidiga t-testet där:

  • t är t-värdet
  • x₁ är det genomsnittliga NPS-betyget för män → 9
  • x₂ är genomsnittet för kvinnor → 12
  • n₁ är antalet män som svarade på NPS-frågan → anta till exempel att 20 män besvarade enkäten
  • n₂ är antalet kvinnor → 23 kvinnor svarade
  • s₁ är standardavvikelsen för NPS för män → anta att den beräknade standardavvikelsen är 12,48
  • s₂ är standardavvikelsen för NPS hos kvinnor → den beräknade standardavvikelsen är 10,51
formel för tvåsidigt t-test

Du kommer förmodligen att utföra t-testerna i ett kalkylblad eller ett statistikprogram (som Excel eller SPSS), men om du vill räkna för hand hittar du formlerna för de andra två typerna av t-tester nedan.

ensidigt t-test och parat t-test

Frihetsgraderna är det antal sätt genomsnittet kan variera på. I det här fallet är frihetsgraderna antalet NPS-betyg som ni kan få i en viss grupp svarande. I likhet med t-värdet kan formeln för frihetsgrader också variera beroende på vilken typ av t-test som utförs.

Den här formeln måste användas för att bestämma frihetsgrader vid tvåsidiga t-test.

formel för frihetsgrader

Det kritiska värdet är det tröskelvärde vid vilket skillnaden mellan de två talen anses vara statistiskt signifikant.

Enligt den här tabellen är det kritiska värdet för ett tvåsidigt test med en alfanivå på 0,05 och 41 frihetsgrader 2,02. Tänk på att de flesta analytiker använder ett tvåsidigt test i stället för ett ensidigt, eftersom det är mer konservativt.

Mer information om skillnaderna mellan ensidiga och tvåsidiga tester finns i den här videon från Khan Academy.

Om t-värdet är större än det kritiska värdet är skillnaden signifikant. Om t-värdet är mindre är de båda talen, statistiskt sett, omöjliga att särskilja.

I vårt exempel är det absoluta t-värdet 0,86, vilket inte är större än det kritiska värdet på 2,02, och därför kan du dra slutsatsen att män inte ger avsevärt lägre NPS-betyg än kvinnor.

När du ska tolka resultatet från ett t-test behöver du granska t-värdet, p-värdet och konfidensintervallet för att förstå om skillnaden mellan grupperna är verklig eller bara en slumpmässig variation. Sammantaget visar de här måtten hur stor skillnaden är, hur starka bevisen är och hur säker du kan var på utfallet (konfidensnivån). Frågorna och svaren nedan förklarar vad de olika delarna avslöjar och hur du analyserar resultatet från ett t-test.

T-värdet visar hur stor skillnaden mellan gruppmedelvärdena är i förhållande till variabiliteten i data. Ett högre absolut t-värde betyder att skillnaden är verklig, medan ett lägre t-värde tyder på att den kan bero på slumpen.

P-värdet anger sannolikheten för att du skulle få det här resultatet om nollhypotesen (ingen verklig skillnad) vore sann. Många team använder en gräns på 0,05, där p ≤ 0,05 tyder på en statistiskt signifikant skillnad, medan p > 0,05 tyder på att det inte finns någon meningsfull skillnad i provgruppen.

Ett konfidensintervall anger inom vilket intervall den verkliga skillnaden i medelvärden troligtvis ligger, vilket bidrar med ett större sammanhang än bara ja/nej. Om intervallet spänner över noll är effekten inte avgörande, men om det ligger helt över eller under noll är resultatet signifikant på den valda konfidensnivån.

En meningsfull skillnad är både statistiskt signifikant och praktiskt viktig. Titta på den uppskattade effektstorleken och konfidensintervallet för att få en bild av hur stor skillnaden kan vara och om den är relevant för beslutet.

Större provgrupper minskar variabiliteten, ger snävare konfidensintervall och gör det lättare att identifiera verkliga skillnader. Mindre provgrupper ger större osäkerhet och gör det svårare att tolka gränsfall.

En tydlig resultatöversikt över t-testet visar varför du gjorde jämförelsen, vad testet avslöjade och hur säker du kan vara på skillnaden mellan grupperna. Din uppgift är att översätta det statistiska resultatet till vanlig svenska, koppla det till ursprungsfrågan och lyfta fram utfallets betydelse för de beslut som ska tas.

Ta med följande viktiga element när du sammanfattar resultatet av ett t-test:

  1. Redovisa syftet. Börja med att förklara varför du genomförde ett t-test och vad syftet var. Du kan till exempel förklara att du använder ett t-test för att undersöka om det finns en statistiskt signifikant skillnad mellan medelvärdena för två grupper i ett enkätresultat.
  2. Dela beskrivande statistik. Lyft fram medelvärde och standardavvikelse för varje grupp som utvärderas. Då får intressenterna det sammanhang som behövs för att förstå de observerade skillnaderna. Ange också provgruppsstorlekarna för respektive grupp som ytterligare bakgrund.
  3. Presentera resultatet av t-testet. Redovisa t-värde, frihetsgrader, p-värde samt analys av konfidensintervallet (om du har gjort en sådan).
  4. Dela slutsatserna. Till sist är det dags att dela slutsatserna med intressenterna. Diskutera kortfattat om skillnaden var statistiskt signifikant och vad det innebär för hypotesen eller forskningsfrågan.
  5. Föreslå nästa steg. Förklara för intressenterna vad forskningsresultatet betyder för företaget. Berätta vilka åtgärder eller beslut som kan påverkas av resultatet.

Om du kan undvika vissa enkla misstag kan du få mer tillförlitliga och tydliga resultat utifrån enkätdata i t-testet.

  • Att jaga låga p-värden utan att undersöka den faktiska skillnaden. Ett resultat kan vara ”statistiskt signifikant” även om skillnaden mellan grupperna är för liten för att spela någon roll. Beakta storleken på skillnaden och konfidensintervallet för att avgöra om den är meningsfull.
  • Att jämföra många grupper utan att justera metodiken. Om du testar många segment eller frågor ökar risken att du av en slump hittar en skillnad. Börja med bredare tester som variansanalys eller använd enkla korrigeringar när du gör flera t-tester.
  • Att avbryta A/B-tester för tidigt. Om du kollar resultatet ofta och avslutar testet så fort det ser lovande ut kan det leda till felaktiga slutsatser. Bestäm dig för en provgruppsstorlek eller tidsram innan du börjar.
  • Att använda t-test för fel typ av data. Om frågan använder rankning eller betygsskalor som gett mycket snedvrida resultat passar ett t-test sällan bra, eftersom medelvärdena kan vara missvisande. Se till att data är jämnt fördelade och inte är snedvridna.
  • Att hoppa över de grundläggande förutsättningarna. T-tester fungerar bäst när svaren är oberoende och grupperna har hyfsat likartad variabilitet. Om spridningen mellan grupperna är stor väljer du i stället Welchs t-test för ett mer tillförlitligt resultat.
  • T-tester jämfört med variansanalys
  • Z-tester jämfört med t-tester

T-tester används för att avgöra om skillnaden i medelvärden mellan två provgrupper är statistiskt signifikant. Du kan använda t-tester vid analys av enkätdata för att visa hur tillförlitliga data är.

Med SurveyMonkey kan du effektivisera arbetet med att skapa och skicka enkäter till provgrupper för organisationens forskningsbehov. Med SurveyMonkey kan du ta fram marknadsundersökningar och frågeformulär från grunden eller välja bland våra fler än 400 färdiga enkätmallar.

Kom igång med att samla in enkätdata för analys redan idag och hjälp organisationen att fatta bättre beslut och utvecklas. Skapa ett kostnadsfritt konto idag.

NPS, Net Promoter och Net Promoter® Score är registrerade varumärken som tillhör Satmetrix Systems, Inc., Bain & Company och Fred Reichheld.

Kvinna med hijab som tittar på forskningsinsikter på en bärbar dator

SurveyMonkey kan hjälpa dig att göra ett bättre jobb. Ta reda på hur du får större genomslag med vinnande strategier, produkter, upplevelser och mycket mer.

En man och kvinna tittar på en artikel på en bärbar dator och skriver information på notislappar

Upptäck hur Hornblower använder SurveyMonkey och AI för att få ut mesta möjliga av NPS-data, samla in kundinsikter och förbättra kundupplevelsen.

Leende man med glasögon som använder en bärbar dator

Förbättra varumärket med vår mall för enkäter om varumärkesspårning. Ställ de rätta frågorna som rekommenderas av experter för att mäta ert varumärkeskapital.

Kvinna som tittar på information på sin bärbara dator

Produkter och tjänster för konsumenter – inklusive snabbrörliga konsumentvaror, resor och hotell – förlitar sig på SurveyMonkey-insikter.