Strona główna SPSS i Excel Jak w SPSS wykonać analizę mocy testu i oszacować liczebność próby do...

SPSS i Excel

Jak w SPSS wykonać analizę mocy testu i oszacować liczebność próby do badania?

Przez

Robert Błaszczyk

22 maja, 2026

Analityk przy laptopie przeglądający wykresy danych w biurze — Źródło: Pexels | Autor: Kampus Production

Rate this post

Nawigacja po artykule:

Po co w ogóle liczyć moc testu i wielkość próby?

Różnica między „czy wyjdzie istotnie” a „czy wynik ma sens praktyczny”

W planowaniu badania ilościowego kluczowe pytanie rzadko brzmi tylko: „czy wynik będzie istotny statystycznie?”. Znacznie ważniejsze jest: czy efekt, który chcesz wykryć, ma znaczenie praktyczne oraz czy Twoje narzędzia (w tym liczebność próby) pozwolą taki efekt w ogóle zauważyć.

Istotność statystyczna (p < 0,05) zależy od trzech głównych elementów: wielkości efektu, liczebności próby oraz poziomu istotności alfa. Przy bardzo dużych próbach nawet minimalne, mało istotne praktycznie różnice mogą okazać się „istotne statystycznie”. Przy małych próbach bywa odwrotnie – efekt może być ciekawy i użyteczny, ale test jest zbyt mało czuły, by go wykryć.

Analiza mocy testu w SPSS pozwala zaplanować badanie tak, aby:

mieć sensowną szansę wykrycia efektu o interesującej wielkości,
nie marnować czasu i środków na niepotrzebnie duże próby,
świadomie dobrać poziom alfa i moc w zależności od celu badania.

Inaczej mówiąc – nie chodzi o to, by „p wyszło < 0,05 za wszelką cenę”, tylko by zaplanować takie N, które odpowiada na realne pytanie badawcze i ograniczenia projektu.

Konsekwencje zbyt małej i zbyt dużej próby

Zbyt mała próba oznacza niską moc testu (power), czyli wysokie ryzyko błędu II rodzaju (nieodrzucenia fałszywej hipotezy zerowej). Przekłada się to na sytuacje, w których:

nie wykrywasz realnych różnic między grupami,
wniosek „brak istotnych różnic” jest tak naprawdę „nie było wystarczająco danych, by to ocenić”,
praca magisterska, raport lub projekt naukowy traci na wiarygodności, bo każdą nieistotność można zbyć stwierdzeniem, że „może próba była za mała”.

Z kolei zbyt duża próba to inny zestaw problemów:

marnujesz zasoby (czas, budżet, energię badanych),
ryzykujesz uzyskanie „istotnych” efektów, które są statystycznie wykrywalne, ale praktycznie znikome,
w projektach komercyjnych płacisz za niepotrzebnie rozbudowane badania.

W badaniach studenckich problemem jest zwykle zbyt mała próba, bo trudno zrekrutować uczestników. W projektach komercyjnych – często przeciwnie: zbiera się dane „na wszelki wypadek”, bez przemyślanej analizy mocy testu.

Moc, koszt badania i czas realizacji – jak to się łączy

Planowanie wielkości próby to zawsze kompromis. Wyższa moc testu (np. 0,90 zamiast 0,80) oznacza wyraźnie większe wymagane N. Skutki są proste:

więcej dni rekrutacji uczestników,
wyższe koszty (wynagrodzenia, licencje, dostęp do paneli badawczych),
duża ilość danych do obróbki i analiz.

Z drugiej strony niższa moc (np. 0,70) może być akceptowalna w projektach pilotażowych, gdy celem jest eksploracja, a nie ostateczne potwierdzenie hipotez. Tam, gdzie decyzje biznesowe lub medyczne opierają się na wynikach badania, moc 0,80 to minimum, a często wymaga się 0,90.

Badania eksploracyjne a potwierdzające – różne standardy planowania mocy

Warto odróżnić dwa typy badań:

eksploracyjne – szukanie związków, tworzenie hipotez, pilotaże,
potwierdzające – testowanie konkretnych hipotez, np. w eksperymentach, RCT, badaniach klinicznych.

W badaniach eksploracyjnych analiza mocy testu bywa bardziej elastyczna. Można przyjąć nieco niższą moc lub mniejszą precyzję oszacowania efektu, bo wnioski służą głównie do zaplanowania właściwego, większego badania. W badaniach potwierdzających zbyt niska moc jest poważnym problemem metodologicznym – wyniki trudno obronić przed recenzentami czy klientem.

SPSS (szczególnie z dodatkiem SamplePower) pozwala dopasować wymaganą liczebność próby do rodzaju projektu. Pierwszy krok to jasne określenie, czy planujesz eksplorację, czy chcesz postawić mocny, potwierdzający wniosek.

Podstawowe pojęcia: moc, alfa, beta, wielkość efektu

Poziom istotności alfa i błąd I rodzaju

Poziom istotności alfa (α) to maksymalne akceptowane prawdopodobieństwo popełnienia błędu I rodzaju, czyli odrzucenia prawdziwej hipotezy zerowej. Standardowo przyjmuje się α = 0,05, ale w niektórych dziedzinach używa się 0,01 lub nawet 0,001.

W praktyce „p < 0,05” oznacza: jeśli hipoteza zerowa jest w rzeczywistości prawdziwa, to uzyskanie tak ekstremalnego wyniku lub bardziej ekstremalnego zdarza się z prawdopodobieństwem mniejszym niż 5%. To nie znaczy, że prawdopodobieństwo, iż hipoteza zerowa jest prawdziwa, wynosi 5% – to częste nieporozumienie.

W kontekście planowania próby, niższe alfa (np. 0,01 zamiast 0,05) wymaga większego N, aby utrzymać tę samą moc testu. Dlatego w SPSS/SamplePower trzeba konsekwentnie ustawiać taki poziom alfa, jaki zamieszczasz w planie badania i opisie metod.

Błąd II rodzaju (beta) i moc testu (1 – beta)

Błąd II rodzaju, oznaczany jako beta (β), to sytuacja, w której nie odrzucasz hipotezy zerowej, mimo że jest ona fałszywa. Mówiąc prościej – efekt istnieje, ale go „nie widzisz”, bo test jest za słaby.

Moc testu to 1 − β, czyli prawdopodobieństwo poprawnego odrzucenia fałszywej hipotezy zerowej. Standardem jest moc 0,80 (β = 0,20), co oznacza 80% szans wykrycia efektu o założonej wielkości, przy danym N i alfa. W bardziej wymagających dziedzinach oczekuje się mocy 0,90 lub wyższej.

W SPSS (lub w dodatku SamplePower) można ustawić:

czy chcesz oszacować wymaganą liczebność próby dla zadanej mocy,
czy interesuje Cię moc testu przy już danej próbie.

W obu przypadkach kluczowe jest określenie przewidywanej wielkości efektu – bez tego wyniki analizy mocy będą niewiele warte.

Wielkość efektu: Cohen d, eta-kwadrat, r

Istotność p mówi, czy efekt można odróżnić od zera przy danym N. Wielkość efektu mówi, jak duży jest ten efekt w praktyce. Dla różnych testów stosuje się inne miary:

Cohen d – różnica między dwiema średnimi, wyrażona w jednostkach odchylenia standardowego (testy t),
eta-kwadrat (η²) lub częściowa eta-kwadrat – dla ANOVA,
r (współczynnik korelacji) – dla związków między zmiennymi,
f (Cohen f) – używany w analizach mocy dla ANOVA.

Przykładowe „standardowe” interpretacje (wg Cohena, bardzo ogólnie):

d ≈ 0,20 – efekt mały,
d ≈ 0,50 – efekt średni,
d ≈ 0,80 – efekt duży.

SPSS zwykle raportuje wielkości efektu po wykonaniu testu (np. eta-kwadrat w ANOVA). Do analizy mocy przed badaniem trzeba je jednak oszacować z:

wcześniejszych badań (metaanalizy, literatura),
pilotażu (mała, wstępna próba),
założeń praktycznych – jak duża różnica jest realnie ważna (np. różnica 5 punktów na skali vs 1 punkt).

Jak alfa, beta, wielkość efektu i liczebność próby są powiązane

Te cztery elementy są ściśle powiązane. Można je porównać do czterech pokręteł w jednym urządzeniu – kręcenie jednym zmusza do korekty pozostałych, jeśli chcesz zachować jakość.

większe N → wyższa moc (przy stałym alfa i efekcie),
większy efekt → wyższa moc przy tym samym N,
niższe alfa (np. 0,01 zamiast 0,05) → niższa moc przy stałym N,
wyższa wymagana moc (np. 0,90 zamiast 0,80) → wymaga większego N przy tych samych pozostałych parametrach.

Analiza mocy testu w SPSS polega na ustawieniu trzech z tych parametrów i obliczeniu czwartego (np. ustawiasz alfa, moc i efekt, a SPSS wylicza wymaganą liczebność próby). Świadome operowanie tymi „pokrętłami” odróżnia dobrze zaprojektowane badanie od losowego zbierania danych.

Jak SPSS podchodzi do analizy mocy – możliwości i ograniczenia

SPSS bazowy a dodatek SamplePower

Podstawowa instalacja IBM SPSS Statistics zawiera gotowe testy (t, ANOVA, korelacje, regresję), ale nie oferuje pełnej, interaktywnej analizy mocy testu tak wygodnej jak specjalne narzędzia. W standardowym SPSS można:

po wykonaniu testu wyliczyć niektóre miary efektu,
czasem oszacować moc post-hoc (w wybranych procedurach),
ręcznie korzystać z formuł i wzorów w połączeniu z wynikami z SPSS.

IBM oferuje jednak osobny produkt – SPSS SamplePower, zaprojektowany właśnie do planowania badań i analizy mocy. To osobna aplikacja (nie tylko dodatek), która integruje się koncepcyjnie z SPSS, ale działa jako niezależny program.

W SamplePower można m.in.:

wybierać typ testu (t, ANOVA, korelacje, regresja, proporcje, chi-kwadrat),
ustawiać alfa, moc, wielkość efektu, liczebności grup,
rysować wykresy zależności mocy od N,
obliczać zarówno wymagane N, jak i moc przy zadanym N.

Kiedy wystarczy „ręczne” oszacowanie mocy na podstawie wyników SPSS

Jeśli masz tylko podstawową wersję SPSS, bez SamplePower, nie oznacza to, że jesteś całkowicie odcięty od analizy mocy testu. Istnieją dwa główne scenariusze:

analiza post-hoc – badanie jest już wykonane, masz wyniki testów (np. t, ANOVA) i chcesz ocenić moc uzyskaną w praktyce,
planowanie kolejnego badania na podstawie wyników pierwszego (np. pilotażu).

W takim przypadku możesz:

Wyciągnąć z SPSS dane:
- liczebność próby (N),
- wielkość efektu (np. Cohen d, eta-kwadrat, r) – czasem trzeba je obliczyć z wyników,
- zastosowany poziom alfa.
Wprowadzić je do zewnętrznego narzędzia (np. G*Power) i obliczyć moc post-hoc lub dobrą wielkość próby dla kolejnego badania.

To rozwiązanie jest mniej wygodne niż korzystanie z SamplePower, ale dla wielu prac magisterskich i doktorskich w zupełności wystarczy. Sam SPSS pełni wtedy rolę „dostawcy parametrów”, a właściwa analiza mocy odbywa się poza nim.

Porównanie z G*Power i Excelem

G*Power to darmowy program do analizy mocy testu, popularny szczególnie w środowisku akademickim. W zestawieniu ze SPSS/SamplePower wygląda to mniej więcej tak:

Osoba analizuje wykresy statystyczne na laptopie w nowoczesnym biurze — Źródło: Pexels | Autor: RDNE Stock project

Narzędzie	Zakres testów	Łatwość obsługi	Koszt
SPSS (podstawowy)	Testy statystyczne, ograniczone wsparcie mocy	Średnia	Wysoki (licencja)
SPSS SamplePower	Szeroki zakres, dedykowana analiza mocy	Wysoka (interaktywne okna)	Wysoki (oddzielny produkt)
G*Power	Wiele testów, w tym t, ANOVA, korelacje, regresja	Średnia (interfejs mniej „biznesowy”)	Bezpłatny
Excel (z formułami / dodatkami)	Ręczne obliczenia lub gotowe szablony	Niska–średnia (wymaga znajomości wzorów)	Zależny od licencji Office

Po co w ogóle liczyć moc testu i wielkość próby?

Różnica między „czy wyjdzie istotnie” a „czy wynik ma sens praktyczny”

Konsekwencje zbyt małej i zbyt dużej próby

Moc, koszt badania i czas realizacji – jak to się łączy

Badania eksploracyjne a potwierdzające – różne standardy planowania mocy

Podstawowe pojęcia: moc, alfa, beta, wielkość efektu

Poziom istotności alfa i błąd I rodzaju

Błąd II rodzaju (beta) i moc testu (1 – beta)

Wielkość efektu: Cohen d, eta-kwadrat, r

Jak alfa, beta, wielkość efektu i liczebność próby są powiązane

Jak SPSS podchodzi do analizy mocy – możliwości i ograniczenia

SPSS bazowy a dodatek SamplePower

Kiedy wystarczy „ręczne” oszacowanie mocy na podstawie wyników SPSS

Porównanie z G*Power i Excelem

Przygotowanie do analizy mocy: co trzeba ustalić przed otwarciem SPSS

Precyzyjne pytanie badawcze zamiast „zobaczymy, co wyjdzie”

Wybór kierunku testu: jednostronny vs dwustronny

Źródło założeń o wielkości efektu

Założenia dotyczące rozkładów i wariancji

Analiza mocy dla testu t-Studenta w SPSS SamplePower krok po kroku

Wybór typu testu t i scenariusza

Konfiguracja analizy mocy dla dwóch niezależnych grup

Wariant: t test dla prób zależnych i jego konsekwencje dla mocy

Sprawdzanie, jak moc zmienia się wraz z N

Analiza mocy dla ANOVA i testów wielogrupowych

Jednoczynnikowa ANOVA: od Cohen f do N na grupę

ANOVA z nierównymi grupami i konsekwencje dla mocy

ANOVA wieloczynnikowa: efekty główne i interakcje

Kontrasty planowane vs porównania post-hoc

Korelacje i regresja: szacowanie mocy dla związków między zmiennymi

Prosta korelacja: od r do wymaganej liczebności próby

Regresja wieloraka: liczba predyktorów a moc

Jak definiować efekt w regresji: R² całkowite vs przyrostowe

Liczba predyktorów a „gęstość” modelu

Regresja a korelacje między predyktorami (współliniowość)

Regresja logistyczna i rzadkie zdarzenia

Regresja hierarchiczna a planowanie mocy na etapy

Jak weryfikować założenia i ich wpływ na moc testu

Normalność rozkładu: jak daleko można ją naruszyć

Homogeniczność wariancji i jej skutki dla mocy

Niesymetryczne rozkłady i dane skośne: transformować czy zmieniać test?

Zobacz także: