Strona główna Analiza ankiet i skale Ankieta a dane nominalne: jak testować związki i opisać siłę efektu

Analiza ankiet i skale

Ankieta a dane nominalne: jak testować związki i opisać siłę efektu

Przez

Ryszard Domański

13 marca, 2026

135

Dłoń z długopisem analizuje kolorowe wykresy słupkowe i liniowe — Źródło: Pexels | Autor: Lukas Blazek

1/5 - (2 votes)

Nawigacja po artykule:

Dane nominalne w ankiecie – co to w praktyce oznacza

Definicja danych nominalnych na tle innych skal

Dane nominalne to odpowiedzi, które da się jedynie zaklasyfikować do kategorii, bez sensownego porządkowania ich od „mniej” do „więcej”. Każda kategoria jest po prostu inną etykietą, a jedyne, co można powiedzieć, to to, że są takie same lub różne.

Na tle pozostałych skal pomiaru różnica wygląda tak:

Skala nominalna – kategorie bez porządku: płeć, województwo, marka telefonu, typ szkoły.
Skala porządkowa – kategorie z naturalnym porządkiem, ale bez stałych odstępów: ocena w skali „zdecydowanie się nie zgadzam – zdecydowanie się zgadzam”, ocena zadowolenia „niska – średnia – wysoka”.
Skala interwałowa – liczby, gdzie różnice mają znaczenie, ale zero jest umowne: temperatura w °C.
Skala ilorazowa – liczby ze „ścisłym zerem” i sensownym ilorazem: wiek, dochód, liczba dzieci.

W ankietach dane nominalne pojawiają się bardzo często, bo większość pytań opisuje przynależność do grup, a nie poziom nasilenia cechy. To ma bezpośrednie skutki dla późniejszych testów statystycznych.

Typowe pytania ankietowe dające dane nominalne

Najczęściej dane nominalne pojawiają się w pytaniach metryczkowych i klasyfikacyjnych. Kilka klasycznych przykładów:

Płeć – np. „kobieta”, „mężczyzna”, „inna / nie chcę podawać”.
Województwo – 16 możliwych odpowiedzi.
Rodzaj szkoły – szkoła podstawowa, liceum, technikum, szkoła branżowa.
Typ umowy – umowa o pracę, zlecenie, dzieło, B2B, brak umowy.
Marka – marka telefonu, samochodu, sklepu.
Kategoria odpowiedzi – np. ulubiony kanał informacji: telewizja, radio, Internet, prasa, inne.

W każdym z tych przypadków trudno sensownie powiedzieć, że „województwo A jest większe od województwa B” czy że „umowa zlecenie jest wyżej od umowy o dzieło”. Kategoriom nie da się przypisać naturalnego porządku – to typowa cecha danych nominalnych w ankiecie.

Nominalna a porządkowa – subtelna, ale ważna różnica

Granica między skalą nominalną a porządkową bywa myląca. Dla danych nominalnych kolejność odpowiedzi jest techniczna (jak je wypiszesz w ankiecie), natomiast dla danych porządkowych kolejność odzwierciedla realne nasilenie cechy.

Porównanie na przykładzie:

Dane nominalne: płeć (kobieta, mężczyzna, inne), województwo (dolnośląskie, kujawsko-pomorskie itd.). Nie ma sensu mówić, że „kobieta > mężczyzna” lub że „województwo A < województwo B”.
Dane porządkowe: skala Likerta „zdecydowanie się nie zgadzam – nie zgadzam się – trudno powiedzieć – zgadzam się – zdecydowanie się zgadzam”. Tutaj odpowiedzi układają się od mniejszej do większej zgody.

Dla użytkownika ankiety oznacza to, że inne testy statystyczne będą odpowiednie dla danych nominalnych, a inne dla porządkowych. Skala Likerta (porządkowa) często bywa traktowana jak ilościowa, ale już pytanie o płeć albo typ szkoły nie może być w ten sposób „uśrednione”.

Co można, a czego nie można liczyć dla danych nominalnych

Najczęstsze nieporozumienia wynikają z prób stosowania do danych nominalnych narzędzi przeznaczonych dla liczb. Przy danych nominalnych można liczyć przede wszystkim:

liczebności odpowiedzi (ile osób wybrało daną kategorię),
procenty i odsetki,
modę (najczęściej występującą kategorię),
tabele krzyżowe (rozkłady łączone dla dwóch lub więcej zmiennych nominalnych).

Z kolei nie ma sensu liczyć:

średniej arytmetycznej z kodów (np. „średnia płeć = 1,6”),
odchylenia standardowego, wariancji,
korelacji Pearsona (bo opiera się na przyjęciu ilościowego charakteru danych).

Kody liczbowe, które przypisujemy kategoriom (1 = kobieta, 2 = mężczyzna itd.), są tylko etykietami, a nie prawdziwymi liczbami pomiarowymi. Ich średnia nie ma interpretacji.

Konsekwencje dla doboru testów i interpretacji

Skoro dla danych nominalnych porównujemy głównie rozkłady częstości, to kluczowe stają się testy oparte na tabelach krzyżowych. Zdecydowana większość analiz opiera się na pytaniu: czy rozkłady w kategoriach różnią się istotnie między grupami, czy przypominają losowy rozkład?

Dla danych nominalnych stosuje się zatem takie narzędzia jak:

test niezależności chi-kwadrat dla tabel RxC,
test dokładny Fishera dla małych tabel 2×2,
test McNemary’ego dla pytań tak/nie w parach pomiarów (przed–po),
współczynniki siły związku: V Craméra, phi, lambda.

Istotność statystyczna mówi, że związek między kategoriami nie jest przypadkowy, ale nie odpowiada na pytanie, jak silny jest ten związek i czy ma praktyczne znaczenie. Do tego służy opis siły efektu, do którego jeszcze wrócimy.

Jakie związki da się badać na danych nominalnych

Typowe pytania badawcze przy danych jakościowych

Dane nominalne w ankiecie prowadzą zwykle do kilku prostych, ale ważnych pytań badawczych. W praktyce sprowadzają się one do dwóch typów:

Czy istnieje związek między dwiema zmiennymi nominalnymi?
Przykład: „Czy istnieje związek między płcią a wyborem kanału informacji?”
Czy rozkład odpowiedzi różni się między grupami?
Przykład: „Czy rozkład wyboru profilu klasy różni się między liceum a technikum?”

W obu przypadkach używa się często tej samej procedury statystycznej (np. testu chi-kwadrat), ale inaczej formułuje się pytanie i wniosek. Z jednej strony mówi się o zależności, z drugiej o różnicach w rozkładzie.

Zależność a różnica rozkładów – dwie strony tej samej monety

Współwystępowanie kategorii można opisać na dwa sposoby:

„Czy zmienna A jest zależna od zmiennej B?” – np. „Czy wybór kanału informacji zależy od płci?”.
„Czy rozkład odpowiedzi na zmienną A jest taki sam w różnych kategoriach zmiennej B?” – np. „Czy rozkład wyboru kanału informacji jest taki sam wśród kobiet i mężczyzn?”.

Matematycznie to ten sam problem: sprawdzenie, czy rozkłady różnią się od tego, co byłoby oczekiwane przy braku związku. W testach dla danych nominalnych bada się więc, czy zaobserwowane liczebności w tabeli krzyżowej odbiegają istotnie od liczebności oczekiwanych przy założeniu niezależności.

Przykłady praktyczne z ankiet

Kilka przykładów, z jakimi spotykają się najczęściej autorzy prac dyplomowych i raportów:

Płeć a kanał informacji
Pytanie: „Skąd najczęściej czerpiesz informacje o aktualnościach?” – odpowiedzi: telewizja, radio, Internet, prasa. Zmienna druga: płeć (kobieta, mężczyzna). Pytamy: czy proporcje wyboru kanału różnią się między kobietami i mężczyznami?
Typ szkoły a wybór profilu klasy
Zmienna 1: typ szkoły średniej (liceum, technikum, szkoła branżowa). Zmienna 2: wybrany profil klasy (humanistyczny, matematyczny, zawodowy, ogólny). Pytanie badawcze: czy typ szkoły jest powiązany z wyborem profilu?
Rodzaj umowy a chęć zmiany pracy
Zmienna 1: typ umowy (umowa o pracę, zlecenie, B2B). Zmienna 2: odpowiedź na pytanie „Czy w najbliższym roku planujesz zmienić pracę?” (tak, nie, trudno powiedzieć). Analiza sprawdza, czy rozkład odpowiedzi różni się między poszczególnymi typami umów.

Te sytuacje mają wspólny rdzeń: w każdej chodzi o to, czy pewne kategorie występują częściej razem, niż można by oczekiwać przy losowym rozkładzie.

Co wiadomo, a czego nie da się stwierdzić

Testy dla danych nominalnych pozwalają odpowiedzieć na kilka kluczowych pytań:

czy rozkład odpowiedzi jest równomierny, czy „przechylony” w stronę konkretnych kategorii,
czy rozkłady w dwóch (lub więcej) grupach są podobne, czy różne,
czy istnieje statystycznie istotny związek między dwiema zmiennymi nominalnymi,
jak silny jest ten związek (opis siły efektu, np. V Craméra).

Pozostaje jednak ważne ograniczenie: dane nominalne z ankiet nie pozwalają na wnioskowanie przyczynowe. Jeśli z testu chi-kwadrat wychodzi związek między typem szkoły a wyborem profilu, nie oznacza to automatycznie, że typ szkoły „powoduje” określony wybór. Co wiemy? Że kategorie współwystępują częściej, niż wynikałoby to z czystego przypadku. Czego nie wiemy? Kierunku wpływu i roli innych czynników (np. sytuacji rodzinnej, wyników w nauce).

Bizneswoman pokazuje na tabliczce wyniki ankiety w formie wykresu słupkowego — Źródło: Pexels | Autor: RDNE Stock project

Jak przygotować dane nominalne do analizy – od ankiety do tabeli

Kodowanie odpowiedzi nominalnych jako etykiet liczb

Pierwszy krok w analizie danych nominalnych to kodowanie odpowiedzi. Surowe odpowiedzi tekstowe („kobieta”, „mężczyzna”, „Internet”) trzeba zamienić na kody, które da się przeliczyć w programie statystycznym lub w Excelu.

Najprostsze zasady kodowania:

każda kategoria otrzymuje unikalny numer,
numery nie oznaczają stopnia – są tylko etykietami,
schemat kodowania warto opisać w osobnej tabeli (tzw. słownik zmiennych).

Przykład kodowania zmiennej „płeć”:

1 – kobieta,
2 – mężczyzna,
9 – nie chcę podawać (kod „specjalny”, często traktowany jako brak danych).

Podobnie koduje się inne zmienne nominalne. Ważne, by w analizie nie interpretować liczb 1, 2, 3 jako wartości ilościowych, tylko jako etykiety kategorii.

Odpowiedzi „inne, jakie?” i braki danych

W ankietach nominalnych często pojawia się opcja „inne, jakie?”. To wygodne dla respondenta, ale analitycznie wymaga decyzji:

czy odpowiedzi otwarte da się pogrupować w nowe sensowne kategorie,
czy należy pozostawić je jako jedną zbiorczą kategorię „inne”,
czy są to odpowiedzi jednostkowe, których nie da się sensownie analizować i które trzeba potraktować jako „pozostałe”.

Braki danych (puste pola, odpowiedź „nie dotyczy”, „odmowa odpowiedzi”) także wymagają jednoznacznego kodu, np. 99 lub -1. W testach statystycznych zazwyczaj nie włącza się ich do analiz (traktuje jako brak danych), żeby nie zaburzać rozkładów.

Przejrzyste podejście do kodowania braków i odpowiedzi „inne” powinno być opisane w metodologii pracy dyplomowej lub raportu, aby czytelnik wiedział, jak powstały analizowane tabele krzyżowe.

Tworzenie tabeli krzyżowej – konstrukcja i logika

Centralnym narzędziem analizy danych nominalnych jest tabela krzyżowa (crosstab). Przedstawia ona liczebności odpowiedzi dla kombinacji kategorii dwóch zmiennych.

Struktura tabeli krzyżowej:

wiersze – kategorie jednej zmiennej (np. płeć),
kolumny – kategorie drugiej zmiennej (np. kanał informacji),
komórki – liczba osób, które należą jednocześnie do danej kategorii w wierszu i kolumnie,
wiersz i kolumna sumaryczna – łączna liczba obserwacji w danym wierszu/kolumnie oraz całkowita liczba przypadków.

W Excelu można utworzyć tabelę krzyżową ręcznie (za pomocą funkcji LICZ.JEŻELI / LICZ.WARUNKI) lub skorzystać z tabeli przestawnej. Programy statystyczne (SPSS, R, Jamovi) mają do tego dedykowane moduły.

Minimalne wymagania do analizy – liczebności i braki

Aby testy statystyczne dla danych nominalnych (np. chi-kwadrat) miały sens, konieczne są pewne warunki techniczne:

Warunki stosowania testów – kiedy chi-kwadrat ma sens

Przed obliczeniem testu chi-kwadrat trzeba sprawdzić, czy dane spełniają minimalne wymogi techniczne. W przeciwnym razie wynik będzie wątpliwy.

Wystarczające liczebności w komórkach
Standardowa zasada: przynajmniej 80% komórek powinno mieć oczekiwaną liczebność ≥ 5, a żadna komórka nie powinna mieć oczekiwanej liczebności < 1. Jeśli wiele komórek ma bardzo małe liczebności (np. 0–2), klasyczny test chi-kwadrat jest obarczony dużym błędem.
Wzajemna wyłączność kategorii
Każdy respondent powinien trafić do jednej kategorii danej zmiennej w tabeli. Jeśli ktoś ma kilka odpowiedzi (np. zaznaczył dwa kanały informacji), to taka obserwacja nie pasuje do prostej tabeli krzyżowej 1×1 i wymaga innego podejścia (o tym szerzej przy pytaniach wielokrotnego wyboru).
Niezależność obserwacji
Każdy wiersz w danych powinien pochodzić od innej osoby. Dane „zagnieżdżone” (np. kilku uczniów z jednej klasy, kilku pracowników z jednego zespołu) formalnie naruszają założenie niezależności, ale przy prostych pracach dyplomowych zwykle się tego nie modeluje. W raportach badawczych warto ten punkt przynajmniej odnotować.
Spójne traktowanie braków
Przed analizą trzeba zadecydować, czy kategorie typu „nie dotyczy” lub „odmowa odpowiedzi” wchodzą do tabeli jako pełnoprawne kategorie, czy są traktowane jako braki i usuwane z danego testu. Z reguły przy zmiennych demograficznych pomija się je w analizie związku.

Jeśli warunki nie są spełnione, pojawia się pytanie: co można zrobić? Najczęstsze rozwiązania to łączenie rzadkich kategorii, zmiana testu (np. na test dokładny Fishera) albo ograniczenie analizy do podzbioru danych.

Najważniejsze testy dla danych nominalnych – przegląd z kryteriami wyboru

Test niezależności chi-kwadrat – „koń roboczy” analiz nominalnych

Test chi-kwadrat niezależności stosuje się, gdy mamy dwie zmienne nominalne i każda obserwacja występuje w tabeli tylko raz. Typowy układ to tabele 2×2 (np. płeć × odpowiedź tak/nie) oraz większe, np. 3×4, 4×5.

Zastosowania:

porównanie rozkładu odpowiedzi między dwiema grupami (np. płeć × źródło informacji),
badanie ogólnego związku pomiędzy kilkoma kategoriami (np. typ szkoły × profil klasy),
analiza wyników prostych eksperymentów, gdy wynik ma postać „sukces/porażka” w kilku grupach.

Co mówi wynik? Informuje, czy cała tabela jako całość odbiega od rozkładu oczekiwanego przy założeniu braku związku. Nie mówi natomiast, w której konkretnej komórce występuje największa różnica – to trzeba dopiero podejrzeć w liczebnościach, procentach i ewentualnych analizach post-hoc.

Test dokładny Fishera – gdy liczebności są bardzo małe

W małych próbach test chi-kwadrat może „nie wyrabiać”. Alternatywą jest test dokładny Fishera, stosowany zwykle dla tabel 2×2, gdy liczebności są niskie lub nierównomierne.

Kiedy używa się Fishera?

łączna liczba obserwacji jest niewielka (np. poniżej 40–50),
sporo komórek ma oczekiwane liczebności < 5,
interesuje nas bardzo precyzyjne oszacowanie p-value w małej próbie.

Test Fishera oblicza dokładne prawdopodobieństwo uzyskania takiej lub bardziej skrajnej tabeli przy założeniu braku związku. Jest więc bardziej „konserwatywny” przy małych liczebnościach. Wadą jest ograniczenie głównie do układu 2×2 i większe obciążenie obliczeniowe przy większych tabelach (w praktyce programy statystyczne zwykle je liczą tylko w prostych układach).

Test McNemary’ego – dane sparowane przed–po

W badaniach ankietowych często pojawiają się dane sparowane: ten sam respondent odpowiada na pytanie dwukrotnie – przed interwencją i po niej, albo w dwóch różnych warunkach. Przy odpowiedziach tak/nie używa się wtedy testu McNemary’ego.

Przykład: badanie skuteczności krótkiego szkolenia BHP. Respondent odpowiada na pytanie „Czy znasz procedurę ewakuacji?” przed szkoleniem i po nim (tak/nie). Interesuje nas, czy odsetek odpowiedzi „tak” wzrósł po szkoleniu. Nie porównujemy tu dwóch niezależnych grup, lecz zmianę w tej samej grupie.

Kluczowa różnica względem testu chi-kwadrat: McNemary opiera się na niezgodnościach (osoby, które zmieniły odpowiedź), a nie na prostym porównaniu struktur między grupami.

Testy zgodności rozkładu – chi-kwadrat jednowymiarowy

Dane nominalne można badać także w kontekście jednowymiarowym: czy rozkład kategorii w jednej zmiennej jest taki, jak zakładamy teoretycznie? Służy do tego test chi-kwadrat zgodności rozkładu.

Przykładowe zastosowania:

sprawdzenie, czy rozkład płci w próbie odbiega od struktury populacji (np. 50/50),
weryfikacja, czy odpowiedzi na pytanie z czterema wariantami są równomiernie rozłożone,
porównanie faktycznego udziału marek w ankiecie z udziałem rynkowym deklarowanym przez firmę.

Hipoteza zerowa: rozkład obserwowany nie różni się od rozkładu oczekiwanego (np. równomiernego albo wynikającego z danych zewnętrznych). Wynik dodatni mówi, że kategorie występują w innych proporcjach, niż założono.

Jak dobrać test – krótka mapa decyzji

Przy projektowaniu analizy pomaga kilka prostych pytań:

Ile zmiennych nominalnych porównujesz naraz?
Jedna zmienna vs rozkład teoretyczny –> chi-kwadrat zgodności.
Dwie zmienne –> test niezależności chi-kwadrat lub alternatywa (Fisher, McNemary).
Czy dane są niezależne, czy sparowane?
Niezależne grupy –> chi-kwadrat niezależności / Fisher.
Te same osoby w dwóch pomiarach –> McNemary (przy odpowiedziach dwukategorialnych).
Jak duże są liczebności w komórkach?
Głównie >= 5 –> klasyczny chi-kwadrat.
Wiele komórek z małymi liczebnościami –> Fisher (2×2) lub łączenie kategorii.

Co wiemy po takiej analizie? Czy dane wskazują na związek lub różnicę rozkładów między kategoriami. Czego nie wiemy? Które kategorie dokładnie „ciągną” wynik, jeśli nie przyjrzymy się dokładniej tabeli i ewentualnym porównaniom post-hoc.

Dłonie analizujące wykresy i notatki z wynikami ankiety na biurku — Źródło: Pexels | Autor: Lukas Blazek

Test chi-kwadrat krok po kroku – od tabeli do wniosku

Krok 1: sformułowanie hipotez

Analizę zaczyna się od jasnego zdefiniowania hipotez. W testach niezależności dla danych nominalnych wyglądają one typowo tak:

Hipoteza zerowa (H₀): zmienne są niezależne; rozkład kategorii jednej zmiennej jest taki sam w każdej kategorii drugiej zmiennej.
Hipoteza alternatywna (H₁): istnieje związek między zmiennymi; rozkłady różnią się co najmniej w jednej parze kategorii.

Przykład: „Nie ma związku między płcią a wyborem kanału informacji” (H₀) vs „Istnieje związek między płcią a wyborem kanału informacji” (H₁).

Krok 2: budowa tabeli krzyżowej z liczebnościami

Kolejny krok to skonstruowanie tabeli krzyżowej z liczbą osób w każdej kombinacji kategorii. W raporcie dobrze jest obok liczebności podać też procenty w wierszach lub kolumnach, bo to bardzo ułatwia interpretację.

Przykład (uproszczony):

wiersze – płeć (kobieta, mężczyzna),
kolumny – kanał informacji (telewizja, radio, Internet, prasa),
każda komórka – liczba osób danej płci, które wskazały dany kanał.

Krok 3: obliczenie liczebności oczekiwanych

Test chi-kwadrat porównuje liczebności zaobserwowane w komórkach z liczebnościami oczekiwanymi przy założeniu niezależności. Liczebność oczekiwana dla komórki (wiersz i, kolumna j) to:

E_ij = (suma wiersza i × suma kolumny j) / suma całkowita

Programy statystyczne podają zwykle zarówno liczebności obserwowane, jak i oczekiwane. Jeśli w wielu komórkach oczekiwane E_ij < 5, rozważa się alternatywny test lub łączenie rzadszych kategorii w jedną większą grupę (np. połączenie „radio” i „prasa” w „media tradycyjne”).

Krok 4: obliczenie wartości statystyki chi-kwadrat

Rdzeń testu to suma różnic między obserwowanymi a oczekiwanymi liczebnościami:

χ² = Σ ( (O_ij − E_ij)² / E_ij )

Gdzie:

O_ij – liczebność obserwowana w komórce,
E_ij – liczebność oczekiwana w tej komórce.

Im większa różnica między O i E w wielu komórkach, tym większa wartość χ² i tym mniejsze prawdopodobieństwo, że taki układ powstał przypadkiem przy braku związku.

Krok 5: stopnie swobody i poziom istotności

Aby ocenić, czy otrzymana wartość χ² jest „duża”, porównuje się ją z rozkładem chi-kwadrat o odpowiedniej liczbie stopni swobody:

df = (liczba wierszy − 1) × (liczba kolumn − 1)

Przed analizą ustala się poziom istotności, zwykle α = 0,05. Program statystyczny podaje bezpośrednio p-value (p), czyli prawdopodobieństwo uzyskania takiej lub większej wartości χ² przy założeniu, że H₀ jest prawdziwa.

jeśli p ≤ α – odrzucamy H₀ (stwierdzamy istnienie związku / różnicy rozkładów),
jeśli p > α – brak podstaw do odrzucenia H₀ (brak dowodu na związek w badanej próbie).

Krok 6: opis wyniku testu w pracy lub raporcie

Standardowa forma zapisu wyniku testu chi-kwadrat powinna zawierać:

nazwę testu,
wartość χ²,
liczbę stopni swobody (df),
p-value,
miarę siły związku (np. V Craméra).

Przykładowy zapis: „Stwierdzono istotny związek między płcią a wyborem kanału informacji, χ²(3) = 12,4; p = 0,006; V = 0,23”.

Sam zapis statystyczny nie wystarczy. Potrzebne jest jeszcze zdanie „po ludzku”, opisujące kierunek wyniku, np.: „Kobiety częściej niż mężczyźni wskazywały telewizję, natomiast mężczyźni częściej wybierali Internet jako główne źródło informacji”.

Krok 7: interpretacja praktyczna i siła efektu

Istotność statystyczna przy dużych próbach pojawia się łatwo, nawet przy niewielkich różnicach. Dlatego miara siły związku jest kluczowa, jeśli wnioski mają mieć sens praktyczny.

Najczęściej stosuje się:

phi (φ) – dla tabel 2×2,
V Craméra – dla tabel większych niż 2×2.

Obie miary mają zasięg od 0 (brak związku) do 1 (związek bardzo silny). W interpretacji korzysta się z orientacyjnych progów (słaby, umiarkowany, silny), ale zawsze trzeba zestawić to z kontekstem badania.

Jak oblicza się V Craméra i jak go odczytać

Wzór na V Craméra:

V = √( χ² / (N × (k − 1)) )

Gdzie:

N – liczba obserwacji (suma wszystkich komórek),
k – mniejsza z liczb: (liczba wierszy, liczba kolumn).

Przykładowe orientacyjne interpretacje (często używane w literaturze, choć nie są uniwersalne):

V ≈ 0,10 – związek słaby,
V ≈ 0,30 – związek umiarkowany,

Jak raportować siłę efektu przy danych nominalnych

Opis siły związku można zorganizować w kilku krokach, łącząc liczby z krótkim komentarzem merytorycznym.

Podaj miarę i jej wartość
„V Craméra = 0,23” lub „φ = 0,18”. Bez zaokrąglania do pełnych dziesiątek – zwykle dwa miejsca po przecinku wystarczą.
Zaklasyfikuj związek do progu opisowego
„Wielkość efektu na poziomie słabym/umiarkowanym/silnym”, przy czym progi warto zasygnalizować w metodologii, a nie dopiero w dyskusji.
Dodaj zdanie o znaczeniu praktycznym
Krótka odpowiedź na pytanie: „czy taka różnica ma znaczenie dla decyzji biznesowych / projektowych?”.

Przykład zapisu: „Związek między poziomem wykształcenia a preferowanym kanałem komunikacji był istotny statystycznie, χ²(6) = 15,2; p = 0,019, przy słabej sile efektu, V = 0,16. W praktyce oznacza to niewielkie, ale powtarzalne różnice w strukturze odpowiedzi między grupami wykształcenia”.

Co wiemy po takim opisie? Że związek występuje i jak silny jest w przybliżeniu. Czego nie wiemy? Które konkretnie kategorie różnią się od siebie najbardziej – do tego potrzebna jest analiza rozkładów w tabeli lub porównania dodatkowe.

Phi vs V Craméra – kiedy którą miarę stosować

Obie miary opisują siłę związku między dwiema zmiennymi nominalnymi, ale są projektowane do nieco innych sytuacji.

Phi (φ)
Używane głównie dla tabel 2×2 (dwie zmienne, każda z dwiema kategoriami). Im większa tabela, tym mniej czytelna interpretacja φ, dlatego przy większej liczbie kategorii stosuje się V.
V Craméra
Znormalizowane tak, by górna granica była bliska 1 także dla większych tabel. Stosowane, gdy choć jedna zmienna ma więcej niż dwie kategorie.

W praktycznej analizie ankiet można zastosować prostą zasadę roboczą: jeśli masz tabelę 2×2 – raportujesz φ; jeśli dana zmienna ma trzy kategorie lub więcej – raportujesz V Craméra.

Jak czytać małe i duże wartości siły związku

Numeryczne progi (0,10; 0,30; 0,50) są tylko punktem odniesienia. W badaniach ankietowych liczy się jeszcze kilka spraw praktycznych.

Kontekst decyzji
Słaby związek może być istotny, gdy mówimy o dużych populacjach (np. klienci w całym kraju) albo dużych budżetach. Niewielka różnica procentów może zmieniać opłacalność kampanii, choć statystycznie to tylko „V = 0,12”.
Zmienna kontrolowana czy tło?
Jeśli zmienna ma być podstawą segmentacji (np. typ klienta), oczekuje się zwykle co najmniej umiarkowanej siły związku z kluczowym zachowaniem (np. zakup). Jeśli to tylko zmienna opisowa (np. region), nawet słaby związek może być informacją wystarczającą.
Spójność z wcześniejszymi wynikami
„Słaby, ale stabilny” efekt, powtarzany w różnych próbach i falach badania, bywa cenniejszy niż pojedynczy, „silny” wynik z jednego pomiaru.

Dane nominalne a pytania wielokrotnego wyboru – szczególne wyzwania

Dlaczego pytania wielokrotnego wyboru komplikują analizę

W klasycznym pytaniu nominalnym respondent wybiera jedną kategorię: „Jaki kanał informacji wybierasz najczęściej?”. W pytaniach wielokrotnego wyboru („Których kanałów używasz? Możesz wybrać kilka odpowiedzi.”) jedna osoba zaznacza wiele kategorii na raz. To rodzi trzy praktyczne problemy:

te same osoby liczą się w kilku kategoriach jednocześnie,
sumy procentów w odpowiedziach przekraczają 100%,
zależności między zmiennymi trudno opisać jedną tabelą krzyżową.

Tradycyjny test chi-kwadrat dla jednej zmiennej nominalnej zakłada, że każdy respondent należy do dokładnie jednej kategorii. Przy wielu odpowiedziach ten warunek jest naruszony dla całej listy, choć wciąż obowiązuje wewnątrz pojedynczej kategorii: dana osoba albo zaznaczyła ją, albo nie.

Struktura danych przy pytaniach wielokrotnego wyboru

Przy pytaniu wielokrotnego wyboru odpowiedź można zapisać na kilka sposobów, ale w analizie statystycznej najczęściej używa się tzw. struktury „wiele zmiennych zero–jedynkowych”.

Każda możliwa odpowiedź staje się osobną zmienną (np. „TV”, „Radio”, „Internet”, „Prasa”).
Wartość 1 – odpowiedź zaznaczona, wartość 0 – odpowiedź niezaznaczona.
Jeden respondent może mieć wiele „jedynek” w jednym pytaniu.

Taki zapis pozwala analizować każdą kategorię osobno (czy dana grupa częściej zaznacza „Internet”?) oraz budować tabele 2×2: zmienna opisowa vs zaznaczenie danej opcji (tak/nie).

Jak liczyć procenty przy wielu odpowiedziach

W raporcie z ankiety występują zwykle dwa typy procentów dla pytań wielokrotnego wyboru:

Procent respondentów – ilu badanych zaznaczyło daną odpowiedź; mianownik to liczba osób (N respondentów).
Procent odpowiedzi – jaki udział ma dana kategoria we wszystkich udzielonych odpowiedziach; mianownik to suma wszystkich zaznaczeń (większa niż N, jeśli pytanie jest wielokrotne).

Przy testowaniu związków między zmiennymi nutzt się najczęściej procent respondentów, bo można wtedy sformułować zdania: „W grupie X 60% osób używa Internetu, w grupie Y – 45%”. To właśnie te rozkłady porównuje się w testach chi-kwadrat dla pojedynczych opcji.

Testowanie każdej opcji z osobna – prosty, ale wielokrotny

Najbardziej bezpośrednie podejście do pytań wielokrotnego wyboru wygląda tak:

Wybierasz jedną kategorię odpowiedzi (np. „Internet”).
Tworzysz zmienną zero–jedynkową: „czy zaznaczył Internet? – tak/nie”.
Budujesz tabelę 2×2: np. płeć (kobieta/mężczyzna) × używa Internetu (tak/nie).
Stosujesz test chi-kwadrat lub Fishera (jeśli są małe liczebności).

W ten sposób można przetestować związek każdej opcji z wybraną zmienną (płeć, wiek, typ klienta). Jednak pojawia się nowe pytanie: co z wielokrotnym testowaniem?

Problem wielokrotnych porównań przy wielu opcjach

Jeżeli w jednym pytaniu masz 8 możliwych odpowiedzi i dla każdej prowadzisz osobny test (np. „Internet” vs płeć, „TV” vs płeć itd.), liczba testów szybko rośnie. To oznacza wyższe ryzyko, że któryś wynik „wyjdzie istotny” tylko przypadkiem.

Możliwe strategie:

Korekta poziomu istotności (np. Bonferroniego) – dzielisz α przez liczbę testów, co jest rozwiązaniem prostym, ale konserwatywnym.
Ograniczenie liczby hipotez – testujesz tylko te odpowiedzi, które są kluczowe z punktu widzenia problemu badawczego, a nie wszystkie możliwe opcje technicznie dostępne w ankiecie.
Łączenie rzadkich opcji – mało używane odpowiedzi („inne, rzadko wybierane”) można połączyć w jedną kategorię zbiorczą lub pominąć w testach, a pokazać wyłącznie opisowo.

Co wiemy po takim podejściu? Które konkretne odpowiedzi w pytaniu wielokrotnego wyboru są różnie wybierane przez grupy. Czego nie wiemy? Jak wygląda „wzorzec” kilku wyborów jednocześnie (np. wspólne używanie Internetu i radia), bo to wymaga bardziej złożonego modelowania.

Analiza struktury pakietów odpowiedzi

Niektóre decyzje badawcze dotyczą nie pojedynczych odpowiedzi, ale konfiguracji zaznaczeń. Przykład: segmentacja odbiorców według pakietu mediów, których faktycznie używają.

Możliwe podejścia:

Definiowanie typów użytkowników „ręcznie”
Tworzysz nowe zmienne, np. „tylko Internet”, „Internet + TV”, „tylko media tradycyjne”. Każda osoba trafia do jednej kategorii typu. Następnie analizujesz tę nową zmienną jak zwykłą zmienną nominalną (tabele krzyżowe, chi-kwadrat, V Craméra).
Klasteryzacja
Użycie metod grupowania (np. k-średnich lub hierarchicznych) na zestawie zmiennych zero–jedynkowych. Uzyskane klastry traktujesz później jak kategorie nominalne i testujesz ich związki z innymi zmiennymi.

Podejście „ręczne” jest bardziej przejrzyste w raporcie, ale wymaga jasno ustalonych kryteriów tworzenia typów, tak by nie dopasowywać ich po fakcie do ciekawych różnic.

Czy wolno stosować klasyczny chi-kwadrat do pytania wielokrotnego?

Czasem spotyka się próbę zbudowania jednej dużej tabeli krzyżowej: grupy × odpowiedzi z pytania wielokrotnego, z zliczaniem wszystkich zaznaczeń jako niezależnych obserwacji. To podejście ma jednak istotny problem: odpowiedzi pochodzą z tych samych osób, więc nie są od siebie niezależne.

Bezpieczniejsza ścieżka to:

traktowanie każdej odpowiedzi jako osobnej zmiennej (0/1) i testowanie w układzie 2×2,
lub budowa zmiennej „typ użytkownika” i analiza jej rozkładu między grupami.

Jeśli mimo wszystko w analizie pojawiają się zliczenia wszystkich „kliknięć” jako osobnych obserwacji, powinno to być jasno opisane metodologicznie, z zaznaczeniem ograniczeń wnioskowania.

Łączenie danych nominalnych z ocenami skali – co da się zrobić

W ankietach pytania wielokrotnego wyboru często sąsiadują z ocenami na skali (np. 1–5). Można wtedy sprawdzać, jak wybory nominalne łączą się z ocenami ilościowymi.

Grupy zdefiniowane odpowiedzią nominalną
Np. porównanie średniej satysfakcji (skala 1–10) między osobami, które używają Internetu (tak/nie). Tutaj pojawiają się testy dla danych ilościowych (t-Studenta, ANOVA), ale zmienna grupująca pochodzi z pytania nominalnego.
Wiele odpowiedzi jako wiele zmiennych binarnych
Każda kategoria (np. „Internet”) może być predyktorem w modelu regresji (0/1). Wtedy pytanie wielokrotnego wyboru staje się zbiorem zmiennych objaśniających, a wynik na skali – zmienną objaśnianą.

Taki most między danymi nominalnymi i ilościowymi rozszerza repertuar analiz, ale wymaga konsekwencji w definicji zmiennych i kontroli nad liczbą testowanych hipotez.

Raportowanie pytań wielokrotnego wyboru z testami statystycznymi

W praktycznym raporcie fragment dotyczący pytania wielokrotnego można uporządkować w kilku krokach.

Opis ogólnej struktury odpowiedzi
Najczęściej wybierane opcje, suma odpowiedzi na osobę (średnia liczba zaznaczeń), udział kategorii w odpowiedziach.
Porównanie procentów między kluczowymi grupami
Np. wykres słupkowy: odsetek użytkowników Internetu w różnych grupach wiekowych.
Wyniki testów dla wybranych opcji
Dla każdej opcji, która jest istotna analitycznie: zapis testu (χ², df, p, φ/V) i 1–2 zdania interpretacji, dlaczego dana różnica ma lub nie ma znaczenia praktycznego.
Opis konfiguracji odpowiedzi (jeśli analizowano typy użytkowników)
Jakie pakiety mediów są najczęstsze i jak rozkładają się między badanymi segmentami.

Kiedy odpuścić testy przy pytaniach wielokrotnego wyboru

Nie każde pytanie wielokrotnego wyboru musi być testowane statystycznie. Są sytuacje, gdy lepiej poprzestać na opisie:

Bardzo wiele kategorii i małe liczebności
Gdy większość opcji wybiera niewielki odsetek respondentów, testy będą mało wiarygodne (dużo komórek z E_ij < 5), a korekty wielokrotnego testowania jeszcze zmniejszą szanse na uzyskanie czytelnych wyników.
Pytania eksploracyjne
Gdy celem jest zebranie inspiracji (np. lista wykorzystywanych aplikacji), liczby służą przede wszystkim do uporządkowania rynku, a nie do precyzyjnego wnioskowania o różnicach między grupami.
Bardzo mała próba
Gdy z definicji analizujesz niszową grupę (np. kilkadziesiąt osób), testy formalne nie wnoszą wiele ponad samą obserwację rozkładów procentowych.

W takich sytuacjach można ograniczyć się do tabel i wykresów z komentarzem opisowym – z jasnym zaznaczeniem, że przedstawiane różnice traktowane są jako sygnały, a nie potwierdzone statystycznie efekty.

Bibliografia

Statistical Methods for Rates and Proportions. John Wiley & Sons (2003) – Testy chi‑kwadrat, dane kategoryczne, proporcje
Categorical Data Analysis. John Wiley & Sons (2013) – Analiza danych nominalnych, testy niezależności, miary efektu
Discovering Statistics Using IBM SPSS Statistics. SAGE Publications (2017) – Praktyczne wprowadzenie do testów chi‑kwadrat i V Craméra
Statistical Power Analysis for the Behavioral Sciences. Lawrence Erlbaum Associates (1988) – Pojęcie siły efektu i interpretacja znaczenia praktycznego

Zobacz także:

1 KOMENTARZ

SprytnyKowal 25 marca, 2026 W 8:52 pm
Bardzo interesujący artykuł, który rzetelnie omawia sposób testowania związków i opisywania siły efektu w badaniach ankietowych z użyciem danych nominalnych. Szczególnie doceniam klarowne wyjaśnienia dotyczące różnych testów statystycznych oraz praktyczne wskazówki dotyczące interpretacji wyników. Jednakże brakowało mi bardziej szczegółowych przykładów zastosowania omawianych metodologii w praktyce. Byłoby to bardzo pomocne dla osób, które dopiero zaczynają przygodę z analizą danych w badaniach ankietowych. Mimo tego, polecam lekturę tego artykułu wszystkim, którzy chcą pogłębić swoją wiedzę na temat analizy danych nominalnych.

Komentarze są aktywne tylko po zalogowaniu.