Dłoń z długopisem analizująca kolorowe wykresy słupkowe i liniowe
Źródło: Pexels | Autor: Lukas Blazek
Rate this post

Nawigacja po artykule:

Założenia i granice skali Likerta – co realnie mierzymy

Rodzaj danych a wybór statystyk

Skala Likerta jest często nazywana „skalą od 1 do 5”, ale w ujęciu metodologicznym to nie liczby są najważniejsze, tylko zestaw pozycji (twierdzeń), które mierzą ten sam konstrukt, np. satysfakcję z pracy. Pojedynczy item Likerta („Zgadzam się / Nie zgadzam się”) daje dane porządkowe – wiadomo, która odpowiedź oznacza „więcej”, ale nie wiadomo, czy odległości między kategoriami są równe psychologicznie. Dopiero zsumowanie lub uśrednienie wielu pozycji tworzy skalę, którą w praktyce często traktuje się jak dane przedziałowe.

Na poziomie pojedynczego pytania bezpieczne są statystyki zgodne z naturą danych porządkowych: procenty odpowiedzi, moda, ewentualnie mediana. Średnia z pojedynczego itemu jest już dyskusyjna metodologicznie, zwłaszcza gdy rozkład odpowiedzi jest bardzo skośny. Natomiast przy skali złożonej z kilku pozycji (np. 5–10) suma lub średnia bywa traktowana jako przybliżona zmienna przedziałowa i wtedy stosuje się pełny zestaw statystyk opisowych: średnie, odchylenia standardowe, przedziały ufności.

Decyzja „traktuję skalę Likerta jak dane przedziałowe” jest świadomym kompromisem. W naukach społecznych powszechnie się go stosuje, ale wymaga krótkiego uzasadnienia w części metodologicznej pracy lub raportu: liczba pozycji, spójność konstruktu, przybliżona symetria rozkładu. Kryterium minimum: kilka pozycji na wymiar, brak drastycznej skośności i rozsądna rzetelność (np. współczynnik alfa Cronbacha powyżej 0,7).

Jeśli konstrukcja spełnia te warunki, można analizować wyniki za pomocą testów dla danych przedziałowych (np. test t, ANOVA, korelacje Pearsona) – przy zastrzeżeniu, że w interpretacji wniosków uwzględnia się charakter skali odpowiedzi. Gdy warunki nie są spełnione (pojedynczy item, dwie pozycje, silna koncentracja odpowiedzi w jednym punkcie), poziom pomiaru pozostaje bliższy danym porządkowym i zastosowanie testów parametrycznych staje się sygnałem ostrzegawczym.

Jeśli w kwestionariuszu dominuje jedna–dwie pozycje na wymiar, a wyniki są mocno skupione na „zgadzam się”, bezpieczniej oprzeć analizy na procentach, medianach i testach nieparametrycznych; jeśli konstrukty są mierzone wieloma pozycjami, a rozkład sum wyników jest umiarkowanie zróżnicowany, rozsądne staje się wykorzystanie średnich i bardziej zaawansowanych testów.

Porządkowe czy przedziałowe – praktyczny kompromis

Formalnie odpowiedzi typu „zdecydowanie się nie zgadzam – … – zdecydowanie się zgadzam” tworzą skalę porządkową. Nie mamy pewności, że odległość między „raczej się zgadzam” a „zgadzam się” jest taka sama, jak między „ani się zgadzam, ani się nie zgadzam” a „raczej się zgadzam”. W praktyce zakłada się, że respondenci postrzegają te stopnie jako mniej więcej równo oddalone – to kluczowe założenie, które pozwala traktować wynik złożonej skali jak przybliżoną zmienną przedziałową.

Ten kompromis jest szeroko akceptowany w badaniach społecznych, pod kilkoma warunkami:

  • skala obejmuje co najmniej 3–4 pozycje na wymiar,
  • kategorie odpowiedzi są symetryczne i jednoznaczne,
  • w pilotażu i badaniu zasadniczym rozkład sumy/średniej wyników jest również mniej więcej symetryczny,
  • rzetelność wewnętrzna skali jest na poziomie co najmniej akceptowalnym.

Medianę można obliczać zarówno dla pojedynczych itemów, jak i dla całych skal sumarycznych, ale interpretacja jest inna. Dla pojedynczego pytania mediana pokaże „typową odpowiedź”, dla skali sumarycznej – typowy poziom badanego konstruktu w próbie. Średnia jest znacząco bardziej wrażliwa na skrajne wartości i odsetek braków danych, dlatego każdy krok liczenia średnich powinien poprzedzać przegląd rozkładów i liczby braków.

Jeśli w badaniu użyto skali o nielogicznych lub niesymetrycznych etykietach odpowiedzi, a dodatkowo liczba pozycji jest minimalna, lepiej pozostać przy porządkowym traktowaniu danych; jeśli skala jest wielopozycyjna i spójna treściowo, a pilotaż nie wykazał rażących zniekształceń rozkładów, można przyjąć kompromis „quasi-przedziałowy” i wykorzystać statystyki parametryczne.

Kiedy liczyć średnie, a kiedy mediany i rozkłady procentowe

Analiza skali Likerta staje się stabilna dopiero przy odpowiednio zbudowanych skalach sumarycznych. W praktyce:

  • Pojedynczy item – podstawą są rozkłady procentowe oraz moda, ewentualnie mediana. Średnia bywa używana opisowo, ale nie powinna być centrum raportu.
  • Skala 2-pozycyjna – to nadal kruche podstawy. Rozsądne jest prezentowanie rozkładów odpowiedzi na obu pozycjach oraz porównywanie ich spójności. Średnia z dwóch pozycji jest bardzo wrażliwa na każdy błąd odpowiedzi.
  • Skale 3–5+ pozycyjne – można liczyć sumy i średnie, badać odchylenie standardowe, sprawdzać rzetelność i stosować testy parametryczne przy zachowaniu świadomości kompromisu.

W opisach wyników dla pojedynczych twierdzeń najbezpieczniejszy zestaw to: procenty w każdej kategorii oraz wykres słupkowy, czasem mediana. Dla wyników sumarycznych – średnia, odchylenie standardowe, minimum, maksimum, ew. kwartyle. Przy bardzo skośnym rozkładzie lub małej liczebności grup porównawczych mediana jest bardziej odporna niż średnia i powinna stać się główną statystyką centralną.

Jeśli rozkład sumy skali jest bliski normalnemu i liczebność grup jest dostateczna, średnie i odchylenia standardowe stanowią standardowy pakiet; jeśli rozkład jest silnie skośny, a grupy małe lub nierówne, przejście na mediany, kwartyle i testy nieparametryczne będzie bezpieczniejszym wyborem.

Warunki sensownego stosowania skali Likerta

Skala Likerta jest użyteczna tylko wtedy, gdy pozycje rzeczywiście mierzą ten sam konstrukt. Minimum praktyczne to 3 pozycje na wymiar, bardziej komfortowo – 4–6. Pojedyncze „pytanie o satysfakcję” nie jest skalą, lecz wskaźnikiem pojedynczego aspektu, który może być zniekształcony humorem respondenta, sytuacją w dniu badania czy niezrozumieniem treści.

Drugim warunkiem jest przybliżona równość „odległości psychologicznych” między kategoriami odpowiedzi. Jeżeli ktoś postrzega różnicę między „zdecydowanie się nie zgadzam” a „nie zgadzam się” jako niewielką, a skok od „nie mam zdania” do „zgadzam się” jako ogromny, to przyjęcie skali przedziałowej staje się mocno ryzykowne. Wpływają na to zarówno same etykiety, jak i kontekst pytania.

Trzeci aspekt to liczba stopni skali. Skale 4-punktowe (bez odpowiedzi neutralnej) wymuszają opowiedzenie się „za” lub „przeciw” i sprzyjają większemu rozkładowi wyników, ale mogą frustrować osoby autentycznie niezdecydowane. Skale 5-punktowe stanowią rozsądny kompromis między prostotą a czułością. Skale 7-punktowe dają większą precyzję, ale wymagają od respondenta większego wysiłku rozróżniania odcieni. Im więcej stopni, tym większa szansa na traktowanie wyników jak przybliżonych danych przedziałowych, ale też większe ryzyko niezrozumienia skali.

Jeśli skala ma mniej niż 3 pozycje na wymiar, a etykiety odpowiedzi są niejasne lub niesymetryczne, konstrukcja jest metodologicznym sygnałem ostrzegawczym; jeśli skala składa się z co najmniej 3–5 jednoznacznych pozycji, z symetrycznymi odpowiedziami i umiarkowaną liczbą stopni (5–7), tworzy się solidny fundament do dalszych analiz ilościowych.

Projektowanie skali Likerta krok po kroku – od konstruktu do pozycji

Definiowanie konstruktu i wymiarów

Skuteczna analiza zaczyna się dużo wcześniej niż w Excelu czy SPSS – od jasnego zdefiniowania, co dokładnie ma być mierzone. Konstrukty takie jak „satysfakcja z pracy”, „zaufanie do instytucji” czy „zaangażowanie pracowników” są wielowymiarowe. Dlatego kluczowy punkt kontrolny to rozpisanie konstruktu na wymiary. Przykładowo, „satysfakcja z pracy” można podzielić na: satysfakcję z wynagrodzenia, relacje w zespole, rozwój zawodowy, warunki fizyczne pracy.

Przydatnym narzędziem jest prosta macierz „wymiar – liczba pozycji – przewidywany kierunek odpowiedzi”. Tabela w arkuszu projektowym może wyglądać następująco:

WymiarPlanowana liczba pozycjiPrzykładowy kierunek twierdzeń
Wynagrodzenie4pozytywny (im wyższa zgoda, tym wyższa satysfakcja)
Relacje z przełożonym5mieszany (pozycje wprost i odwrócone)
Rozwój zawodowy4pozytywny
Warunki pracy3pozytywny

Taka macierz pozwala od razu wychwycić „dziurawe” obszary, gdzie liczba pozycji jest zbyt mała. Minimum jakościowe to 3 pozycje na wymiar – poniżej tej granicy wyniki stają się bardzo podatne na przypadek. Na etapie definicji konstruktu warto również spisać operacyjne definicje wymiarów, choćby w jednym–dwóch zdaniach, aby późniejsze twierdzenia łatwo dało się zweryfikować pod kątem zgodności z intencją.

Jeśli dla któregoś wymiaru nie udaje się wymyślić więcej niż jednego–dwóch sensownych twierdzeń, to sygnał ostrzegawczy: albo wymiar jest zbyt ogólny, albo w ogóle nie jest potrzebny w badaniu; jeśli każdy z wymiarów ma zaplanowane 3–5 precyzyjnych pozycji, rośnie szansa na spójną, rzetelną skalę.

Pisanie pozycji i dobór etykiet odpowiedzi

Jakość pozycji skali Likerta decyduje o wszystkim, co dzieje się później w Excelu i SPSS. Kryteria minimum dla pojedynczego twierdzenia są następujące:

  • jednoznaczność – jedno pytanie = jedna myśl, bez złożonych zdań,
  • brak dwóch treści naraz („jestem zadowolony z wynagrodzenia i atmosfery” to błąd),
  • brak żargonu – język zrozumiały dla przeciętnego respondenta,
  • brak sugerowania odpowiedzi („pracodawca, który dba o pracowników, zapewnia szkolenia – mój pracodawca…”) – to pytanie nacechowane.

Twierdzenia powinny być konkretne, a nie ogólne. Zamiast „Jestem zadowolony z pracy” lepiej użyć kilku pozycji: „Jestem zadowolony z wynagrodzenia”, „Jestem zadowolony z relacji ze współpracownikami”, „Mam poczucie, że moja praca ma sens”. Dzięki temu każdy wymiar będzie mierzył coś uchwytnego i możliwego do przełożenia na decyzje zarządcze.

Etykiety odpowiedzi wpływają bezpośrednio na interpretację danych. Skala „1 – zdecydowanie się nie zgadzam, 2 – nie zgadzam się, 3 – ani się zgadzam, ani się nie zgadzam, 4 – zgadzam się, 5 – zdecydowanie się zgadzam” jest standardem, ale można ją modyfikować. Kluczowy punkt kontrolny: symetria i równoważność semantyczna. Jeśli opis jednego z końców jest zbyt „mocny” lub nieprzyjemny („zupełnie niekompetentny” vs „bardzo kompetentny”), respondenci będą unikać ostrych sformułowań, zniekształcając wyniki.

Jeśli twierdzenia są krótkie, jednoznaczne i bez nadmiernego żargonu, a etykiety odpowiedzi symetryczne i neutralne w tonie, skala ma potencjał na dobry materiał do analizy; jeśli pojawiają się długie, złożone zdania, z kilkoma myślami naraz i niejasnymi odpowiedziami typu „raczej tak”, „bardziej nie”, to pierwszy sygnał ostrzegawczy przed przechodzeniem do etapu zbierania danych.

Pozycje odwrócone (reverse-coded) – sens i konsekwencje

Pozycje odwrócone to twierdzenia sformułowane w przeciwnym kierunku niż reszta. Jeśli większość pozycji brzmi: „Jestem zadowolony z…”, pozycja odwrócona może brzmieć: „Często myślę o odejściu z tej pracy”. Wysoka zgoda z tą pozycją oznacza niski poziom satysfakcji, więc przy liczeniu sumy/średniej skali trzeba ją odwrócić (przekodować), np. ze skali 1–5 na wartości 5–1.

Są dwa główne powody wprowadzania pozycji odwróconych:

  • kontrola nad automatycznym zaznaczaniem jednej kolumny („pociąg odpowiedzi”),
  • Ryzyka związane z pozycjami odwróconymi

    Pozycje odwrócone mają też koszt. Główne źródła problemów to:

  • błędy rozumienia treści – część respondentów mechanicznie „widzi” słowo kluczowe („praca”, „wynagrodzenie”) i nie wychwytuje zaprzeczenia,
  • wzrost obciążenia poznawczego – szczególnie przy dłuższych, złożonych zdaniach,
  • spadek rzetelności podskali – pozycje odwrócone często korelują słabiej z resztą pozycji w tym samym wymiarze,
  • błędy w analizie – pomyłki w przekodowaniu wartości w Excelu lub SPSS, mylenie kierunku efektu.

Typowy sygnał ostrzegawczy w danych pilotażowych: pozycja odwrócona ma znacznie niższą korelację pozycja–test niż pozostałe twierdzenia w wymiarze, a rozkład odpowiedzi jest nietypowy (np. większość „ani się zgadzam, ani się nie zgadzam” przy wysokiej satysfakcji w innych pozycjach). To znak, że pozycja jest mylona lub źle zrozumiana.

Minimum rozsądku przy projektowaniu:

  • nie więcej niż 20–30% pozycji odwróconych w całej skali,
  • proste, krótkie zaprzeczenia („Nie czuję się doceniany”) zamiast złożonych („Rzadko zdarza się, abym nie czuł się doceniany”),
  • spójne słownictwo – nie mieszać negacji i podwójnych zaprzeczeń („nie jest niezadowolony”).

Jeśli pozycje odwrócone są nieliczne, jasno sformułowane i przetestowane w pilotażu, dają zysk kontrolny bez dużej straty rzetelności; jeśli są liczne, długie i zawiłe, stają się głównym źródłem szumu zamiast narzędziem kontroli jakości danych.

Projekt pilotażowy – test konstrukcji przed właściwym badaniem

Skala, która nie przeszła pilotażu, jest konstrukcyjnym ryzykiem. Nawet najlepsza teoria nie zastąpi krótkiego testu na realnych respondentach. Sensowny pilotaż to minimum kilkanaście–kilkadziesiąt osób zbliżonych do grupy docelowej, zebranych w warunkach podobnych do planowanego badania.

Kluczowe punkty kontrolne w pilotażu:

  • czas wypełniania – zbyt długi kwestionariusz zwiększa liczbę odpowiedzi mechanicznych,
  • komentarze jakościowe – po wypełnieniu można poprosić kilka osób o wskazanie „niejasnych” lub „dziwnych” twierdzeń,
  • wstępne rozkłady odpowiedzi – w Excelu szybko widać, gdzie odpowiedzi zbiegają się w jednym krańcu skali albo dominują „środki”,
  • pierwsza rzetelność – obliczenie wstępnego Cronbacha alfa dla wymiarów w SPSS (nawet przy małej próbie) może ujawnić rażąco słabe pozycje.

Jeżeli w pilotażu pojawia się wiele pozycji z mocnym efektem sufitu lub podłogi (niemal wszyscy „zdecydowanie się zgadzam” lub „zdecydowanie się nie zgadzam”), skala traci zdolność różnicowania. To sygnał ostrzegawczy: trzeba przeformułować twierdzenia lub zmienić zakres badanego zjawiska.

Jeśli pilotaż pokazuje, że czas wypełniania jest akceptowalny, respondenci rzadko zgłaszają niejasności, a wstępne wskaźniki rzetelności nie są skrajnie niskie, projekt można bezpieczniej wprowadzać na większą próbę; jeśli pojawia się kumulacja ostrzeżeń (długi czas, liczne komentarze typu „nie rozumiem pytania”, niskie alfa), inwestycja w dopracowanie narzędzia jest tańsza niż późniejsza naprawa wniosków.

Bizneswoman prezentuje na clipboardzie słupkowe wyniki ankiety
Źródło: Pexels | Autor: RDNE Stock project

Od ankiety do Excela – przygotowanie danych krok po kroku

Struktura arkusza i kodowanie odpowiedzi

Porządek w arkuszu Excela to pierwsza linia obrony przed błędami analizy. Minimalna, uporządkowana struktura wygląda tak:

  • wiersz 1 – nazwy zmiennych (krótkie, bez spacji, np. SAT_WYN1, SAT_REL2),
  • każdy wiersz poniżej – jedna osoba (respondent),
  • każda kolumna – jedna pozycja skali lub zmienna opisowa (płeć, dział, staż pracy).

Kodowanie kategorii odpowiedzi skali Likerta najlepiej ustalić przed zbudowaniem arkusza. Typowe rozwiązanie:

  • 1 – zdecydowanie się nie zgadzam,
  • 2 – nie zgadzam się,
  • 3 – ani się zgadzam, ani się nie zgadzam,
  • 4 – zgadzam się,
  • 5 – zdecydowanie się zgadzam.

Na etapie wprowadzania danych konsekwencja kodowania to krytyczny punkt kontrolny. Mieszanie skal (np. w jednym wymiarze 1–5, w innym 0–4) bez wyraźnego oznaczenia generuje ryzyko błędnych sum i średnich.

Jeśli wszystkie pozycje wymiaru mają identyczne kodowanie, a nazwy zmiennych są jednoznaczne i opisowe, sumowanie oraz analiza w Excelu i SPSS przebiegają bez zbędnych korekt; jeśli nazwy są losowe typu Q1, Q2, a kodowanie zmienne, każdy kolejny krok wymaga podwójnego sprawdzania i rośnie ryzyko pomyłki.

Obsługa odpowiedzi brakujących w Excelu

Rzeczywiste arkusze zawsze zawierają luki: brak odpowiedzi, wielokrotne zaznaczenia, skreślenia. W Excelu minimum porządku to:

  • oznaczanie braku odpowiedzi jako pustej komórki lub spójnego kodu (np. 99),
  • konsekwencja – ten sam sposób oznaczenia braków dla wszystkich pozycji skali,
  • unikanie mieszaniny symboli typu „–”, „brak”, „n/d”, które trudno przetworzyć funkcjami liczbowymi.

Jeżeli brak odpowiedzi oznaczamy kodem liczbowym (np. 99), trzeba bezwzględnie zadbać, by nie wchodził on do obliczeń skali. Przykładowo, zamiast klasycznego =ŚREDNIA(B2:F2) można użyć funkcji, która ignoruje wartości spoza skali, np. z użyciem ŚREDNIA.JEŻELI:

=ŚREDNIA.JEŻELI(B2:F2;"<=5")

Podobnie dla sumy pozycji:

=SUMA.JEŻELI(B2:F2;"<=5")

Jeżeli udział braków w wymiarze jest niewielki (pojedyncze luki przy kilku pozycjach), dopuszczalne jest liczenie średniej z dostępnych odpowiedzi. Jeśli jednak brakuje większości pozycji w danym wymiarze, bezpieczniejsze jest oznaczenie wyniku złożonego jako brak (np. pozostawienie pustej komórki lub nadanie kodu specjalnego).

Jeśli braków jest mało i są oznaczone w jednolity sposób, można je łatwo wykluczyć z obliczeń lub imputować; jeśli brakujące dane są oznaczane przypadkowymi znakami tekstowymi, każdy krok w Excelu wymaga ręcznego „czyszczenia” i podważa spójność wyników.

Przekodowywanie pozycji odwróconych w Excelu

Przed liczeniem sum/średnich wymiarów wszystkie pozycje muszą mieć ten sam kierunek: wyższa wartość = więcej mierzonej cechy (np. wyższa satysfakcja). Dla skali 1–5 przekodowanie pozycji odwróconej można wykonać prostym wzorem:

=6 - B2

gdzie B2 to komórka z pierwotną odpowiedzią. Dla skali 1–7 analogiczny wzór to:

=8 - B2

Praktyczny sposób organizacji:

  • pozostaw oryginalne odpowiedzi w jednej kolumnie (np. SAT_WYN3_R),
  • w sąsiedniej kolumnie utwórz ich wersję przekodowaną (np. SAT_WYN3),
  • do obliczeń skali używaj wyłącznie kolumn przekodowanych.

Sygnał ostrzegawczy: mieszanie w sumowaniu kolumn „R” (oryginalnych reversed) i przekodowanych. Dobry nawyk to wizualne odróżnienie tych zmiennych – np. przez nadanie im innego koloru nagłówka lub wydzielenie w osobnym bloku arkusza.

Jeśli lista pozycji odwróconych jest jasno oznaczona, a przekodowanie odbywa się w osobnych kolumnach z przejrzystymi formułami, ryzyko błędu kierunku efektu w dalszej analizie spada do minimum; jeśli odwracanie odbywa się „na szybko” bez śladu w strukturze arkusza, weryfikacja po kilku tygodniach lub w audycie staje się praktycznie niemożliwa.

Tworzenie wyników sumarycznych i podskal w Excelu

Po uporządkowaniu danych można przystąpić do budowy wyników złożonych. W typowym scenariuszu dla każdej osoby powstaje:

  • wynik dla każdej podskali (np. „Wynagrodzenie”, „Relacje z przełożonym”),
  • wynik ogólny – suma lub średnia ze wszystkich pozycji skali głównej.

Dla wymiaru „Wynagrodzenie” z 4 pozycjami (już przekodowanymi w razie potrzeby) można zastosować:

=ŚREDNIA(C2:F2)

lub – jeśli wymagana jest suma:

=SUMA(C2:F2)

Na poziomie projektu trzeba zdecydować, czy wygodniejsze będzie operowanie na sumach czy średnich. Średnie mają tę zaletę, że nie zależą od liczby pozycji – wynik 4,2 w skali 1–5 ma ten sam sens w wymiarze 3-pozycyjnym i 6-pozycyjnym. Przy sumach (np. 12 vs 24) interpretacja jest mniej intuicyjna, wymaga dzielenia przez liczbę pozycji lub przeliczania na skale standardowe.

Jeśli wszystkie podskale są budowane z podobnej liczby pozycji, a odbiorcy raportu są przyzwyczajeni do interpretacji średnich, pracuje się wygodniej na średnich; jeśli celem jest późniejsze modelowanie (np. z wynikami innych testów liczone w postaci sum), utrzymanie jednej konwencji może ułatwić dalszą analizę.

Podstawowa analiza opisowa skali Likerta w Excelu

Rozkład odpowiedzi dla pojedynczych pozycji

Przed przejściem do wyników złożonych rozsądnie jest sprawdzić, jak zachowują się poszczególne twierdzenia. W Excelu podstawowe pytania kontrolne to:

  • jak wygląda częstość odpowiedzi w każdej kategorii,
  • czy występują efekty sufitu/podłogi,
  • czy są pozycje z nietypowym rozkładem względem pozostałych.

Prosty sposób to użycie tabeli przestawnej:

  1. Zaznacz zakres z danymi (np. wszystkie odpowiedzi na pozycje skali).
  2. Wstaw > Tabela przestawna.
  3. Jako „Wiersze” wybierz konkretną pozycję (np. SAT_WYN1), jako „Wartości” również tę samą zmienną z funkcją „Licznik”.

Tak otrzymasz liczbę odpowiedzi w każdej kategorii (1–5). Dodając drugi poziom (np. zmienną „DZIAŁ”) do pola „Kolumny”, można szybko porównać wzory odpowiedzi między grupami.

Jeżeli większość pozycji ma rozkład „rozciągnięty” (korzystanie z wielu kategorii skali), a tylko jedna–dwie pozycje skupiają się wyłącznie w skrajnym punkcie, te pozycje wymagają przeglądu (zbyt oczywiste, źle sformułowane lub mierzą coś innego). Jeśli rozkłady większości pozycji pokazują, że respondenci korzystają ze wszystkich kategorii skali, rośnie szansa na użyteczną wariancję do dalszych analiz.

Statystyki opisowe dla podskal w Excelu

Po zbudowaniu podskal warto obliczyć dla każdej z nich:

  • średnią,
  • odchylenie standardowe,
  • minimum i maksimum,
  • ew. kwartyle (Q1, mediana, Q3).

Można to zrobić ręcznie formułami, np. dla wymiaru „Wynagrodzenie” w kolumnie G:

=ŚREDNIA(G2:G201)
=ODCH.STANDARDOWE.S(G2:G201)
=MIN(G2:G201)
=MAKS(G2:G201)
=KWARTYL.PRZEDZ(G2:G201;2)   

Inna możliwość to skorzystanie z dodatku „Analiza danych” (jeśli jest włączony):

  1. Dane > Analiza danych > Statystyki opisowe.
  2. Wybierz zakres wejściowy (np. wszystkie podskale), zaznacz „Etykiety w pierwszym wierszu” oraz „Poziom ufności dla średniej” (jeśli potrzebny).
  3. Wybierz miejsce wyników (nowy arkusz lub istniejący).

Porównania grupowe w Excelu na podstawie skali Likerta

Po obliczeniu podskal i wyniku ogólnego naturalnym krokiem są porównania między grupami – działami, poziomami stanowisk, lokalizacjami. Kluczowe pytanie: czy różnice są na tyle duże i spójne, że można na ich podstawie planować działania?

Minimum techniczne w Excelu to połączenie tabel przestawnych i prostych statystyk:

  1. Upewnij się, że wyniki podskal (np. SAT_WYN, SAT_REL, SAT_ORG) są w osobnych kolumnach, w tym samym arkuszu co zmienne grupujące (np. DZIAŁ, STANOWISKO).
  2. Zaznacz pełny zakres danych, w tym kolumny z grupami i podskalami.
  3. Wstaw > Tabela przestawna.
  4. Jako „Wiersze” wybierz zmienną grupującą (np. DZIAŁ), jako „Wartości” – kolejno podskale; dla każdej ustaw funkcję „Średnia”.

Tabela przestawna pokaże średnie wyniki np. satysfakcji z wynagrodzenia w każdym dziale. Można dodać drugą zmienną (np. STANOWISKO) do pole „Kolumny”, uzyskując macierz dział × poziom stanowiska.

Sygnały ostrzegawcze przy takich porównaniach:

  • bardzo małe liczebności w komórkach (np. 2–3 osoby w danym dziale i poziomie stanowiska),
  • różnice średnich rzędu ułamka punktu zestawiane jak „istotne” bez sprawdzenia rozproszenia,
  • porównania wielu grup bez żadnej kontroli nad interpretacją przypadkowych wahań.

Dobry punkt kontrolny to ręczne sprawdzenie liczebności w kilku ekstremalnych komórkach tabeli (najwyższa i najniższa średnia) oraz odchylenia standardowego w całej grupie. Jeśli w „najgorszym” dziale są 3 osoby, a różnica średnich wobec reszty firmy jest minimalna, materiał jest zbyt słaby, by formułować twarde wnioski.

Wizualizacja rozkładów i różnic w Excelu

Same liczby w tabelach przestawnych rzadko ujawniają pełen obraz. W kontekście skal Likerta proste wykresy potrafią błyskawicznie ujawnić asymetrię, skupienie odpowiedzi na jednym biegunie czy różnice między działami.

Przydatne typy wykresów:

  • skumulowany wykres słupkowy procentowy – rozkład odpowiedzi 1–5 dla wybranej pozycji skali w grupach,
  • wykres kolumnowy – średnie wyników podskali w działach,
  • wykres liniowy – zmiana średnich odpowiedzi wzdłuż pozycji skali (np. porównanie charakteru pozycji w obrębie podskali).

Przykład procedury dla skumulowanego wykresu słupkowego:

  1. Przygotuj tabelę: w wierszach grupy (np. działy), w kolumnach procent odpowiedzi 1, 2, 3, 4, 5 dla konkretnej pozycji.
  2. Zaznacz tabelę, wstaw > Wykres kolumnowy skumulowany 100%.
  3. Dopasuj legendę (kategorie skali), kolejność kolorów (od 1 do 5) i etykiety danych (opcjonalnie).

Kiedy wykres pokazuje, że jeden dział ma zauważalnie większy udział skrajnie niskich ocen (1–2), to sygnał do dalszej analizy jakościowej; jeśli wykresy wszystkich działów wyglądają niemal identycznie, a różnice średnich są symboliczne, eskalowanie „problemu działu X” jest ryzykowne.

Jeżeli rozkłady i średnie w wizualizacjach zachowują spójność z obserwacjami z tabel (np. dział o najniższej średniej ma też największy udział negatywnych odpowiedzi), wnioski są stabilniejsze; jeśli wykresy przeczą pierwszym odczuciom z surowych liczb, potrzebny jest dodatkowy przegląd danych i formuł.

Wydrukowane wykresy z analizy danych leżące obok otwartego laptopa
Źródło: Pexels | Autor: Lukas Blazek

Przygotowanie danych do analizy skali Likerta w SPSS

Import danych z Excela do SPSS z kontrolą jakości

Przeniesienie danych z Excela do SPSS to krytyczny punkt kontrolny. Błędy w tym kroku multiplikują się na każdym dalszym etapie analizy.

Podstawowa procedura importu:

  1. W Excelu:
    • upewnij się, że w pierwszym wierszu są nazwy zmiennych (bez spacji, polskich znaków, znaków specjalnych – np. SAT_WYN1, DZIAL),
    • każda kolumna zawiera wyłącznie jeden typ danych (nie mieszaj liczb i tekstów w odpowiedziach skali),
    • usuń zbędne wiersze nagłówkowe, podsumowania, komentarze.
  2. Zapisz plik jako .xlsx lub .xls.
  3. W SPSS:
    • Plik > Otwórz > Dane > wybierz plik Excel,
    • zaznacz opcję „Pierwszy wiersz danych zawiera nazwy zmiennych”,
    • sprawdź podgląd – czy wszystkie kolumny są wczytane, czy liczba wierszy jest zgodna z oczekiwaną.

Po imporcie podstawą jest szybki audyt w zakładce „Widok danych” i „Widok zmiennych”:

  • czy zmienne skali Likerta mają typ numeryczny,
  • czy wartości brakujące z Excela (puste pola, kod 99) są widoczne tak, jak planowano,
  • czy nie pojawiły się kolumny „dziwne” (np. puste lub zawierające same zera).

Jeśli liczba wierszy i kolumn, typy zmiennych i kody braków są spójne z projektem arkusza Excel, można przejść do definicji etykiet; jeśli w oknie danych widzisz kolumny tekstowe tam, gdzie powinny być liczby, lub przesunięte nagłówki, import wymaga powtórzenia jeszcze przed jakąkolwiek analizą.

Definiowanie etykiet zmiennych i wartości w SPSS

Dobrze opisane zmienne w SPSS to nie tylko komfort pracy, ale też zabezpieczenie przed błędną interpretacją przez kolejną osobę korzystającą z pliku.

Kluczowe elementy w „Widoku zmiennych”:

  • Nazwa – krótka, bez spacji (np. SAT_WYN1),
  • Etykieta – pełny opis treści pozycji (np. „Jestem zadowolony z wysokości mojego wynagrodzenia”),
  • Wartości – definicja kategorii skali (1 = „Zdecydowanie się nie zgadzam”, 5 = „Zdecydowanie się zgadzam”),
  • Wartości brakujące – np. 99 jako „brak odpowiedzi”.

Przykładowa konfiguracja dla jednej zmiennej:

  • Nazwa: SAT_WYN1,
  • Etykieta: „Jestem zadowolony z wysokości mojego wynagrodzenia”,
  • Typ: Numeryczny,
  • Szerokość: 2, miejsca dziesiętne: 0,
  • Wartości:
    • 1 – Zdecydowanie się nie zgadzam
    • 2 – Nie zgadzam się
    • 3 – Ani się zgadzam, ani się nie zgadzam
    • 4 – Zgadzam się
    • 5 – Zdecydowanie się zgadzam
  • Wartości brakujące: 99 (Dyskretne).

Jeśli etykiety wartości i braków są zdefiniowane konsekwentnie dla wszystkich pozycji skali, raporty SPSS staną się czytelne także dla osób spoza zespołu; jeśli każda pozycja ma opisane wartości inaczej lub wcale, interpretacja wyników po kilku miesiącach staje się obarczona dużym ryzykiem pomyłki.

Rekodowanie pozycji odwróconych w SPSS

Przekodowanie pozycji odwróconych w SPSS jest technicznie proste, ale organizacyjnie bywa krytycznym źródłem błędów. Minimum to oddzielne przechowywanie oryginalnych i przekodowanych wersji zmiennych.

Procedura dla skali 1–5 (1 = niski poziom, 5 = wysoki poziom) przy założeniu, że np. SAT_WYN3 jest pozycją odwróconą:

  1. Przekształcenia > Oblicz zmienną (Transform > Compute Variable).
  2. Nowa zmienna: np. SAT_WYN3_R (lub odwrotnie: dopisz rozszerzenie do wersji oryginalnej – ważna jest konsekwencja w całym pliku).
  3. Wyrażenie numeryczne: 6 - SAT_WYN3.
  4. Potwierdź i uruchom.

Dla skali 1–7 formuła analogicznie: 8 - ZMIENNA. W przypadku innych zakresów (np. 0–4) bezpieczniej jest użyć rekodowania według zakresów:

  1. Przekształcenia > Przekoduj na zmienną różną (Recode into Different Variables).
  2. Wybierz zmienną, nadaj nazwę wyjściową (np. POZYCJA_R).
  3. Stare i nowe wartości:
    • 0 → 4
    • 1 → 3
    • 2 → 2
    • 3 → 1
    • 4 → 0
  4. Zatwierdź mapowanie i uruchom.

Sygnał ostrzegawczy: przepisywanie tych mapowań „z palca” przy kilku skalach i kilkudziesięciu pozycjach bez żadnego zestawienia kontrolnego. Minimalnym zabezpieczeniem jest tabela w dokumentacji z listą pozycji odwróconych i zastosowaną formułą, a także jednorodny schemat nazewnictwa (np. zawsze _R dla wersji odwróconej).

Jeśli wszystkie pozycje odwrócone są przeliczone w osobne zmienne, a do dalszych analiz wykorzystywana jest wyłącznie spójna lista przekodowanych nazw, kontrola kierunku efektu jest dużo prostsza; jeśli część analiz opiera się na zmiennych oryginalnych, a część na przekodowanych, wnioski liczbowe przestają być weryfikowalne.

Definiowanie złożonych wyników skali w SPSS

Po uporządkowaniu pojedynczych pozycji kolejnym krokiem jest utworzenie zmiennych reprezentujących podskale i wynik ogólny. SPSS pozwala zautomatyzować ten proces, o ile lista zmiennych wchodzi do skali w jasny sposób.

Przykład: podskala „Wynagrodzenie” z 4 pozycjami: SAT_WYN1, SAT_WYN2, SAT_WYN3_R, SAT_WYN4. Aby policzyć średnią indywidualną:

  1. Przekształcenia > Oblicz zmienną (Transform > Compute Variable).
  2. Nowa zmienna: SAT_WYN_MEAN.
  3. Wyrażenie numeryczne (dla średniej): MEAN(SAT_WYN1, SAT_WYN2, SAT_WYN3_R, SAT_WYN4).

Funkcja MEAN() w SPSS automatycznie pomija systemowe braki danych. Jeśli korzystasz z kodów typu 99 jako braków, zadbaj wcześniej o zdefiniowanie ich jako wartości brakujących w „Widoku zmiennych” – inaczej zostaną wliczone do średniej.

Dla sum można użyć funkcji SUM():

COMPUTE SAT_WYN_SUM = SUM(SAT_WYN1, SAT_WYN2, SAT_WYN3_R, SAT_WYN4).
EXECUTE.

W przypadku wielu podskal przydatna jest funkcja wprowadzania listy zmiennych z użyciem zakresów, np. SAT_WYN1 TO SAT_WYN4, o ile nazwy są ciągłe:

COMPUTE SAT_WYN_MEAN = MEAN(SAT_WYN1 TO SAT_WYN4).
EXECUTE.

Jeżeli podskale są zdefiniowane jako jednolite zmienne z użyciem funkcji MEAN() lub SUM() oraz braki są poprawnie zadeklarowane, każdy kolejny etap (rzetelność, porównania grupowe, modele) korzysta z tych samych spójnych definicji; jeśli podskale są liczone „na boku” w różnych plikach i różnymi formułami, audyt spójności wyników jest praktycznie niewykonalny.

Analiza rzetelności skali Likerta w SPSS

Cronbach’s alpha jako minimum dla podskal

Przed dalszym wykorzystaniem wyników złożonych wypada sprawdzić, czy pozycje w ramach podskali zachowują się w sposób spójny. Najczęściej stosowanym wskaźnikiem w SPSS jest współczynnik alfa Cronbacha.

Procedura dla jednej podskali (np. „Wynagrodzenie”):

  1. Analiza > Skala > Analiza rzetelności (Analyze > Scale > Reliability Analysis).
  2. W polu „Elementy” (Items) umieść wszystkie pozycje skali (w wersjach o poprawnym kierunku, np. SAT_WYN1, SAT_WYN2, SAT_WYN3_R, SAT_WYN4).
  3. Jako model wybierz „Alpha”.
  4. W Opcjach (Options) zaznacz:
    • „Statystyki skali” (Scale if item deleted),
    • Najczęściej zadawane pytania (FAQ)

      Czy skala Likerta to dane porządkowe czy przedziałowe?

      Formalnie odpowiedzi typu „zdecydowanie się nie zgadzam – … – zdecydowanie się zgadzam” tworzą skalę porządkową. Kolejność kategorii jest jasna, ale nie ma gwarancji, że odległości psychologiczne między kolejnymi punktami są równe. Z tego powodu pojedynczy item Likerta powinien być traktowany jak zmienna porządkowa.

      Jeśli jednak zsumujesz lub uśrednisz kilka pozycji mierzących ten sam konstrukt (np. 5–10 twierdzeń o satysfakcji z pracy), w badaniach społecznych przyjmuje się praktyczny kompromis: traktowanie takiej sumy/średniej jako przybliżonej zmiennej przedziałowej. Warunkiem jest m.in. co najmniej kilka pozycji na wymiar, rozsądnie symetryczny rozkład wyników i akceptowalna rzetelność (np. alfa Cronbacha ≥ 0,7).

      Jeśli masz jedną lub dwie pozycje na wymiar i mocno skośny rozkład, pozostań przy poziomie porządkowym. Jeśli skala jest wielopozycyjna, spójna treściowo i rozkłady wyników nie są skrajnie skośne, można rozważyć analizę jak dla danych przedziałowych.

      Kiedy mogę liczyć średnią z odpowiedzi na skali Likerta?

      Dla pojedynczego pytania średnia jest metodologicznie wątpliwa i nie powinna być główną statystyką. Bezpieczniejszy pakiet to: rozkłady procentowe odpowiedzi, moda i ewentualnie mediana. Średnia z jednego itemu silnie reaguje na skośność rozkładu i losowe skrajne odpowiedzi.

      Dla skal sumarycznych (3–5 i więcej pozycji) liczenie średniej jest powszechną praktyką, pod warunkiem że: pozycje rzeczywiście mierzą jeden konstrukt, rozkład sum/średnich jest w przybliżeniu symetryczny, a rzetelność skali jest co najmniej akceptowalna. Wtedy średniej towarzyszą odchylenie standardowe, minimum, maksimum i przedziały ufności.

      Jeśli rozkład wyników skali jest bardzo skośny lub liczebność grup porównawczych jest mała, główną statystyką centralną powinna stać się mediana, a średnia może pełnić jedynie rolę pomocniczą.

      Kiedy stosować medianę i testy nieparametryczne dla skali Likerta?

      Medianę i testy nieparametryczne (np. U Manna-Whitneya, Kruskala-Wallisa) warto traktować jako domyślną opcję, gdy poziom pomiaru pozostaje porządkowy: pojedyncze itemy, skale 2-pozycyjne, bardzo skośne rozkłady odpowiedzi albo wyraźna koncentracja wyników w jednym punkcie („zgadzam się”). W takich sytuacjach zaawansowane testy parametryczne są sygnałem ostrzegawczym.

      Jeśli tworzysz skale sumaryczne z co najmniej 3–5 pozycji, a rozkład ich sum/średnich jest umiarkowanie zróżnicowany i niezbyt skośny, możesz stosować medianę jako statystykę odporną, a jednocześnie rozważyć testy parametryczne. Gdy naruszenia założeń (skośność, małe i nierówne grupy) są istotne, przejście na mediany, kwartyle i testy nieparametryczne jest bezpieczniejszym wyborem.

      Jeśli rozkład skali jest w przybliżeniu normalny i próby są wystarczająco duże, testy parametryczne są uzasadnione. Jeśli rozkłady są wyraźnie zdeformowane lub liczebności niskie, traktuj to jako punkt kontrolny do zmiany procedury na nieparametryczną.

      Ile pozycji powinna mieć dobra skala Likerta?

      Za minimum praktyczne przyjmuje się 3 pozycje na wymiar, choć bardziej komfortowy poziom to 4–6 dobrze dobranych twierdzeń. Pojedyncze pytanie „o satysfakcję” nie tworzy skali – to tylko jeden wskaźnik, silnie podatny na chwilowy nastrój, sytuację życiową czy niezrozumienie treści.

      Skala z jedną–dwiema pozycjami to konstrukcja krucha: każdy błąd odpowiedzi mocno zmienia wynik, a poziom pomiaru pozostaje bliższy porządkowemu. Przy 3–5+ spójnych treściowo itemach można już badać rzetelność, liczyć sumy/średnie i rozważać stosowanie statystyk parametrycznych.

      Jeśli wymiar jest mierzony mniej niż 3 pytaniami albo treść pozycji jest niespójna, traktuj to jako sygnał ostrzegawczy. Jeśli masz co najmniej 3–5 pozycji, symetryczną skalę odpowiedzi i sensownie zróżnicowane wyniki, uzyskujesz fundament do stabilnej analizy.

      Czy 5‑stopniowa skala Likerta jest lepsza niż 7‑stopniowa?

      Skala 5‑punktowa to kompromis między prostotą a czułością pomiaru. Daje neutralny środek, który część respondentów wybiera z wygody, ale dla wielu z nich jest realną odpowiedzią „ani tak, ani nie”. Skala 4‑punktowa pozbawia tej opcji i wymusza decyzję „za/przeciw”, co zwiększa rozkład wyników, ale może zniekształcać pomiar u osób autentycznie niezdecydowanych.

      Skale 7‑punktowe zwiększają liczbę „odcieni” odpowiedzi i potencjał traktowania wyników jak quasi-przedziałowych, lecz wymagają od respondenta większego wysiłku w odróżnianiu kategorii. Przy zbyt dużej liczbie stopni rośnie ryzyko mylenia etykiet i losowego zaznaczania odpowiedzi.

      Jeśli badani to szeroka, zróżnicowana populacja i chcesz prostego narzędzia, 5 stopni jest bezpiecznym minimum. Jeśli pracujesz z bardziej świadomą grupą i zależy Ci na większej czułości pomiaru, 7 stopni może być uzasadnione, o ile etykiety są jasne i symetryczne.

      Kiedy mogę stosować test t i ANOVA dla skali Likerta?

      Test t i ANOVA są akceptowalne, gdy pracujesz na skalach sumarycznych (nie na pojedynczych itemach), a wynik spełnia kilka kryteriów: co najmniej 3–4 spójne treściowo pozycje na wymiar, symetryczne i jednoznaczne kategorie odpowiedzi, umiarkowanie zbliżony do normalnego rozkład sum/średnich oraz rzetelność wewnętrzna na poziomie min. ok. 0,7. W takich warunkach możesz traktować wynik jako przybliżoną zmienną przedziałową.

      Jeśli skala ma 1–2 pozycje, rozkłady są mocno skośne lub większość odpowiedzi skupia się w jednym punkcie („zgadzam się”), stosowanie testów parametrycznych staje się metodologicznym ryzykiem. Wówczas lepiej użyć testów nieparametrycznych i raportować mediany oraz kwartyle.

      Jeśli Twoja skala spełnia minimum: kilka pozycji na wymiar, sensowne rozłożenie odpowiedzi i akceptowalną rzetelność – test t czy ANOVA są do obrony, pod warunkiem że w części metodologicznej jasno opiszesz ten kompromis.

      Jak raportować wyniki skali Likerta w pracy dyplomowej lub raporcie?