Analiza statystyczna jako narzędzie postępu

Świat otaczającej nas przyrody jest siedliskiem w którym ludzie gospodarują jej zasobami oraz wytwarzają idee i rozwiązania optymalizujące ich własny rozwój w tym że siedlisku.

Aby żyć w zgodzie z naturą, a także podtrzymywać brak agresji pomiędzy ludźmi i społeczeństwami są potrzebne rozwiązania, które swoim logicznym, a zarazem holistycznym charakterem wezmą pod uwagę każdą zmienność dzięki której można wyjaśnić pewne zjawiska przyrodnicze, społeczne lub ekonomiczne. Tego typu narzędzia są niezbędne by opisywać skomplikowane zależności pomiędzy zjawiskami oraz wyjaśniać ostateczne przyczyny ich powstawania, które dla ograniczonego oka obserwatora są nie do ogarnięcia. Tego typu narzędzia do weryfikacji i wyjaśniania zjawisk nazywają się analizami statystycznymi. Analizy statystyczne dzięki swoim mądrym podstawom obliczeniowym i nienagannej logice sprawiają, że bardzo zmienna i złożona rzeczywistość może być interpretowana za pomocą liczb, lunkcji lub współczynników mających znaczenie zwięzłe i interpretowalne w kontekście zebranych danych o zjawisku będącym w kręgu zainteresowania. Wyobraźmy sobie sytuację w której chcemy przewidzieć skuteczność terapii medycznej polegającej na weryfikacji skuteczności nowego środka farmakologicznego.

Analiza statystyczna w medycynie dzięki silnym potrzebom praktycznym utworzyła swoją własną statystykę nazwaną biostatystyką.

Niemniej same pojęcie biostatystyki określa tylko specyficzny obasz stosowania powszechnych analiz statystycznych. Jak by to się nie nazywało i gdzie się nie stosowało to analizy statystyczne są w stanie weryfikować losowość zjawisk. W przypadku wytwarzania nowych leków i obserwowania ich skuteczności niezbędne jest zakwestionowanie roli przypadku w uzyskanych wynikach. Można tego dokonać tylko poprzez zbieranie odpowiednich danych i poddaniu ich analizom statytycznym. W przypadku testowania nowych rozwiązań farmakologicznych analizie poddaje się grupę kontrolną oraz grupę eksperymentalną (której podano lek) i w kolejnych etapach czasowych odnotowuje sie wyniki stanu zdrowia np. poziomu cholesterolu we krwi.

Tylko i wyłączenie statystyczne weryfikowanie tego typu problemów jest w stanie zweryfikować to czy nasza domniemana przyczyna wpływa na poprawę stanu zdrowia badanych.

Jest to jeden z najprostszych modeli statystycznych. W powyższym przypadku można by było sobie jeszcze na oko oszacować wyniki. Posłużmy sie bardziej skomplikowanym przykładem. Weźmy pod uwagę problem z którym mają do czynienia banki przy udzielaniu pożyczki. Problemem tym jest ryzyko udzielenia kredytu osobie potencjalnie mogącej go nie spłacić. Ograniczenie tego ryzyka polega na statystycznej analizie danych historycznych o klientach i ich charakterystykach. Model statystyczny, polegający na klasyfikacji klientów z przeszłości do dwóch grup 1 – spłacił i 0 – nie spłacił ma na celu zweryfikowanie które czynniki najśilniej wpływają na spłatę kredytu. W tego typu postępowaniu bankowemu stosuje się oczywiście pewne aksjomatyczne założenie, że przyszłość będzie taka jak przeszłość.

Dzięki temu systemowi statystycznej klasfyikacji klientów, procedury udzielania kredytu są wystarczająco szczelne i zapobiegają udzielenia kredytu osobie która nie dosięga pewnego progu bankowej skali decyzyjnej.

Niemniej można sobie pomyśleć też tak: „Czemu mam polegać na analizach statystycznych skoro mam nosa do dawania kredytów?”. Oczywiście można tak sobie myśleć, ale z perspektywy decyzyjnej jest to niezwykle nieracjonalne ponieważ intruzje, które moga pojawić się w umyśle decydenta mogą ograniczać się tylko przyznawania kredytów samcom po 40 z młodą dziewuchą jako samiczką z którą tworzy więź. Przyznawanie kredytów tylko takiej kategorii osób z perspektywy optymalnego wykorzystania zasobów jest niestety tramatycznie słabe. Poniewż kredyt można również przyznać mamisynkowi po 25 roku życia z 3 kierunkami studiów i pracą opłacaną na 10 tyś miesięcznie. Analizy statystyczne świetnie sobie radzą z ogarnięciem takiej złożoności czynników wpływającej na dane zjawisko.

Dzięki temu statystycznemu rozwiązaniu kredyty stały sie bardziej powszechne z tego względu, że banki nie ponoszą ryzyka i mogą optymalizować zarządzanie swoimi zasabami (oczywiście zależnie od swojej sytuacji majątkowej).

Podsumowując. Człowiek nie jest w stanie wziąć pod uwagę łącznie 150 informacji o człowieku i podjąć deycji o trafnym przyznaniu kredytu. Ludzie mają problem kogo wybrać za partnera życiowego, a co dopiero podejmować tak trudne decyzje. Niemniej analizy statystyczne nie mają z tym problemu. Algorytm obliczeniowy leżący np. u podstaw regresji logistycznej bez problemu nadaje wagi wszystkim informacjom wziętym pod uwage w analizie i na ich podstawie jest w stanie dokonać odpowiedniej decyzji. Powyższa analiza i postępowanie analityczne jest zagnieżdżone w koncepcji analizy ryzyka kredytowego (Credit Scoringu) i ma niesamowitą skuteczność dzisiejszych czasach. Ciekawe jest to, że firmy materketingowe zapozyczyły tę koncepcję w celu dokonywania oceny swoich klientów jako tego, czy sa gotowi do kupna, czy tylko sie rozglądają. Jeśli analiza statystyczna wykaże, że taki klient tylko sie rozgląda to firma podejmuje decyzję o tym, aby przygotować tego klienta do kupna. Niemniej jeśli widzi, że klient jest gotowy do kupna to po prostu wysyła mu gotową ofertę.

Oczywiście tego typu analizy statystyczne są o wiele bardziej rozbudowane i mają wysoki poziom skomplikowania. Niemniej są chętnie wykorzystywne.

Biorąc pod uwagę powyższe korzyści wynikające z poddawania analizie statystycznej różnych danych, w całkowicie odmiennych kontekstach i obszarach gospodarowania można jasno stwierdzić, że takie podejście do podejmowania decyzji o ludziach i zasobach jest niezwykle postępowe i zanosi się na to, że trend wykorzystywania statystyki i tworzenia nowych algorytmów analitycznych będzie rósł w zastraszającym tempie.

Niemniej wszystko ma swoje strony białe, ale ma też strony czarne. Często w mediach kiedy wykorzystuje się słowa „statystyka” lub „statystyczna analiza danych wykazała” redaktorzy i dziennikarze ślinią się jak psy pawłowa. Po pojawieniu się tych haseł starają się ośmieszać i deprecjonować znaczenie statystyki i jej potencjału. Niemniej oni „gdzieś tam byli” i „ coś tam widzieli”. Mają trochę w tym racji z tego względu, że niektórzy ludzie wykorzystują liczby i statystyki by przekazać, przwdziwe co prawda informacje, ale nie ukazujące pełnego kontekstu zjawiska. Bo co innego jest 50% wzatrudnienia w firmie mającej 3 pracowników, a firmie mające 2 tyś pracowników. Manipulowanie takimi statystykami wprowadza lekki zamęt. Można powiedzieć, że to wyżej wymienione zjawisko zalicza się do części analiz statystycznych w strony czarnej, w której to statystykę wykorzystuje się do szczucia lub poniżania.

Strona biała. To strona szlachetna, nadająca sens naszemu życiu społecznemu, niesprzecznemu rozwojowi zgody między techniką, a przyrodą oraz postępowi naukowemu.

Ważny tutaj jest do podkreślenia postęp naukowy. Nie skłamię, ale moge trochę naciągnąć. Według mnie, a wiem, że wiele osób by się ze mną zgodziło, że statystyka i analizy statystyczne stosowane w naukach empirycznych nadały rozmachu i niesamowitego postepu w odkrywaniu nowych pojeć, znaczeń oraz zmian paradygmatów i koncepcji teoretycznych. To dzięki porównywaniu modeli statystycznych będących odzwierciedleniem koncepcji teoretycznych można było decydować o przyjęciu poglądów lepiej opisujących świat społczeny lub przyrodniczy przy równoczesnej większej prostocie składowych weń wchodzących. Tylko i włyłącznie dzięki tak zaawansowanym analizom statystycznym jak Modelowanie Równań Strukturalnych można dokonywać takich dyskryminacyjnych decyzji.

Kończąc ten wywód chciałbym zachęcić do skorzystania z oferty analiz statystycznych i pomocy w statystyce oraz metoodlogii badań firmy zajmującej statystyką i specjalizującej sie w przetwarzaniu danych ilościowych. Www.nauka.metodolog.pl