Analizy Statystyczne

Analizy statystyczne w pracy badacza i marketingowca. Data science.

78

Rynek generuje ogromne ilości danych. Dlatego przewagę w hiperkonkurencyjnym świecie zyskują nie Ci, którzy pozyskują więcej danych, lecz marki, które potrafią w tych nieuporządkowanych pokładach danych odnaleźć diamenty wiedzy.

 

Analizy statystyczne są trudnym do przecenienia narzędziem dostosowywania się do nowych potrzeb rynku. Wykorzystanie analiz statystycznych w strategiach marketingowych jest działaniem przekładającym się na sukces marki.

Marki korzystają z analizy danych marketingowych, jako narzędzia wspomagającego podejmowanie decyzji, prognozowanie wyników, ocenę skuteczności kampanii marketingowych, identyfikacji możliwości rynkowych i potencjalnych nowych odbiorców. Warto pamiętać przy tym, że tak jak nie ma uniwersalnej metody badawczej, tak też do analizy danych trzeba zastosować odpowiednie techniki. Należy zauważyć, że proste metody przetwarzania danych nie dają z automatu możliwości uzyskania przewagi konkurencyjnej. Do biznesu coraz poważniej wkraczają algorytmy big data – czyli przetwarzania dużych zbiorów danych. Coraz większa liczba operacji i działań jest przenoszona do świata cyfrowego a to generuje ogromne ilości danych, które trudno jest ująć prostymi dostępnymi do tej pory metodami.

 

Data Science?

Data science – modne w ostatnim okresie pojęcie  to pewien nowy trend będący połączeniem roli analityka, statystyka oraz informatyka. Fundamentem tego pojęcia jest przetwarzanie dużych zbiorów danych, niejednokrotnie gromadzonych z różnych źródeł, umiejętność szybkiej analizy (najlepiej w czasie rzeczywistym), a następnie zdolność do wyciągnięcia trafnych wniosków i rekomendacji. Data science należy zatem uznać za pewną nową dziedzinę będącą połączeniem kilku kompetencji.

 

Działaj na podstawie danych

Kompletowanie informacji i analizy danych marketingowych mają w biznesie znaczenie praktyczne i doradcze. Wartość mają – i dane, i analizy – prowadzące do wniosków, których wyniki można wdrożyć. Jedną z największych luk w świecie badań rynkowych jest to, że przedsiębiorcy nie są w stanie wyodrębnić wartościowych danych oraz zrozumieć dlaczego są cenne.

Zacznijmy od przypomnienia sprawy oczywistej: badania rynku, w których wykorzystywane są techniki ilościowe, koncentrują się przede wszystkim na faktach i analizie statystycznej zbiorów danych. Do pogłębionego rozumienia opinii i potrzeb konsumentów stosuje się metody jakościowe.

Niezależnie od rodzaju techniki analizy rynkowej przyjętej przez organizację, cel jest ten sam: poprawa działania i zapewnienie satysfakcjonujących usług dla konsumentów.

Badacze rynku polegają na danych, ponieważ mają w istocie do opowiedzenia historię. Nawet, jeżeli wydaje się to cokolwiek zaskakujące, to właśnie dobrze opowiedziana historia – oparta na faktach, czyli danych – prowadzi do rozwiązywania problemów.

Zaczyna się od pytania, a dane są tylko odpowiedzią na to pytanie. Co więcej, nawet, kiedy badacz dysponuje wyłącznie intuicją, trudną do przełożenia na precyzyjne pytania – dysponuje narzędziem, które umożliwia ujawnienie interesujących wzorców w obrębie danych, które warto badać. Narzędzie to – nazywane „Data Mining” – wykorzystuje techniki statystyczne, aby odkryć korelacje pomiędzy różnymi czynnikami i zmiennymi w dużych zbiorach danych. Trzeba pamiętać, że zestawy danych opracowywanych techniką Data Mining są często mierzone w terabajtach. Poddane następnie analizie dostarczają firmom cennych informacji o zachowaniach klientów i nawykach zakupowych, umożliwiając im bardziej efektywną sprzedaż swoich towarów.

 

Krytyczne myślenie

Z punktu widzenia specjalistów Data Science zajmujących się badaniami (w tym także badaniami rynku), najmniej komfortową sytuacją jest konieczność przesiewania ogromnych ilości danych, przy niesprecyzowanych oczekiwaniach marki, dla której wykonywane są badania. Krytyka założeń i celów jest więc fundamentem skutecznej analizy. Tylko jednoznaczny, klarowny cel uczyni pozyskaną wiedzę użyteczną. Po drodze do celu na badacza czeka jeszcze niejedna pułapka, trzeba więc sporej dawki samokrytyki, pamiętając, że przygotowywane rekomendacje staną się prawdopodobnie podstawą dla znaczących decyzji biznesowych.

 

Nieoczywiste cnoty analityczne – otwartość i bezstronność

Na najbardziej zaawansowanym poziomie, analityka marketingowa może obejmować ogromne hurtownie danych, które gromadzą dane behawioralne klientów w czasie rzeczywistym. Dodajmy do tego dziesiątki innych strumieni informacji (ze źródeł wewnętrznych i zewnętrznych) i… mamy ocean danych. Teraz „wystarczy” wydobyć to, co potrzebne do wdrażania realnych i praktycznych strategii biznesowych, które dają lepsze wyniki.

Analiza danych polega w uproszczeniu na trzech rodzajach postępowania:

  • organizowaniu danych,
  • redukcji danych poprzez ich agregowanie i poszukiwaniu istotnych zależności,
  • kategoryzacji, tak aby uchwycone wzorce mogły być łatwo identyfikowane i łączone.

Jedną z głównych rzeczy, których oczekuje się od badaczy podczas analizy danych, jest zachowanie otwartości i bezstronności w stosunku do nieoczekiwanych wzorców, wyrażeń i wyników. Czasami analiza danych opowiada najbardziej nieoczekiwane, ale ciekawe historie, których nie spodziewano się w momencie rozpoczęcia analizy danych.

 

Przygotowanie danych do analizy

Pierwszym etapem postępowania badawczego jest przygotowanie danych do analizy, które polega na walidacji danych, czyli ocenie ich jakości, trafności i rzetelności. Sprawdzana jest zgodność zebranej próbki danych z wcześniej ustalonymi standardami. Próbka danych nieobiektywna z kolei może sprawić, że badanie okaże się bezużyteczne. Walidacji poddaje się przeważnie nowe metody i narzędzia, np. kwestionariusze opracowywane przez badaczy doraźnie, na potrzeby konkretnego badania.

Szczególnie istotne dla poprawności i wiarygodności wyniku badań są:

  1. rzetelne gromadzenie rzeczywistych danych. W przypadku badań kwestionariuszowych trzeba potwierdzić, że każda odpowiedź została pozyskana od (i zarejestrowana) od rzeczywistego respondenta, który spełnia cechy oznaczone w próbie (np. płeć, wiek, zamieszkanie), zgodnie z kryteriami badawczymi.
  2. kompletność, czyli pewność, że respondent odpowiedział na wszystkie pytania w ankiecie internetowej oraz ankieter zadał wszystkie pytania opracowane w kwestionariuszu.

Ten pierwszy krok – bardzo często niedoceniany przez praktyków  i naukowców – może spowodować, że wykonywane analizy będą bezużyteczne kub będą zakłamywać rzeczywistość.

 

Etap przygotowania danych do analizy należy także rozpatrywać przez pryzmat ich pozyskiwania. W zależności od założonego celu badania/analizy konieczne staje się pozyskanie danych czy to ze źródeł już dostępnych czy też poprzez przeprowadzenie badania, sondażu, ankiety. Tutaj kluczowym elementem sukcesu jest odpowiedni dobór próby – zakładamy bowiem, że badanie populacyjne jest czasowo i kosztowo niezasadne. Należy wtedy dobrać próbę w sposób „reprezentatywny”.

 

Mit próby reprezentatywnej – etap pozyskiwania danych

Potocznie przyjęło się, że każdy badacz chce mieć „próbę reprezentatywną”. Reprezentatywność rodzi jednak szereg wątpliwości. Jeżeli chcielibyśmy bowiem mieć próbę reprezentatywną ze względu na „wszystkie parametry populacji” konieczne byłoby zbadanie wszystkich. Esencją problemu jest zatem odpowiednie zdefiniowanie – jakie parametry np. demograficzne mają być odzwierciedlone w próbie w proporcji jaką oczekuje się w populacji. Najczęściej próbę reprezentatywną ustala się jako reprezentatywną ze względu na płeć i wiek, miejsce zamieszkania (w rozumieniu regionu kraju lub rozkładu na województwa). Pewne specyficzne cele badania spowodują, że parametrów może być więcej. Koniecznie jednak muszą to być parametry, których struktura populacji jest znana. Nie możemy bowiem domagać się próby reprezentatywnej dla osób posiadających samochody ford koloru niebieskiego i psa labradora – nie posiadamy bowiem żadnej wiedzy ile % populacji spełnia ten warunek.

Istotnym elementem doboru próby oraz jej liczebności jest ustalenie max. kilku parametrów „reprezentatywności”. Każdy dodatkowy parametr powoduje bowiem, że liczebność próby powinna być wyższa.

 

Edycja i kodowanie danych

Duże zbiory danych badawczych obciążone są zwykle różnego typu błędami. Wystarczy, że respondenci błędnie wypełniają niektóre pola, lub pominą je przypadkowo. Edycja danych jest więc procesem, w którym badacze kontrolują i edytują surowe dane, zanim przystąpią do analizy.

Kodowanie danych to najważniejszy etap przygotowania danych, która jest związana z grupowaniem i przypisywaniem wartości do odpowiedzi. Badacz wprowadza w zbiory danych kryteria, porządkujące i rozróżniające zgromadzone dane, które mają na celu ułatwienie późniejszej analizy.

 

Metody analizy

Metody statystyczne do analizy danych liczbowych klasyfikowane są w dwóch grupach, przy czym pierwsza z nich służy do opisywania danych zwanych “statystykami opisowymi”, a druga do porównywania danych zwanych “statystykami referencyjnymi”.

Metoda ta jest wykorzystywana do wychwytywania podstawowych cech danych w taki sposób, że wzór w danych zaczyna mieć sens. Analiza opisowa koncentruje się na wyciąganiu wniosków wprost z analizowanych danych, w związku z hipotezą badawczą. Nazywana jest również „analizą jednowymiarową”, ponieważ jest stosowana do analizy pojedynczej zmiennej. Statystyki referencyjne z kolei są procedurami statystycznymi wykorzystywanymi do wyciągania wniosków na temat powiązań między zmiennymi. Różnią się one od statystyk opisowych tym, że są wyraźnie zaprojektowane do testowania hipotez. W tej kategorii mieszczą się liczne procedury statystyczne, z których większość jest wspierana przez nowoczesne oprogramowanie statystyczne.

Zjawiska i zmienne cenne, lecz nieobserwowalne lub trudno uchwytne wykrywane są za pomocą statystyk inferencyjnych. Na podstawie analizy obserwowanych następstw, wyznaczane są wskaźniki inferencyjne. Techniki te stosowane są częściej w badaniach społecznych i marketingowych, bo odnoszą się do takich pojęć i zachowań, jak np. patriotyzm gospodarczy, wykluczenie, albo moda.

 

5 zasad wykorzystania analityki statystycznej w marketingu

  1. Szukaj diamentów, czyli naprawdę wartościowych danych – chyba najpoważniejszym problemem jest obecnie nie tyle uzyskanie danych (bo można je pozyskiwać niemal w nieograniczonych ilościach, z różnych źródeł), ale wartość informacyjna danych. Na źródło danych i ich jakość i dokładność doświadczeni badacze zwracają uwagę już w fazie planowania badań. Z kolei z posiadając już oczekiwany zbiór danych, trzeba wiedzieć, jak się tymi danymi posłużyć i jakie cele mają zostać osiągnięte. Popularnym błędem osoby bez doświadczenia analitycznego jest oczekiwania przeanalizowania „wszystkiego” i przygotowania zestawień i testów w każdym możliwym skorelowaniu. Mając na uwadze w testach statystycznych przyjęty zwykle poziom istotności 5% (czy nawet 1%) generowanie setek testów powoduje, że co n-ty daje nam wynik „istotny statystycznie” – ale tak naprawdę jest to błąd sklasyfikowany jako przyjęte z góry dopuszczalne ryzyko popełnienia błędu I rodzaju (uznania prawdziwej hipotezy zerowej za fałszywą).
  2. Skupiaj się na problemie badawczym – im więcej danych do dyspozycji, tym wyraźniej i bardziej jednoznacznie powinien być sformułowany problem badawczy, przełożony na pytania badawcze. Dobrze przygotowane narzędzie badawcze to nie takie, za pomocą którego uda się uchwycić jak najwięcej zmiennych, ale takie, które pozwoli uzyskać możliwie precyzyjne odpowiedzi na postawione pytania. Chodzi więc o to, aby w kwestionariuszu nie zadawać zbyt wielu pytań (np. testować zbyt wielu rzeczy). Oprócz możliwego rozproszenia uwagi, analiza danych będzie trudna ze względu na możliwe interakcje między zmiennymi.
  3. Wykorzystuj dane do działań marketingowych. Postulat ten działa w dwukierunkowo:
  4. a) zbieraj i analizuj dane, które mają wartość dla planowanych działań marketingowych.
  5. b) korzystaj z wyników analiz w podejmowanych działaniach marketingowych. Zaniechanie pozbawia całe badanie sensu i sprawia, że jest bezcelowe. Analiza obejmuje przecież rozwiązania i pomysły na ulepszenia usług czy produktu, wzmocnienie pozycji marki. Jeżeli wyniki badań marketingowych nie zostaną wdrożone, to badanie jest niepotrzebną stratą czasu i energii.

Analiza statystyczna w badaniach marketingowych ma pomóc w zidentyfikowaniu i zrozumieniu osób, które mają być celem działań marketingowych. Taka analiza wpływa na firmę, na zasadzie efektu domina.

  1. Wyznaczaj precyzyjne cele i jasno określ oczekiwane skutki. Badania są przecież inwestycją, więc powinny przynieść zwrot – w formie skutecznych działań marketingowych. Wiedza o tym, co mierzyć, kiedy mierzyć i jak mierzyć, przekłada się na procedurę badawczą, skutecznie prowadzącą do celu. Równocześnie oczekiwanie, że każde działanie da się kwantyfikować i mierzyć, wymaga zastosowania technik analitycznych.
  2. Wykorzystuj dane do komunikowania się z rynkiem. Analiza dostępnych danych może pomóc marketerom w wyborze kanałów komunikacji oraz w dostosowaniu treści do grupy docelowej. Dane mogą dostarczyć użytecznych odpowiedzi na pytania kluczowe dla rozwoju marki:
  • reakcja klientów na istniejące treści,
  • ich ulubione rodzaje treści,
  • preferowane metody komunikacji,
  • kanały, których używają,
  • ich zwyczaje związane z przeglądaniem stron internetowych.

 

Rafał Piszczek Biostat
Rafał Piszczek Biostat

Rafał Piszczek
Statystyk Biostat®

www.biostat.com.pl

Statystyk. Autor publikacji naukowo badawczych i referatów z zakresu data mining w analizach ekonomicznych i branży farmaceutycznej. Specjalizuje się w komercjalizacji wiedzy naukowej w praktyce biznesowej oraz transferze wiedzy naukowej do celów biznesowych.

 

 

 

dr Sebastian Musioł Biostat
dr Sebastian Musioł Biostat

Dr Sebastian Musioł
Ekspert ds. Badań Biostat®

www.biostat.com.pl

Doktor nauk ekonomicznych, wieloletni pracownik Wydziału Informatyki i Komunikacji Uniwersytetu Ekonomicznego w Katowicach. Specjalizuje się w badaniach jakościowych, ekspertyzach i konsultacjach strategicznych. Autor publikacji naukowych w zakresie marketingu i ekonomii.