Metody doboru próby badawczej
Dobór próby jest to proces obejmujący zdefiniowanie badanej zbiorowości, określenie operatu losowania, ustalenie liczebności próby, wybór metody doboru próby oraz pobranie próby z określonego planu.
Metoda doboru próby jest to sposób, w jaki elementy populacji badanej są dobierane z tej populacji.
W procesie doboru próby wykorzystuje się wykazy, czyli operat populacji badanej, który jest zbiorem elementów tej populacji odwzorowany na określonej liście, z której dobiera się próbę. Metody doboru próby dzielą się zasadniczo na dwie grupy: metody doboru losowego – probabilistyczne oraz metody nielosowe – nieprobabilistyczne.
Reprezentatywną próbę jednostek populacji można otrzymać, stosując zarówno probabilistyczne (losowe), jak i nieprobabilistyczne (nielosowe) techniki wyboru próby.
W zależności od przyjętej metodologii badawczej, BBM Biuro Badań Marketingowych stosuje niżej wymienione techniki pobierania próby.
Metody doboru losowego – probabilistyczne:
To procedury oparte na mechanizmach losujących elementy do próby w taki sposób, aby każda jednostka populacji miała jednakową szansę dostania się do próby.
- dobór losowy prosty – jest najprostszym sposobem doboru próby badawczej. Polega on na bezpośrednim i nieograniczonym doborze jednostek badanych do próby statystycznej wprost z populacji generalnej i bez ograniczeń. Istnieją dwa rodzaje doboru losowego prostego: dobór losowy prosty niezależny, czyli ze zwarciem, oraz dobór losowy prosty zależny, czyli bez zwarcia. Wśród technik doboru losowego prostego stosuje się wiele sposobów bezpośredniego i nieograniczonego doboru. Klasycznym sposobem jest losowanie za pomocą urny. Polega ono na zastąpieniu poszczególnych jednostek badanych losami (numerami), które umieszcza się w odpowioedniej urnie, a następnie po dokonaniu wymieszania losuje się, z zachowaniem wszelkich reguł prawdopodobieństwa, odpowiednią liczbę losów niezbędną do badań. Próba tak dobrana ma wszelkie cechy próby reprezentacyjnej. Drugim sposobem doboru jednostek do próby jest losowanie za pomocą tablicy liczb losowych. Polega on na ponumerowaniu wszystkich jednostek populacji generalnej i odczytaniu w ustalonej kolejności liczb z tablic liczb losowych.
- dobór losowy systematyczny – należy również do typu losowania bezpośredniego, ale ograniczonego. Mianowicie, dobór ten jest ograniczony do jednostek z pewnego przedziału liczbowego. Metoda doboru losowego systematycznego polega na wyborze z uporządkowanego zbioru jednostek populacji – odpowiedniej liczby jednostek w równych odstępach (interwałach - k). Np. N=2000, n-200, K=N/n
- dobór losowy warstwowy – polega na podziale całej populacji generalnej na tzw. warstwy i dokonaniu bezpośredniego losowania niezależnych prób w obrębie każdej warstwy. Podział populacji na warstwy musi być przeprowadzony w taki sposób, aby każdy element wchodził tylko do jednej warstwy i znajdował się w któreś z nich. Same warstwy powinny być jednorodne i różnić się między sobą istotnie. Wyróżnia się trzy rodzaje doboru losowania warstwowego: dobór proporcjonalny, dobór nieproporcjonalny i dobór optymalny.
- dobór losowy grupowy (zespołowy) – losuje się bezpośrednio nie jednostki badawcze, lecz ich zespoły, a więc grupy tych jednostek, np. rodziny, klasy szkolne, zakłady pracy, dzielnice itp. Dobór próby w tym schemacie polega na wylosowaniu do próby pewnej liczby grup i badaniu wszystkich jednostek należących do tych grup. Istnieją dwa sposoby doboru losowego grupowego: dobór z jednakowymi prawdopodobieństwami wyboru oraz dobór z różnymi prawdopodobieństwami wyboru.
- dobór losowy wielostopniowy – jest metodą kolejnego losowania zespołów jednostek coraz to niższego stopnia, powstających z podziału zespołów wyższego stopnia. Najpierw wybiera się jednostki losowania pierwszego stopnia, składające się dużych zespołów jednostek badania. Następnie jednostki te dzieli się na mniejsze zespoły, zwane jednostkami losowania drugiego stopnia. Z kolei jednostki te dzieli się na jeszcze mniejsze zespoły, zwane jednostkami losowania trzeciego stopnia, aż w końcu dochodzi się do podstawowych jednostek badania.
- dobór losowy wielofazowy – jest metodą doboru prób losowych w kilku fazach, ale zawsze w obrębie tej samej kategorii jednostek. Dobór wielofazowy polega na wyborze w pierwszej fazie większej próby losowej, a w drugiej (lub dalszej) fazie – na wyborze z niej jednej lub więcej mniejszych prób losowych. Dobór losowy wielofazowy stosuje się w przypadku gdy uzyskanie informacji jest trudne (wywiad głębinowy) lub zbyt kosztowne (eksperyment rynkowy), skutkiem czego należy ograniczyć badania do stosunkowo niewielkiej i dobrze wyselekcjonowanej próby.
Metody doboru nielosowego – nieprobabilistyczne:
To takie techniki wyboru próby, w których nie stosuje się procedur losowania, lecz inne procedury, oparte przede wszystkim na subiektywnych decyzjach, opartych na znanych danych obiektywnych, odnoszących się do znajomości struktury badanej populacji.
- dobór kwotowy – w doborze próby możliwe jest określenie przez badacza, w sposób arbitralny, które z jednostek populacji generalnej znajdują się w próbie. Dobór kwotowy opiera się on na znajomości struktury populacji generalnej. Do próby dobiera się te elementy, które spełniają żądane cechy w taki sposób aby ich rozkład w próbie odpowiadał rozkładowi tych cech w populacji generalnej. Jest to jeden z najbardziej popularnych doborów próby w badaniach marketingowych.
- dobór jednostek typowych – należy do często stosowanych metod doboru nielosowego. Polega on na wyborze najbardziej typowych reprezentantów populacji generalnej przez przyjecie jednostek przeciętnych. Jednostki te przez swą „przeciętność” nie muszą być zbyt liczne.
- dobór przez eliminację – jest w pewnym sensie przeciwieństwem doboru jednostek typowych. Zamiast bowiem dobierać jednostki typowe – eliminuje się wszystkie jednostki nietypowe, odbiegające znacznie od przeciętnych.
- dobór celowy – jest najbardziej typowym przypadkiem doboru nielosowego. Polega on bowiem na całkowicie subiektywnym wyborze jednostek badanych do próby, w nadziei uzyskania najszerszych i najpełniejszych informacji.
- dobór przypadkowy – wbrew jego nazwie jest również doborem nielosowym. Polega on bowiem na przypadkowym (na „chybił – trafił”) doborze pewnych jednostek, które w danej (przypadkowej) sytuacji znalazły się w dogodnym zasięgu. Może to być np. wywiad na ulicy czy w sklepie w czasie przypadkowych sytuacji.
- dobór wygodny – technika doboru nielosowego, polegająca na wyborze osób badanych z grona bliskich krewnych bądź znajomych.
- dobór sieciowy – technika doboru nielosowego polegająca na wyborze respondentów spośród klientów określonej sieci usługowej, np. pacjentów gabinetu dentystycznego.
- dobór kuli śniegowej – dobór polegający na dotarciu do nielicznej grupy badanych, a następnie za ich pośrednictwem do kolejnych znanych im jednostek o podobnych cechach. W ten sposób następuje zwiększenie liczby jednostek w próbie aż do uzyskania zakładanej liczebności próby.
Wielkość próby badawczej:
Jest to określenie liczebności próby, jak liczna ma być próba, aby na podstawie wyników jej pomiaru możliwe było wyciąganie wniosków o badanej populacji, wniosków charakteryzujących się określoną dokładnością i stopniem pewności. Ustalenie wielkości próby badawczej jest procedurą dość skomplikowaną i wymaga pewnej wiedzy z zakresu wnioskowania statystycznego i teorii próby losowej. Istnieją zasadniczo cztery sposoby określenia rozmiaru próby:
- Pierwsze podejście – polega na tym, że analityk może wybrać próbę albo arbitralnie, albo na podstawie własnych osądów.
- Drugi podejście – zdeterminowane analizami, charakteryzuje się tym , że rozmiar próby jest określony poprzez minimalne liczby potrzebnych obserwacji w tablicy kondygnacji.
- Trzeci podejście – budżet może ograniczyć rozmiar próby.
Wszystkie powyższe metody mimo że nie mają probabilistycznego podłoża, to jednak mogą być stosowane również w metodach o losowym doborze.
- Czwarte podejście – to ustalenie rozmiaru próby na podstawie określonego z góry poziomu precyzji.
Istnieją dwie klasy procedur dostępnych do szacowania rozmiaru próby:
Pierwsza oparta jest na konstruowaniu przedziałów ufności wokół średniej próby lub proporcji próby. Ta klasa może być nazwana podejściem opartym na przedziałach ufności – współczynnik ufności. Oznacza się go najczęściej jako (1-α) i określa jako 100 (1-α) - procentowy przedział ufności, w którym samo α – jest poziomem istotności, który wyraża prawdopodobieństwo popełnienia błędu I rodzaju. Określa maksymalne ryzyko błędu jakie jesteśmy skłonni zaakceptować. Najczęściej przyjmuje się arbitralnie α = 0.05; 0.03 lub 0.01.
Współczynnik zależny od przyjętego poziomu ufności:
- 0.90 (tj.90%) = 1,64
- 0.95 (tj.95%) = 1,96
- 0.99 (tj.99%) = 2,58
Druga jest oparta na sprawdzaniu hipotez z uwzględnieniem zarówno błędu I rodzaju (odrzucenia prawdziwej hipotezy zerowej), jak i błędu II rodzaju (przyjęcie fałszywej hipotezy zerowej). Obydwie procedury zależą od przyjętego schematu losowania.
Terminologia związana z doborem próby
- Element: obiekt o którym zbieramy informacje i który dostarcza podstaw do analiz. W badaniach to najczęściej ludzie, rodziny, firmy itp.
- Populacja (Theoretical population): określony teoretycznie zbiór elementów badania wykazujących określone cechy.
- Populacja badana (Study population): zbiór elementów, z którego próba jest faktycznie pobrana.
- Lista/operat (The Sampling Frame): lista dostępnej części populacji, z której jest pobierana próba.
- Próba (The Sample): część zbiorowości, której elementy dobierane są przy zachowaniu określonych zasad warunkujących zarówno liczbę owych elementów, jak i relację występującą pomiędzy próbą a populacją. Elementy wybrane do danych badań.
- Jednostka doboru próby: pojedynczy obiekt z populacji, z której będzie pobierana próba.
W wielu przypadkach prowadzenie badań marketingowych opiera się na założonych wielkościach prób badawczych. Jedną z praktycznych metod określenia liczebności próby jest podejście oparte o oczekiwaną szczegółowość klasyfikacji krzyżowej w analizie tabularycznej danych, która jest jedną z najbardziej popularnych form analizy danych empirycznych. Ostateczna wielkość próby uzależniona jest przede wszystkim od zakresu terytorialnego badania, rodzaju podmiotów uczestniczących w badaniu oraz liczby analizowanych podgrup (segmentów).
Przykładowe wielkości prób badawczych w zależności od typu tabulacji krzyżowej.
Liczba analizowanych | Jednostki lub gospodarstwa domowe | Instytucje | ||
Krajowe | Regionalne lub specjalne | Krajowe | Regionalne lub specjalne | |
Niewiele 1 - 9 | 1000 - 1500 | 200 - 500 | 200 - 500 | 50 - 200 |
Przeciętnie 10 - 30 | 1500 - 2500 | 500 - 1000 | 500 - 1000 | 200 - 500 |
Wiele powyżej 30 | 2500+ | 1000+ | 1000+ | 500+ |
Źródło: J.Bazarnik, T.Grabiński, E.Kąciak, S.Mynarski, A.Sagan, Badania Marketingowe. Metody i Oprogramowanie Komputerowe, Canadian Consortium of Management Schools, Akademia Ekonomiczna w Krakowie, Warszawa – Kraków 1992, str.16.
Uwaga: należy pamiętać, że uogólnianie wyników badań uzyskanych na próbach mniejszych niż 100 konsumentów lub gospodarstw domowych oraz mniejszych niż 50 przedsiębiorstw lub instytucji jest w zasadzie niemożliwe i wyniki takie należy traktować z największą ostrożnością. Zalecana minimalna liczebność próby badawczej powinna wynosić pow. n = 200.