Liniowa analiza dyskryminacyjna lub liniowa analiza dyskryminacyjna (LDA) to technika statystyczna, która tworzy funkcję zdolną do klasyfikowania zjawisk, biorąc pod uwagę szereg zmiennych dyskryminujących i prawdopodobieństwo przynależności.
Dlatego mamy do czynienia z rodzajem procedury statystycznej, która ma na celu grupowanie na podstawie pewnych podobieństw. W ten sposób pozwala określić ilościowo prawdopodobieństwo przynależności do jednej lub drugiej grupy. Grupy te są znane a priori, w przeciwieństwie do analizy skupień.
Matematyczny model analizy dyskryminacyjnej
Zobaczmy, jak wyglądałby model matematyczny analizy dyskryminacyjnej.
Jest to bardzo proste, ponieważ opiera się na układzie równań liniowych. Oczywiście analiza jest bardziej skomplikowana, ale byłoby to poza pracą Economy-Wiki.com, prostą ekonomią.
Jak widać, są one zbiorem równań, których zmienna zależna (y) reprezentuje określone wyniki. Te z kolei są funkcjami liniowymi innych zmiennych dyskryminacyjnych (X) oraz szeregu parametrów (a).
Celem tych liniowych kombinacji jest maksymalizacja wariancji między grupami i minimalizacja tej, która występuje między grupami. W ten sposób nowe przypadki można pogrupować z pewnym prawdopodobieństwem, którego wartość możemy poznać, pod warunkiem, że spełniają te kryteria.
Proces, którego należy przestrzegać, aby przeprowadzić analizę dyskryminacyjną
Zobaczmy, jak można przeprowadzić tego typu analizę:
- Najpierw musisz utworzyć tabelę danych z przypadkami i zmiennymi. Uwzględniono również zmienną kategoryczną, która definiuje każdą z grup.
- Następnie generowany jest model matematyczny z danymi liczbowymi. Będzie to oparte na tym, który widzieliśmy w poprzedniej sekcji. Oprogramowanie statystyczne takie jak SPSS czy darmowy R automatyzuje cały proces.
- Wreszcie dzięki tej analizie będziemy mogli wyjaśnić, dlaczego każdy przypadek należy do tej lub innej grupy, a ponadto ustalić kryterium członkostwa dla nowych spraw. Będzie to oparte na prawdopodobieństwie objęcia jednym lub drugim.
Przykłady zastosowania analizy dyskryminacyjnej
Na koniec spójrzmy na kilka przykładów zastosowania analizy dyskryminacyjnej.
Pamiętajmy też, że we wszystkich z nich celem jest stworzenie funkcji dyskryminacyjnej, która grupuje każdy nowy przypadek według prawdopodobieństwa.
- Chcemy sklasyfikować różne kraje na podstawie ich danych makroekonomicznych: Kraje (grupy) słabo rozwinięte, wschodzące lub rozwinięte. Tworzymy funkcję dyskryminacyjną, aby obliczyć prawdopodobieństwo przynależności kraju do jednej lub drugiej grupy.
- Chcemy przeprowadzić kampanię marketingową i chcemy wiedzieć, do jakich grup należy klasyfikować osoby: W ten sposób możemy odpowiedzieć na pewne pytania, takie jak cechy charakterystyczne okazjonalnego klienta.
- Chcemy poznać poziom ryzyka (grupy) niektórych klientów w zakresie udzielenia kredytu: Wykorzystamy zmienne związane z Twoimi dochodami, miesięcznymi wydatkami, historią czy rodzajem pracy. Funkcja dyskryminacyjna dostarcza nam istotnych informacji na temat wypłacalności.
Jak widać, analiza dyskryminacyjna jest bardzo przydatna w wielu sytuacjach. Ale nie tylko związany z ekonomią, jest również używany m.in. w medycynie, geologii czy biologii.