Rafał Kurowski

Student, Polsko-Japońska Wyższa Szkoła Technik Komputerowych w Warszawie

Wypowiedzi

  • Rafał Kurowski
    Wpis na grupie Data Mining w biznesie w temacie Poszukiwanie zależności w detalach
    23.07.2013, 23:08

    Witam,

    Jakie macie sposoby na radzenie sobie z poszukiwaniem faktów które w waszych danych zaniżyły zaagregowane dane?

    np:
    Jan Kowalski prowadzi hurtownie owoców.
    Posiada dostawców którzy posiadają (1-n) aut.
    W każdym aucie mogą przewozić różne owoce.

    Dane detaliczne:
    dzień, ID_Dostawcy, ID_auta, ID_owocu, # sztuk

    Problem: ostatnio interes idzie gorzej i chciałby dowiedzieć się gdzie nastąpił największy spadek...

    Teraz tak, prosta analiza i np. wyświetlenie 3 tabel po kolei:
    ID_Dostawcy, dzień, # sztuk
    ID_auta, dzień, # sztuk
    ID_owocu, dzień, # sztuk

    Jest o tyle błędna że jeśli wyświetlimy np. tylko # sztuk per ID_Dostawcy to nie widzimy przypadków gdzie dostawca zaniżył dostawę gruszek a podwyższył jabłek. My natomiast chcemy wyłapać każdy przypadek który jako kombinacja pól zaniżyła poziom dostaw aby zadać pytania do biznesu w stylu: dlaczego w aucie ID=43 spadła ilość lub dlaczego dostawca ID=5 opuścił się w dostarczaniu gruszek.

    Oczywiście dla tak uproszczonego przykładu uda nam się zbudować kilka tabel przestawnych i dojść do wniosków, co jeśli jednak będzie więcej zmiennych?

    Myślałem o pętli która by brała pod uwagę każdą możliwą kombinację kolumn (w tym przypadku 3! i ilość obserwacji) i wyświetlała wyniki które w stosunku do poprzedniej obserwacji są mocno zaniżone.

    I tu pytanie do Was, może jednak są już gotowe narzędzia do takiej analizy?

Dołącz do GoldenLine

Oferty pracy

Sprawdź aktualne oferty pracy

Aplikuj w łatwy sposób

Aplikuj jednym kliknięciem

Wyślij zaproszenie do