Temat: Analiza danych Prośba o pomoc

Witam chciałem się poradzić o metodę analizy danych. Mam zbiór uczący nie pogrupowany (nie poklasyfikowany) i mam nową obserwację i chciałbym znaleźć w zbiorze uczącym obserwację jak najbardziej podobną do tej nowej.

Proszę o pomoc w znalezieniu odpowiedniej metody
Piotr Ocalewicz

Piotr Ocalewicz Statystyka, Analiza
Danych, Data Mining,
Raportowanie

Temat: Analiza danych Prośba o pomoc

Takie metody nazywa się ogólnie "uczeniem bez nauczyciela" lub "uczeniem bez nadzoru". Spis takich metod można znaleźć na Wikipedii pod tym adresem.

Tak na szybko to możesz też poszukać wśród słów-kluczy takich jak:
- metoda k-średnich
- analiza skupień
- sieć Kohonena
Wojciech Obłąk

Wojciech Obłąk Programista, Asseco
Poland

Temat: Analiza danych Prośba o pomoc

Jeśli masz zmienne dające się sensownie porangować to najprościej byłoby obliczyć odległości między punktami ze zbioru a nową obserwacją i wybrać tę parę, która ma najmniejszą odległość.

Dla większej ilości danych możesz zastosować np. KD-trees czy tam LSH.

Generalnie jest to problem distance metrics i algorytmów z rodziny Nearest Neighbor Search.Ten post został edytowany przez Autora dnia 16.09.17 o godzinie 11:50



Wyślij zaproszenie do