Reich S.

Reich S. madżyszan

Temat: Z inżynierii do Data Mining?

Witam,

Ostatnio rozważam przejście do bardzo szeroko rozumianego IT czy biznesu. Z różnych względów zainteresował mnie obszar Data Mining (a przynajmniej moje wyobrażenie o nim).

1 BACKGROUND: Obecnie pracuje jako inżynier lotnictwa/obliczeniowiec (mechatronika, niezawodność, wytrzymałość) w groźnie nazywającej się instytucji w Warszawie (2 lata).
Naturalnie, z racji zawodu i wykształcenia jestem za pan brat z metodami matematycznymi i analitycznymi. O narzędzia statystyczne też zdarza mi się obić w pracy.
Niestety, moje doświadczenie programistyczne jest ograniczone, z racji skupienia uwagi naukowo na innych kierunkach (nie jest to jednak dziedzina z którą miałem problemy i buńczucznie uważam że szybko nadrobię zaległości).
wiek: 26 lat.

2 CEL: stanowisko entry level w obszarze DM, analiz statycznych (?) itp. w ciagu następnych 2 lat.

3 TRUDNOŚĆ: po przejrzeniu profili na GL zauważyłem że znaczna większość ludzi pracujących w DM, posiada dyplom kierunków stricte informatycznych, ekonomicznych bądź biznesowych, zdarzy się też matematyk czy inny "czysty" statystyk. Nie wróży to dobrze dla mgr inż mechatronika/lotnika (a uważam że zestaw kwalifikacji jest wbrew pozorom podobny - ale tu moge się ZNACZNIE mylic).

4 SPOSÓB OSIĄGNIĘCIA CELU (?): oprócz przyswajania kwintali wiedzy na własną rękę (czytanie, dupogodziny przed komputerem) - PAPIEREK jako sposób na zdobycie wiarygodności w oczach rekruterów.
rozważam dwie opcje (jedynie studia zaoczne):

A - roczna podyplomówka (omawiane tu studnia na SGH lub na WNE UW), podoba mi sie tu patronat SASa.

B - dwuletnie mgr na PJWSTK w sosie Business Intelligence, Data Mining, tudziez bazy danych - daje mi to upragniony tytuł "informatyka" (ad pkt 3), ale w szkole nie do końca renomowanej (?).

5 PYTANIA DO WAS: Czy proponowane przeze mnie studia są dobrą drogą do wejścia w dziedzine DM, czy IT w biznesie (preferuję drogę A, wg mnie droga B byłaby stratą czasu)?
Czy ktoś o moim profilu nie bedzie traktowany przez "rekruterów" jako intruz?
Ja uważam, że inżynierskie doświadczenie i edukacja oraz mityczne "analityczne podejście" stanowiłyby wręcz atuty w branży - ale czy tak samo myślą pracodawcy?

podsumowując: zbliża się październik, możnaby sie wybrać na jakies studia, ale nie chcialbym zmarnowac kilku tysięcy zł i cennego czasu.

PS. wiem ze DM to szeroka dziedzina i pewnie posługuje się zbyt ogólnymi pojęciami. Ale ogolny sens mojego posta jest, mam nadzieję, jasny.

Howgh.

R

Temat: Z inżynierii do Data Mining?

Witaj,

Na początek zapoznaj się z tym wątkiem: http://www.goldenline.pl/forum/106827/studia-podyplomo...

Data mining i statystyka to gałęzie matematyki. Statystyki musisz się nauczyć (czy też odświeżyć informacje), ale to nie jest wiedza tajemna, każdy z nas zaczynał kiedyś od pojęcia średniej arytmetycznej :) Zaś pozostałe, przydatne działy, jak analiza i algebra, jest Ci zapewne znana ze studiów inżynierskich. Będzie przydatna na etapie czytania o algorytmach i próby ich zrozumienia. DM omija wiele "paskudnych" dziedzin statystyki, jak np. planowanie doświadczeń, moce testów, symulacje, błędy, hipotezy... ale z drugiej strony zazębia się z zagadnieniami probabilistyki i nie uciekniesz od tego.

Programowanie na wysokim poziomie nie jest Ci tutaj potrzebne, chyba, że będziesz sam implementował algorytmy i projektował/tworzył systemu analityczne. Podstawy programowania, jak zmienne, pętle, funkcje - przydadzą się, np. do pisania makr i automatyzowania pewnych zadań w pakietach statystycznych, jak najbardziej, ale to wszystko.

Przede wszystkim - "dupogodziny", bo trzeba nadrobić brakujący materiał. Dużo samozaparcia, bo co chwila będziesz natrafiać na nowe rzeczy, które dopiero później zaczniesz ze sobą kojarzyć. Początkowo będziesz się uczył zbyt wielu rzeczy, jako osobne zagadnienia, a dopiero potem zaczniesz "czyścić pamięć" dostrzegając uogólnienia ("wyświechtany przykład": analiza wariancji, kowariancji, regresja liniowa, regresja logistyczna i inne, analiza kanoniczna, klasyfikatory, analiza Bayesowska - to wszystko można ugryźć od różnych stron, z różnych perspektyw i powiązać w grupy "tematyczne").

Owszem, są podyplomowe kursy statystyki i DM, są także kursy tematyczne (drogie), skupiające się na konkretnych zagadnieniach. Papierki oczywiście, pomagają, ale pamiętaj o jednej, bardzo ważnej rzeczy: świadomość tego, że masz papierek nigdy nie może przykryć świadomości własnych braków. To jak z prawem jazdy - jeśli miałeś farta i zdałeś jeżdżąc w spokojny dzień obrzeżami niewielkiego miasta i w dodatku w lecie to wcale nie znaczy, że poradzisz sobie zimą w Warszawie :) Wbrew pozorom dostać się gdzieś nie jest bardzo trudno, gorzej jest się tam utrzymać, zwłaszcza, jak się nie ma nikogo do pomocy, kto o 2 w nocy wyjaśni, dlaczego coś działa tak, a nie inaczej. A wiele kursów, jak to przeczytasz w w/w wątku, zacznie od statystyki opisowej, przemieli analizę współzależności danych "męcząc" korelacje, przebiegnie po szeregach czasowych i to wszystko. Z kolei kursy tematyczne, które wprowadzą Cię w podstawy dataminingu (hasłowo, ale uporządkują Ci pewne pojęcia), np. StatSoftu (Kraków), stukną Cię po kieszeni paroma kPLN. W W-wie macie SGH, tam na pewno coś znajdziesz :)

Musisz sobie (i tylko sobie) odpowiedzieć na pytania:
a) czy masz siłę i czas na poznanie nowej dziedziny?
b) czy stać Cię na to (bo koszty się pojawią, książki, zwłaszcza zagraniczne i te o DM, bywają naprawdę drogie przez duże D, kursy też trochę kosztują, dojazdy na studia podyplomowe także). A co z oprogramowaniem? Jeśli zwiążesz się np. z SPSS, Statistiką, SAS, to będziesz usiał gdzieś ćwiczyć, bo same studia to za mało, a nocować w laboratorium nie będziesz. Koszty licencji to grube "naście-dziesiąt" tysięcy. Jeśli zwiążesz się z rozwiązaniami darmowymi, to będziesz musiał się nauczyć ich specyfiki i składni.

Książek masz dużo w Internecie, ale niektóre mają po paręset (a nawet tysięcy) stron: http://www.goldenline.pl/forum/1914834/monografie-posw...
c) czy masz gdzie ćwiczyć? Czy znasz kogoś, kto zatrudni Cię np. jako praktykanta, asystenta, gdzie będzie mógł poznawać w praktyce to, co przeczytasz w książkach i gdzie zetkniesz się z prawdziwymi problemami. Masz w W-wie firmy, w których możesz spróbować, np. http://tunedit.org
Aha, na stronach StatSoftu jest "Czytelnia", w której znajdziesz dużo rzeczywistych case'ów, fajna lektura.
d) czy na prawdę jest Ci to potrzebne? W jakim celu jest Ci to potrzebne? Co chciałbyś osiągnąć, w jakich dziedzinach. Skoro tak się tym interesujesz, to zapewne masz jakieś przemyślenia w tym kierunku. Możesz dłubać w danych, możesz "wyklikiwać scoring kredytowy", możesz opracowywać modele, a możesz projektować systemy analityczne i opracowywać nowe algorytmy.

Jeśli powyższe Cię nie zniechęciło, to początek masz zrobiony. Skoro lekarze uczą się statystyki i wielowymiarowych analiz danych, co prawda w podstawowym zakresie, ale jednak, to dlaczego inżynier miałby nie dać rady :) Jesteś w wieku, że spokojnie możesz eksperymentować.

Pozdrowienia.Adrian Olszewski edytował(a) ten post dnia 04.08.11 o godzinie 13:29
Reich S.

Reich S. madżyszan

Temat: Z inżynierii do Data Mining?

Dzięki za szybką i wyczerpującą odpowiedź.

Wniosek z Twojego postu jest w zasadzie dla mnie korzystny. Wydaje mi się. że spróbuję podszkolić się w narzędziu jakim jest Data Mining. Rozumiem także, że to narzędzie można wykorzystać w wielu dziedzinach i przyznaję, że jeszcze nie do końca wiem jaki jest wachlarz możliwych ról dla "specjalistów DM". Ale z tym sobie poradzę :).

Niemniej jednak, ze wszystkich dziedzin istotnych obecnie na rynku pracy metody DM czy "statystki stosowanej" ;) wydają mi się najbardziej interesujące pod względem specyfiki pracy, wyzwań intelektualnych no i przede wszystkim powinowactwa do pracy naukowo-inżynierskiej - nie wyrzucałbym tutaj moich paru ładnych lat nauki (w szkole i poza) zupełnie w błoto. Mam nadzieję.

Byc może mój ogląd i zrozumienie zagadnień DM i ich roli jest obecnie niekompletny i romantyczny, ale bazując na informacjach (z szerokiego internetu, z tej grupy itd) moge powiedzieć jedno: tak, chciałbym poznać i opanować tę dziedzinę. Z chęcią.

Oczywiście moje poszukiwania wynikają z braku perspektyw w "mojej" branży. Ale to długa i nudna historia.

Odniosę się do dwóch punktów z pow. postu:
b) czy stać Cię na to (bo koszty się pojawią (...) A co z oprogramowaniem? (...) Koszty licencji to grube "naście-dziesiąt" tysięcy.

*Jezeli dobrze rozumiem, to na podyplomowce z data miningu na SGH dostaje sie oprogramowanie SAS z licencja studencką, przynajmniej na czas trwania studiów. Więc po ww. studiach, z punktu widzenia pracodawcy będe przynajmniej sprawnym (?) klikaczem. Zgadzam się, teoria jest tam cieniutka i w dużej części mi znana.
Zaznaczam - dla mnie studia (a szczególnie te wspomniane) nie dają wiedzy a jedynie ładną nalepkę. Zdaje sobie sprawę, że prawdziwą, istotną, i podstawową (sic!) wiedzę będę musiał zdobyć samodzielnie - ale na szczęście jest to mój preferowany tryb nauki :).
Wydaje mi się jednak, że aby dokonać omawianego przbranżowienia muszę tę nalepkę niestety mieć.
c) czy masz gdzie ćwiczyć? Czy znasz kogoś, kto zatrudni Cię np. jako praktykanta, asystenta, (...)?

*Otóż nie za bardzo, dlatego tu jestem. W firmie troche obrabiamy duże zbiory danych pomiarowych w jednym z popularnych pakietow statystycznych, ale to pewne za mało.

Należy pamiętać że warszawski pozainżynierki rynek pracy jest dla mnie zagadką. U nas na bezpłatne praktyki bez doktoratu z kilku wybranych wydziałów przyjmują niechętnie ;) (patrz: nalepka). Zrozumiem jeżeli tak jest też gdzie indziej.

Reasumując, dzięki za pomoc. Postaram się już więcej tu nie uzewnętrzniać. Rzeczywiscie, preferuję drogę PM bo wpadam w coraz bardziej płaczliwy ton. Po co biedni ludzie skierowani z googla mają to oglądać :).

pozdrawiam.Reich S. edytował(a) ten post dnia 08.08.11 o godzinie 11:16



Wyślij zaproszenie do