jump to navigation

Eksploracja i eksploratorki/eksploratorzy – wyniki ogólnoświatowej ankiety 03/19/2010

Posted by Mikołaj Morzy in biznes, eksploracja danych, nauka.
trackback

Rok temu pisałem o ankiecie organizowanej przez Rexer Analytics. Właśnie dostałem jej podsumowanie. Z podsumowania wynika niezbicie, że wszystkie osoby zajmujące się eksploracją danych są mądre, piękne, spełnione zawodowo i emocjonalnie, oraz zupełnie nie przystają do informatycznych stereotypów.

Najciekawsze wyniki są związane z porównaniem odpowiedzi udzielanych przez reprezentatki i reprezentantów akademii i biznesu. Wyraźnie np. widać zupełnie inne preferencje dotyczące wykorzystywanych narzędzi. W ankiecie wzięło udział 137 osób reprezentujących akademię i 392 osoby reprezentujące biznes. Poniżej wykres obrazujący ranking ulubionych narzędzi:

Preferencje dot. narzędzi do eksploracji danych

Poza kwestią wyboru narzędzi ankieta sprawdzała także stopień satysfakcji z możliwości wykorzystywanego narzędzia.

Satysfakcja z wykorzystywanego narzędzia

Zaciekawiło mnie, w których działach przedsiębiorstw najczęściej są wykorzystywane techniki eksploracji danych. Okazuje się, że przede wszystkim w marketingu i logistyce. Bardzo cieszy wysoka pozycja departamentów R&D.

Gdzie wykorzystywane są techniki eksploracji danych?Najbardziej zdziwiły mnie wyniki pytania o typ wykształcenia osób zajmujących się ekploracją danych. Gdybym miał zgadywać, powiedziałbym, że 70% to informatyczki i informatycy. Okazuje się, że stanowimy zaledwie ćwierć społeczności! Osobiście bardzo się cieszę, że coraz więcej osób z wykształceniem socjologicznym i ekonomicznym garnie się do eksploracji danych.

Wykształcenie osób zajmujących się eksploracją danych

Ostatnie pytanie interesuje mnie w szczególności, ponieważ pozwala mi dostosować zawartość prowadzonego przeze mnie kursu do wymagań i oczekiwań rynku. Zdziwiła mnie wysoka pozycja regresji, choć, z drugiej strony, trudno o bardziej klasyczną metodę analizy danych. Zupełnie nie rozumiem, dlaczego tak wysoko na liście znalazła się faktoryzacja analiza czynnikowa, zastanawia mnie też stosunkowo wysoka pozycja sieci neuronowych. To może mieć związek z powszechnym wykorzystaniem sieci neuronowych w badaniach naukowych lub z obecnością tego narzędzia w popularnych pakietach do eksploracji.

Popularne metody eksploracji danych

Pełne podsumowanie wyników ankiety można znaleźć tutaj: Rexer Analytics 2009 Data Miner Survey Summary

Reklamy

Komentarze»

1. Michał - 03/22/2010

Co do popularności regresji. Ostatnio modnym jest, by stosować w analizie danych jak najprostsze modele. Pisze o tym Ayres w „Super Crunchers”.

2. Pawel - 03/25/2010

Ciekawi mnie jak opinie tych ponad 500 osób odnoszą się do rzeczywistości (chyba że te osoby to światowa czołówka:))

3. Beauty - 03/27/2010
4. Marcin Piechota - 03/30/2010

Factor analysis to chyba nie faktoryzacja a analiza czynnikowa. ANOVA na start zawsze jest dobra, żeby przyjrzeć się danym. My całkiem często używamy chi kwadratu, w celu przyjrzenia się danym. I wcale mnie nie dziwi wysoki udział Factor analysis.

Mikołaj - 03/30/2010

Nie „chyba” tylko „na pewno”. Co za wtopa, wstyd i poruta. Dziękuję za zwrócenie uwagi. Już poprawiam.

Marcin Piechota - 03/31/2010

Norma. Po to ludzie wymyślili testowanie. O ile software łatwo się testuje, data mining gorzej to pisanie tekstów jest prawie wogóle nietestowalne 😉

A blog do ulubionych. Pozdrawiam


Skomentuj

Wprowadź swoje dane lub kliknij jedną z tych ikon, aby się zalogować:

Logo WordPress.com

Komentujesz korzystając z konta WordPress.com. Wyloguj / Zmień )

Zdjęcie z Twittera

Komentujesz korzystając z konta Twitter. Wyloguj / Zmień )

Zdjęcie na Facebooku

Komentujesz korzystając z konta Facebook. Wyloguj / Zmień )

Zdjęcie na Google+

Komentujesz korzystając z konta Google+. Wyloguj / Zmień )

Connecting to %s

%d blogerów lubi to: