jump to navigation

100 narzędzi do nauki 02/14/2010

Posted by Mikołaj Morzy in Uncategorized.
add a comment

Centre for Learning & Performance Technologies dokonało kompilacji 100 narzędzi najbardziej przydatnych w procesie uczenia/uczenia się. Przyznaję, że kryteria doboru narzędzi są dla mnie niejasne, zupełnie nie rozumiem rankingu ani powodów, dla których akurat te a nie inne aplikacje znalazły się na liście. Pierwsze 30 miejsc zajmują powszechnie znane aplikacje (Twitter, YouTube, GoogleDocs, Firefox, itp.), ale począwszy od pozycji 30 można znaleźć ciekawe narzędzia. Myślę, że przyjrzę się bliżej takim narzędziom, jak Prezi (tworzenie prezentacji z dodatkowymi efektami), Elluminate (środowisko do zdalnego uczenia i współpracy), Glogster (narzędzie do tworzenia posterów), TeacherTube (YouTube dla nauczycieli), Udutu (tworzenie kursów online) czy Edmodo (sieć społecznościowa zaprojektowana specjalnie dla nauczycieli i studentów).

Pełna lista jest dostępna tutaj a informację o niej znalazłem dzięki Judy Robertson z blogu Communications of the ACM.

Wywiad z Jennifer Widom 02/04/2010

Posted by Mikołaj Morzy in bazy danych, nauka.
1 comment so far

Jennifer WidomOstatnio natknąłem się na wywiad z Jennifer Widom. Wywiad ukazał się w SIGMOD Record vol.35 no.3 we wrześniu 2006, więc już trochę trąci myszką, ale przeczytałem go z dużym zainteresowaniem. Dla tych, którzy nie wiedzą, Jennifer Widom jest jedną z najbardziej znanych i rozpoznawalnych postaci w świecie baz danych, jej lista publikacji jest imponująca, a sama Jennifer jest motorem działania Stanford InfoLab.

W wywiadzie Jennifer Widom porusza całą masę spraw. Mówi o kierunkach swoich badań (semistrukturalne bazy danych i projekt LORE, strumieniowe bazy danych, zarządzanie niepewnością w danych), o organizacji swojej pracy, o sposobach znajdowania czasu, o godzeniu pracy zawodowej i życia rodzinnego, w szczególności wychowywania dzieci, o egzotycznych podróżach, o tym, dlaczego nigdy nie założyła żadnego start-upu i dlaczego nie chce być dziekanem. Mówi też ciekawie o tym, jak ważne jest poprawne pisanie artykułów naukowych i ich prezentowanie, o tym, w jaki sposób wybiera sobie przyszłe tematy badawcze i jak studenci wymuszają na niej okresowe zmiany obszarów pracy naukowej. Wreszcie, część wywiadu jest poświęcona grze na trąbce i temu, dlaczego zrezygnowała z kariery profesjonalnej trębaczki na rzecz informatyki (i o tym, dlaczego myśli o powrocie do trąbienia).

W latach 2007-2008 Jennifer z mężem i dwójką dzieci urządzili sobie 14-miesięczną podróż dookoła świata. Szczegółowe sprawozdanie z tej wyprawy oraz zdjęcia są dostępne na jej stronie domowej.

To bardzo ciekawy wywiad, zdecydowanie warty polecenia i poświęcenia 10 minut czasu. Wywiad jest dostępny na stronach SIGMOD Record.

Kaggle – nowy serwis internetowy związany z eksploracją danych 02/03/2010

Posted by Mikołaj Morzy in bazy danych, dataset, eksploracja danych, nauka, zbiór danych.
1 comment so far

Kaggle logoGąski, gąski do domu! czyli nowy serwis poświęcony eksploracji danych. Właśnie stałem się świadomy istnienia serwisu Kaggle, oferującego możliwość przygotowywania konkursów eksploracyjnych. Posiłkując się cytatem z Hala Variana, odpowiedzialnego za finanse Google („ciągle powtarzam, że w przeciągu najbliższych dziesięciu lat najbardziej seksownym zawodem będą statystycy„), twórcy serwisu postawili sobie za cel przygotowanie otwartej platformy umożliwiającej zorganizowanie dowolnego konkursu związanego z eksploracją danych, analizą statystyczną czy uczeniem maszynowym.

Koncepcja jest prosta. Serwis jest całkowicie darmowy i automatyzuje całą procedurę przygotowywania konkursu: rejestrację uczestników, specyfikację zbioru uczącego i testującego, opis nagrody, rejestrację i sprawdzanie rozwiązań, utrzymywanie listy najlepszych wyników, itd. Można wskazać preferowany sposób oceny nadsyłanych rozwiązań, wyspecyfikować warunki poprawności rozwiązania (Kaggle może np. sprawdzać, czy nadsyłane rozwiązania mają wystarczającą liczbę wierszy i czy wartości w poszczególnych kolumnach są właściwego typu). Cały proces budowania konkursu odbywa się przy użyciu edytorów WYSIWYG, nie ma ograniczenia na wielkość danych wejściowych.

Po co taki serwis? Autorzy twierdzą (słusznie), że otwarte konkursy stanowią fantastyczne pole innowacji i rozwoju. Klasycznym przykładem jest konkurs Netflix, w którym główna nagroda wynosiła okrągły milion dolarów. Ale nagrody wcale nie muszą być wysokie. Sam fakt udziału w takim wyścigu, możliwość porównania się z najlepszymi, duch rywalizacji i synergia pojawiająca się dzięki zderzeniu różnych technik, modeli, podejść i szkół, stanowi wystarczającą gratyfikację. Wiele firm może traktować otwarte konkursy jako doskonały sposób rozwoju swoich aplikacji i technologii czy pozyskiwać zdolnych pracowników.

W chwili obecnej serwis jest w stanie beta, czyli jego funkcjonalność i stabilność mogą odbiegać od powszechnie przyjętych standardów. Serwis jest dostępny pod adresem http://demo.kaggle.com Aktualnie dostępne są trzy konkursy: konkurs organizowany przez Orange w ramach KDD Cup 2009, konkurs dotyczący danych z australijskiej ligi futbolu AFL, oraz konkurs AusDM Analytic Challenge zorganizowany w zeszłym roku razem z konferencją AusDM’09 Australian Conference on Data Mining.

Poważnie rozważam możliwość zorganizowania konkursu eksploracyjnego jako formy zaliczenia przedmiotu „Eksploracja danych”, który będę prowadził w semestrze letnim dla specjalizacji Technologie Przetwarzania Danych…

Program badawczy Yahoo! Key Scientific Challenges 02/03/2010

Posted by Mikołaj Morzy in Uncategorized.
add a comment

Yahoo logo 25 stycznia 2010 rozpoczął się proces zbierania aplikacji do programu Yahoo! Key Scientific Challenges. W ramach programu młodzi naukowcy mogą starać się o dofinansowanie swoich badań w wybranych przez Yahoo! dziedzinach. Lista dziedzin jest interesująca i obszerna, obejmuje między innymi:

  • zarządzanie danymi
  • ekstrakcję informacji
  • ekonomię algorytmiczną
  • uczenie maszynowe
  • statystykę
  • prywatność i bezpieczeństwo
  • eksplorację danych
  • green computing
  • użyteczność

Aplikacje należy składać do 5 marca 2010, ogłoszenie wspieranych propozycji nastąpi w połowie kwietnia. Złożenie propozycji obejmuje list polecający od promotora doktoratu, życiorys, krótki (2-4) opis prowadzonych badań oraz wskazanie, który z problemów badawczych (KSC) badacz/ka podejmuje się rozwiązać. Program jest adresowany do wszystkich doktorantek i doktorantów zarejestrowanych na uczelniach wyższych (ale trzeba sprawdzić, czy dotyczy to uczelni spoza USA, nigdzie takiego ograniczenia nie znalazłem, ale być może dla Yahoo! rozumie się to „samo przez się”).

W przypadku zaakceptowania propozycji badawczej doktorant/ka otrzymują

  • dostęp do baz danych Yahoo!
  • wsparcie w wysokości $5000 na podróże, uczestnictwo w konferencjach, itp.
  • możliwość współpracy z badaczami zatrudnionymi w Yahoo!
  • zaproszenie do uczestnictwa w Key Scientific Challenges Graduate Student Summit (nieobowiązkowe)

Szczegóły projektu są umieszczone na stronach http://labs.yahoo.com/ksc oraz w zbiorze FAQ.

%d blogerów lubi to: