jump to navigation

Kto chce do Google? 11/10/2011

Posted by Mikołaj Morzy in konkurs.
1 comment so far

Google logo

Jako osoba współpracująca okazyjnie z Google (przede wszystkim poprzez poznański GTUG) otrzymałem prośbę o zarekomendowanie do 3 studentek i studentów, którzy chcieliby odbyć praktyki lub ubiegać się o zatrudnienie w Google w 2012 roku. Termin zgłaszania pierwszej tury wniosków upływa 18 listopada, więc jeśli ktoś jest zainteresowany, to proszę o pilny kontakt. Szczegóły oferty znajdują się na stronie http://www.google.com/intl/en/jobs/students/tech/

Ponieważ ma to być moja rekomendacja, jestem gotowy ją wystawić jedynie osobom, które znam osobiście (np. z którymi miałem przyjemność mieć zajęcia).

Nagrody Ig Noble 2011 10/09/2011

Posted by Mikołaj Morzy in humor, konkurs, nauka.
1 comment so far

The Ig Nobel Prize logo

 

 

Po długiej przerwie wracamy. I od razu zapowiem, że w tym semestrze będzie się działo bardzo, bardzo dużo.

 

  • zaczęła się już nowa edycja przedmiotu „Technologie semantyczne i sieci społecznościowe„, w tej edycji wprowadziliśmy z Agnieszką Ławrynowicz pewną nowinkę: każda studentka i każdy student zobowiązani są do napisania w trakcie trwania semestru dwóch postów na blogu TSiSS@PUT: Web 3.0 nad Wartą. Pierwsze wpisy się już pojawiły i zdecydowanie warto śledzić tego bloga, liczę, że nasze studentki i studenci rozwiną skrzydła. Wymogi są dwa (1) post musi być tematycznie związany z przedmiotem (2) wpis musi mieć co najmniej 1000 słów. Szczegóły tutaj.
  • mam nadzieję, że pod koniec semestru będę miał okazję i możliwość poinformować o czymś bardzo dużym w domenie sieci społecznościowych. W tej chwili zmuszony jestem milczeć jak grób, ale jeśli rzeczy potoczą się tak, jak na to liczę, to w okolicach stycznia/lutego będziemy mieli nie lada niespodziankę do zaprezentowania

A tym czasem 29 września 2011 roku ogłoszono zwycięzców tegorocznych nagród Ig Noble. Poniżej lista uhonorowanych:

Muszę przyznać, że ta ostatnia nagroda tak bardzo mi się spodobała, że od razu prezentuję stosowny dowód filmowy. Dla pozostałych nagród poniżej znajdziecie referencje do nagrodzonych publikacji.

Referencje

[1]No Evidence Of Contagious Yawning in the Red-Footed Tortoise Geochelone carbonaria” Anna Wilkinson, Natalie Sebanz, Isabella Mandl, Ludwig Huber, Current Zoology, vol. 57, no. 4, 2011. pp. 477-84.

[2] US patent application 2010/0308995 A1. Filing date: Feb 5, 2009.

[3] „Inhibitory Spillover: Increased Urination Urgency Facilitates Impulse Control in Unrelated Domains” Mirjam A. Tuk, Debra Trampe and Luk Warlop, Psychological Science, vol. 22, no. 5, May 2011, pp. 627-633.

[4] „Is a Sigh ‚Just a Sigh’? Sighs as Emotional Signals and Responses to a Difficult Task” Karl Halvor Teigen, Scandinavian Journal of Psychology, vol. 49, no. 1, 2008, pp. 49–57.

[5] „How to Procrastinate and Still Get Things Done” John Perry, Chronicle of Higher Education, February 23, 1996

[6] „Beetles on the Bottle” D.T. Gwynne and D.C.F. Rentz, Antenna: Proceedings (A) of the Royal Entomological Society London, vol. 8, no. 3, 1984, pp. 116-7.

[7] „Dizziness in Discus Throwers is Related to Motion Sickness Generated While Spinning,” Philippe Perrin, Cyril Perrot, Dominique Deviterne, Bruno Ragaru and Herman Kingma, Acta Oto-laryngologica, vol. 120, no. 3, March 2000, pp. 390–5.

[8] http://www.youtube.com/watch?v=V-fWN0FmcIU

Najlepsza praca magisterska z informatyki 06/03/2011

Posted by Mikołaj Morzy in konkurs, nauka.
add a comment

Logo Oddziału Dolnośląskiego PTI Jak co roku Oddział Dolnośląski Polskiego Towarzystwa Informatycznego organizuje konkurs na najlepszą pracę magisterską związaną z informatyką. Tegoroczna edycja jest już 28 edycją tego prestiżowego konkursu. Warunkiem uczestnictwa jest obrona pracy do 30 września bieżącego roku. Wszystkie szczegóły dotyczące kryterium oceny, formy zgłaszania prac, itp., są dostępne w regulaminie konkursu.

Zachęcam szczególnie naszych studentów do rozważenia uczestnictwa, bo konkurs ma długą tradycję i w przypadku uzyskania miejsca na podium lub wyróżnienia pracy jest się czym pochwalić w CV. Patrzyłem też na historię uczestnictwa różnych uczelni, moglibyśmy wypadać ciut lepiej.

Konkursy, konkursy, konkursy 06/02/2011

Posted by Mikołaj Morzy in eksploracja danych, konkurs, nauka.
add a comment

Logo of the TunedIt websiteDziś o dwóch konkursach organizowanych na platformie TunedIt. Pierwszy konkurs zorganizowała kanadyjska firma FIND Technologies, konkurs dotyczy rozpoznawania substancji na podstawie ich własności elektro-magnetycznych. Firma produkuje czujniki, które w sposób całkowicie pasywny, analizując jedynie własności elektryczne i magnetyczne dowolnego materiału, określa rodzaj substancji. Okazuje się, że każda substancja posiada swoje „odciski palców”. Firma pracuje nad algorytmem, który będzie w stanie szybko i precyzyjnie określać, jakie substancje są zawarte w próbce materiału. Ponieważ budowa takiego algorytmu wykracza poza kompetencje FIND Technologies, kierownictwo firmy postanowiło pójść w crowdsourcing. Reguły są proste: zmienna celu przyjmuje trzy wartości, zbiory uczący i testowy zawierają po 1500 próbek, główna wygrana zostanie przyznana za osiągnięcie progu 95% dokładności klasyfikacji. Dodatkowo, uczestnicy konkursu dysponują pomocniczym zbiorem testowym składającym się z 500 instancji, na którym mogą sprawdzać swoje modele. Konkurs będzie trwał pół roku. Główna wygrana wynosi 45 000$, dodatkowo uczestnicy dostają po 1000$ za osiągnięcie progów 50%, 60%, 70%, 80% i 90% dokładności. Szczegóły konkursu, formularz rejestracyjny i zbiory danych do pobrania na głównej stronie konkursu: http://tunedit.org/challenge/material-classification

Drugi konkurs dotyczy rekomendacji wideo na portalu VideoLectures.net. Ten konkurs, ogłoszony jako VL.net Challenge na ECML/PKDD’2011, potrwa jeszcze jedynie 36 dni. Co prawda nagroda jest dużo skromniejsza (5500 EUR), ale za to wygrany zespół będzie się prezentował na jednej z wiodących światowych konferencji poświęconych eksploracji danych. W przypadku tego konkursu celem jest opracowanie modelu, który będzie rekomendował sekwencje wykładów i prezentacji na podstawie historii interakcji użytkownika z portalem VideoLectures.net. Konkurs podzielony jest na trzy części:

  • problem zimnego startu: rekomendowanie wideo dla osób nie posiadających praktycznie żadnej wcześniejszej historii (ew. rekomendowanie powiązanych wideo dla nowych nagrań)
  • problem rekomendacji dla trójek: budowanie rankingu powiązanych wideo dla trójek nagrań występujących często w sekwencjach użytkowników
  • konkurs na najlepszy przepływ (ang. workflow) rekomendacyjny zaimplementowany w Rapid Minerze (osoba która wygra ten konkurs pojedzie na RCOMM’2012, coroczną konferencję użytkowników Rapid Minera)

Szczególnie serdecznie chciałem zachęcić do udziału w tym drugim konkursie, ponieważ jego wyniki zostaną wykorzystane w projekcie e-Lico, w którym mam przyjemność brać udział. Pamiętajcie (drogie studentki i drodzy studenci), że takie konkursy to najfajniejszy sposób na rozpoczęcie swojej przygody z prawdziwą dorosłą nauką.

Konkurs „Executable Paper Grand Challenge” 12/26/2010

Posted by Mikołaj Morzy in konkurs, nauka, teoria.
add a comment

Logo of the Elsevier publishing companyRecenzowanie prac naukowych, w szczególności w informatyce, od lat obarczone jest poważną wadą. Recenzji podlega jedynie ostateczny wynik, czyli publikacja, natomiast nie ma możliwości oceny procesu naukowego, który do publikacji doprowadził. Nie można ocenić poprawności eksperymentu, nie można zweryfikować poprawności danych. Ba, nie wiadomo nawet, czy opisywane w publikacji eksperymenty w ogóle zostały przeprowadzone lub czy rzeczywiście dały takie wyniki, jakie zaprezentowano w publikacji. Czy mało jest nieuczciwych ludzi, którzy bezczelnie nakłamią lub nagną wyniki byle przejść przez sito recenzji? I trudno mieć pretensje do recenzentów, którzy wykonują swoją pracę społecznie, najczęściej nie jest to związane z jakimś wielkim prestiżem, a dodatkowo mają do wykonania po kilka-kilkanaście recenzji na pojedynczą konferencję.

Ciekawe rozwiązanie tego problemu zaprezentował Elsevier. Ogłosił konkurs „Executable Paper Grand Challenge” na propozycję prototypowego systemu wspomagającego pracę recenzentów, który umożliwiałby współdzielenie danych, programów, eksperymentów i wyników między autorami i recenzentami. Celem projektu ma być powstanie „wykonywalnego artykułu” (ang. executable paper), który będzie komatybilny z wieloma różnymi systemami operacyjnymi i będzie umożliwiał efektywną komunikację między recenzentem i autorem. W szczególności autorzy konkursu chcą, aby proponowane rozwiązania skupiały się na następujących czynnikach:

  • wykonywalność: tabele, wykresy czy równania muszą być wykonywalne, tj. recenzenci muszą mieć możliwość interaktywnej pracy z wymienionymi komponentami aby walidować poprawność wyników i z łatwością eksplorować przestrzeń rozwiązań (aby sprawdzić, czy np. autor nie publikuje tylko niewielkiego zakresu pozytywnych wyników i nie ukrywa tych obszarów w przestrzeni rozwiązań, gdzie zaproponowany algorytm zawodzi.
  • kompatybilność: proponowana architektura systemu powinna być elastyczna i umożliwiać adaptację do dużego bogactwa środowisk programistycznych i systemowych.
  • walidacja: system powinien umożliwiać (przynajmniej częściową) walidację uzyskanych rozwiązań aby odciążać recenzentów. Przykładowo, automatyczna walidacja jest możliwa choćby przy statystycznej obróbce wyników, wyznaczaniu przedziałów ufności, wyznaczaniu błędów, itp.
  • prawa autorskie: idea powszechnego dostępu do danych jest na naszych oczach bardzo często naruszana, często na najlepszych konferencjach widzimy wyniki badań przeprowadzonych na zamkniętych zbiorach danych (np. od Google czy Yahoo!) niedostępnych recenzentom i reszcie społeczności. W proponowanej architekturze należy dążyć do otwarcia dostępu do danych, przy jednoczesnym zachowaniu praw autorskich i innych ograniczeń (wyobrażam sobie, że mogłyby w tym pomóc techniki anonimizacji danych, kontrolowane wprowadzanie szumu do danych, itp)
  • rozmiar: wiele eksperymentów jest prowadzonych na ogromnych wolumenach danych, proponowana architektura powinna umożliwiać współpracę i współdzielenie takich zbiorów danych w efektywny i wydajny sposób.
  • kontrola dostępu: w naturalny sposób architektura musi umożliwiać śledzenie wszelkich akcji podejmowanych na takich wykonywalnych publikacjach.
  • inne problemy: kradzież pomysłów i danych przez recenzentów, wirusy i trojany wprowadzane do danych, algorytmów i kodu, plagiaryzm, i potencjalnie sto innych problemów.

Pierwszą nagrodą w konkursie jest $10 000, drugie miejsce jest premiowane $5 000, trzecie miejsce jest warte $2 500. Dodatkowo, propozycje które dotrą na podium będą nagrodzone iPadem. Zwycięzcy zostaną wyłonieni w trakcie warsztatu odbywającego się w trakcie tegorocznej konferencji ICCS’2011 w Japonii (Elsevier zobowiązuje się wspomóc finansowo w podróży). Finaliści będą także zaproszeni do opublikowania swoich rozwiązań w Journal of Computational Science. Propozycje rozwiązań w postaci streszczenia (max. 2000 słów, trzeba się streszczać, bo ten post ma ok. 500 słów) należy składać do 15 stycznia. Szczegółowe reguły konkursu, zasady i sposób zgłaszania propozycji, skład komisji, itp. znajdują się na stronach konkursu.

Od dawna mam poważne obiekcje co do sposobu funkcjonowania współczesnej nauki, w szczególności do procesu recenzowania prac naukowych. Propozycja Elseviera bardzo mi się podoba, bo to dobry przykład kierunku, w którym nauka powinna iść. Polepszenie jakości recenzji naukowych jest warunkiem sine qua non polepszenia jakości publikacji naukowych i postępu naukowego i proponowany system bez wątpienia przyczyniłby się do poprawy jakości recenzji dla konferencji i czasopism.

Kaggle w klasie 11/23/2010

Posted by Mikołaj Morzy in eksploracja danych, konkurs, nauka.
add a comment

Choroba, ubiegli mnie. Dokładnie to chciałem zrobić w przyszłym semestrze na zajęciach z eksploracji danych. W ramach kursu Statistics 202 na Stanfordzie studenci mogą uniknąć konieczności przystępowania do egzaminu końcowego jeśli dobrze poradzą sobie w konkursie. Konkurs dotyczy wyuczenia modelu regresji do przewidywania ceny wina na podstawie atrybutów jakościowych (rocznik, gatunek winogron, winnica, itp.) oraz ilościowych (oceny z różnych czasopism winiarskich).

Cały konkurs został przygotowany na platformie Kaggle In Class. Kiedy pierwszy raz pisałem o Kaggle, serwis był siermiężnym serwisem z paroma zbiorami danych. Od tego czasu przeszedł istotny facelifting i dziś jest nowoczesną platformą umożliwiającą hostowanie konkursów z przeróżnych dziedzin: informatyki, ekonomii, biologii obliczeniowej, itp. Serwis jest darmowy i umożliwia: formułowanie konkursu, ładowanie danych, walidację wyników, utrzymywanie tablicy aktualnych liderów, udostępnia całość usług związanych z utrzymywaniem kont studentów oraz dostarcza platformy forów internetowych do dyskutowania zagadnień związanych z konkursem.

Dla przyzwoitości trzeba też dodać, że bezpośrednim konkurentem Kaggle’a jest nasz rodzimy produkt, TunedIt, który powstał na Uniwersytecie Warszawskim w zespole prof.Skowrona.

Program „Juventus Plus” 11/18/2010

Posted by Mikołaj Morzy in konkurs, nauka.
3 comments

Właśnie dotarł do mnie mejl z Ministerstwa Nauki i Szkolnictwa Wyższego o ustanowieniu nowych programów finansowego wsparcia dla „Naukowców na Plus”: Ideas Plus, Index Plus i Juventus Plus, przy czym ten ostatni wygląda najbardziej interesująco. Program ma na celu wsparcie kontynuacji badań, których wyniki ukazały się w najbardziej renomowanych czasopismach, tj. czasopismach indeksowanych przez Journal Citation Reports (czyli tzw. listę filadelfijską) oraz European Reference Index for the Humanities (o ile dobrze rozumiem, jest to swego rodzaju odpowiednik listy filadelfijskiej dla nauk humanistycznych).

W komunikacie Ministra jest mowa o „młodych naukowcach”, natomiast w mejlu informacyjnym pada konkretna wartość „do 35 roku życia”. Oczywiście obowiązuje zakaz podwójnego finansowania, czyli do programu nie będą mogły być zgłaszane programy badawcze aktualnie wykonywane i finansowane z innych źródeł w jednostkach. Szczegółowe informacje o konkursie (przedmiot, termin i miejsce zgłaszania wniosków, warunki udziału, podmioty uprawnione do składania wniosku, itp.) zostaną ogłoszone w Biuletynie Informacji Publicznej MNiSW.

Szczegółowe informacje nt. programu Juventus Plus wraz z wnioskiem i ogłoszeniem konkursu (przedmiot, termin i miejsce zgłaszania, procedura, warunki udziału) są też dostępne na stronach Ministerstwa. Termin składania wniosków w wersji elektronicznej to 29 listopada 2010, natomiast wersje papierowe muszą być wysłane nie później niż 6 grudnia 2010. Wnioski zgłoszone po terminie nie będą rozpatrywane.

Journal Citation Reports

Konkurs dotyczący prac doktorskich i magisterskich 03/04/2010

Posted by Mikołaj Morzy in eksploracja danych, konkurs, nauka.
add a comment

Firma StatSoft, producent pakietu STATISTICA, organizuje po raz kolejny konkurs na najlepszą pracę doktorską i magisterską przygotowaną z zastosowaniem narzędzi statystyki i analizy danych zawartych w programach STATISTICA i STATISTICA Data Miner. Patronat nad konkursem sprawuje Polskie Towarzystwo Statystyczne. Najlepsza praca doktorska zostanie wyróżniona nagrodą w wysokości 8 000 zł, natomiast najlepsza praca magisterska ma szanse wygrać 4 000 zł. Dodatkowo, wydziały promujące nagrodzone prace otrzymają za darmo licencje na użytkowanie oprogramowania STATISTICA i STATISTICA Data Miner. Zwycięzcy zostaną także uhonorowani okolicznościowymi dyplomami. W ramach konkursu można także wzbogacić swój dorobek o publikację. Jak głosi zawiadomienie o konkursie:

Konkursowi towarzyszy publikacja „Zastosowania metod statystycznych w badaniach naukowych”, zawierająca skróty wybranych prac. Publikacja może być uwzględniania w ocenie dorobku naukowego poszczególnych uczonych i jednostek naukowych. Kolejne tomy (wydane w latach: 2000, 2003 i 2008) zostały szeroko rozpowszechnione w bibliotekach i instytucjach naukowych w całym kraju.

Chętni do udziału powinni się zapoznać ze szczegółowym regulaminem konkursu.

Kolejny konkurs piękności 03/01/2010

Posted by Mikołaj Morzy in dataset, eksploracja danych, konkurs, nauka, zbiór danych.
add a comment

Yahoo! logo Yahoo! Labs organizują kolejny konkurs eksploracji danych. Tym razem problem polega na stworzeniu algorytmu rankingu dokumentów w odpowiedzi na zapytanie użytkownika. Konkurs Learning to Rank Challenge rozpoczyna się dziś, 1 marca 2010, i potrwa do 31 maja 2010. Uczestnicy, którzy dokonają rejestracji (konieczne jest utworzenie konta Yahoo!) uzyskają dostęp do zbiorów danych zawierających zapytania użytkowników, dokumenty z indeksu Yahoo! oraz wektory cech wyekstrahowane z dokumentów WWW wraz z ocenami ich dopasowania do cech (ang. relevance judgement). Niestety, Yahoo! nie publikuje samych treści zapytań, treści dokumentów ani opisów cech, a jedynie ich identyfikatory, czyli zadanie polega wprost na rankingu zbioru dokumentów dla danego zapytania na podstawie dostarczonych dopasowań cech. Dostępne są dwa zbiory danych pobrane z dwóch różnych krajów, występują dla nich różnice w zbiorach indeksowanych cech. Zbiory są dość małe (tysiące zapytań, dziesiątki tysięcy dokumentów), więc ich przetwarzanie nie wymaga specjalnego sprzętu. Dodatkowe informacje o konkursie zostały opublikowane jako lista FAQ. Nagrody są dość atrakcyjne: 1000*2^{4-i} dolarów za i-te miejsce dla pierwszych czterech miejsc, plus zaproszenie do zaprezentowania swoich wyników w trakcie tegorocznej konferencji ICML’2010 w Hajfie w Izraelu.

Udział w tym konkursie będzie bez wątpienia jedną z możliwości zaliczenia laboratorium z eksploracji danych, jakie prowadzę w tym semestrze na specjalizacji TPD.

%d bloggers like this: