jump to navigation

Wyniki ankiety do przedmiotu „Technologie semantyczne i sieci społecznościowe” 01/28/2011

Posted by Mikołaj Morzy in nauka, sieci społeczne.
add a comment

Zimowy semestr dobiegł dziś końca. I jak zwykle, jest okazją do obiecywania sobie, że w przyszłym zajęcia będą lepiej przygotowane, materiały czytelniejsze i zaktualizowane, artykuły napisane, blog codziennie odwiedzany… Na razie podsumowaliśmy z Agnieszką nasze wspólne przedsięwzięcie, przedmiot „Technologie semantyczne i sieci społecznościowe” zaproponowany jako przedmiot obieralny na drugim semestrze studiów magisterskich. Oto wyniki ankiety przeprowadzonej na ostatnich zajęciach ze studentami (próbka około 40 odpowiedzi).

O jakich rzeczach mówiliśmy za mało, za dużo, nie mówiliśmy wcale

Waszym zdaniem, za mało mówiliśmy o aspektach praktycznych analizy sieci społecznych. W wielu ankietach pojawiały się sugestie wykładu poświęconego FaceBookowi i programowaniu w FBQL/Graph API, Tweeterowi, analizie rzeczywistych przypadków SNA. Nasz wniosek jest taki, że brakuje jednego wykładu zatytułowanego „Zastosowania technologii Web 2.0 i Web 3.0”, który prezentowałby konkretne aplikacje omawianych technologii w jednym miejscu.

Oczekiwania względem przedmiotu

Czy przedmiot spełnił oczekiwania?

Wnioski mogą być dwa: albo przychodząc na ten przedmiot mieliście mgliste pojęcie o technologiach semantycznych i sieciach społecznych, albo niewystarczająco jasno opisaliśmy plan i program przedmiotu w karcie ECTS. Tak czy owak, na pewno zaktualizujemy ten opis.

Post factum

Czy warto było wybrać przedmiot?

Ten wynik zdecydowanie cieszy. Tylko dwie osoby jednoznacznie były niezadowolone z przedmiotu, większość z Was uważa, że wybór przedmiotu był słuszny. Pojawiło się też wiele głosów, że to nie Wy wybieraliście przedmiot, ale że został on przydzielony przez Dziekanat. Otóż w praktyce akademickiej taka procedura nosi nazwę wybierania nadzorowanego (ang. supervised choice) i jest uważana za poprawną formę wyboru.

Tematyka

Czy tematyka była właściwa?Czy tematyka laboratorium była właściwa?

Tematyka się generalnie podobała. Jeśli chodzi o najczęstsze uwagi co do tematyki laboratoriów, to wyraźnie „nie pasuje” Wam ontologia i OWL, wiele głosów postulowało zmniejszenie ilości informacji dotyczących historii i składni języka OWL. Było parę głosów niezadowolonych z godziny wykładu (akurat to jest poza zasięgiem naszego wpływu). Jeśli chodzi o tematykę laboratorium, to najczęstsze głosy były następujące: mniej ćwiczeń z ontologii, więcej ćwiczeń z Web 2.0, więcej laboratoriów z SNA, co najmniej jedno laboratorium poświęcone programowaniu aplikacji na Facebooka, więcej samodzielnych zadań a mniej tutorialu i podążania za prowadzącą(ym), był też głos (o zgrozo!) postulujący wyrzucenie laboratoriów z Oracle Semantic Technologies.

Podział zajęć

Czy podział między laboratorium i projekt był właściwy?

Tutaj mamy konflikt, z jednej strony ponad 10 osób sugeruje zmniejszenie liczby laboratoriów i wydłużenie czasu potrzebnego na wykonanie projektu zaliczeniowego, z drugiej strony w poprzednim punkcie pojawiło się wiele sugestii w sprawie rozszerzenia tematyki laboratoriów. Musimy się dobrze zastanowić, jak to zrobić.

Forma zaliczenia przedmiotu

Czy podobały się projekty zaliczeniowe?

To był punkt, co do którego mieliśmy początkowo najwięcej wątpliwości. Nie byliśmy pewni, jak zareagujecie na kolejny przedmiot, z którego trzeba przygotować (nietrywialny) projekt zaliczeniowy. Okazuje się, że jednomyślnie jesteście zadowoleni z takiej formy zaliczenia. To bardzo cieszy, postaramy się, aby w przyszłym roku projekty zaliczeniowe były ciekawsze i bardziej wszechstronne.

Jakość materiałów

Jak oceniasz jakość materiałów dydaktycznych (wykład)?Jak oceniasz jakość materiałów dydaktycznych (wykład)?

Materiały się podobały, zarówno do wykładów, jak i do laboratoriów. Krytyka dotyczyła następujących elementów: jeśli chodzi o wykład, to pojawiły się sugestie pokazania bardziej skomplikowanych przykładów zapytań w SPARQL, jeśli chodzi o laboratorium to paru osobom nie podobały się zajęcia z Protege.

Ogólne uwagi

W ostatnim punkcie prosiliśmy Was o podanie, w bardzo ogólnej formie, co Wam się najbardziej, a co najmniej podobało. Zdecydowanie najwięcej pochwał zebrały projekty zaliczeniowe, wiele osób pisało, że się dużo nauczyło, że projekty były angażujące i ambitne, itp. Podobała się też idea umieszczenia wszystkich materiałów na Wiki, parę osób pochwaliło wykłady o analizie sieci społecznych, kilka osób było zadowolonych, że wreszcie rozumieją, co to są technologie semantyczne. Głosy krytyczne dotyczyły przede wszystkim: narzędzia Protege, formy prowadzenia ćwiczeń poprzez tutoriale i podążanie za prowadzącą(ym), pięciu osobom nie podobały się ontologie i OWL. Pojawił się też głos skarżący się na nadmierny poziom abstrakcji prezentowanych zagadnień.

Nasze ogólne wrażenie jest takie, że jak na pierwszą edycję przedmiotu poszło nieźle, jesteście generalnie zadowoleni i będziecie ten przedmiot polecać, mamy parę miejsc do uzupełnienia i ew. zmodyfikowania planu zajęć (szczególnie laboratoryjnych). Serdecznie dziękujemy za ankiety, które są dla nas bardzo przydatnym źródłem informacji.

Morzy w telewizorze 01/27/2011

Posted by Mikołaj Morzy in nauka.
6 komentarzy

Jestem w telewizji!!! W trakcie mojej przedostatniej wizyty na Politechnice Warszawskiej młodzież skupiona wokół Brama Innovation Camp zaprosiła mnie do rozmowy na temat uprawiania nauki jako sposobu na życie i osiągania sukcesu. Rozmowa trwała ponad godzinę, rzecz jasna do ostatecznej wersji trafiły fragmenty, a czas antenowy współdzielę z takimi tuzami, jak założyciel Wirtualnej Polski Marek Borzestowski, twórca licznych internetowych serwisów reklamowych Piotr Surmacki, czy muzyk i dziennikarz Richard Berkeley.Szkoda, że tak mało się zmieściło, bo udało mi się wygłosić godzinny pean pochwalny na cześć metody naukowej, myślenia krytycznego i gigantycznej satysfakcji wynikającej z prowadzenia działalności naukowej. Miejmy nadzieję, że to początek wielkiej kariery medialnej…

BASNAM’2011: CFP 01/12/2011

Posted by Mikołaj Morzy in cfp, konferencja, nauka, sieci społeczne.
1 comment so far

Jeszcze jedni znajomi i jeszcze jeden warsztat. Oprócz SNAA’2011, o którym pisałem wczoraj, a ramach tej samej konferencji ASONAM’2011 odbędzie się warsztat o nazwie International Workshop on Business Applications of Social Network Analysis and Mining BASNAM 2011. Warsztat organizują Jurek Surma z SGH oraz Mikołaj Jan Piskorski z Harvardu. Warsztat ma charakter troszkę mniej informatyczny i jest ukierunkowany bardziej na biznesowe zastosowania technik analizy sieci społecznych. Materiały z warsztatu zostaną wydrukowane (razem z pozostałymi warsztatami z ASONAM) przez IEEE Computer Science Press. Dodatkowo, wybrane artykuły zostaną zaproszone do książki wydawanej przez Springera w serii Intelligent Systems Reference Library. Termin zgłaszania artykułów to 1 marca.

SNAA’2011: CFP 01/11/2011

Posted by Mikołaj Morzy in cfp, konferencja, nauka, sieci społeczne.
1 comment so far

Przyjaciele z Wrocławia organizują warsztat przy okazji konferencji ASONAM’2011. Warsztat nosi nazwę SNAA’2011: First Workshop on Social Network Analysis in Applications i, jak sama nazwa wskazuje, jest poświęcony przede wszystkim praktycznym aspektom wykorzystania metod SNA w różnych domenach aplikacyjnych. Ponieważ byli tak mili i zaprosili mnie do komitetu programowego, więc lojalnie reklamuję warsztat. Sama konferencja jest fantastyczna, byłem na niej w zeszłym roku i w tym roku też się przygotowuję do zgłoszenia artykułu. Materiały z SNAA’2011 ukażą się w publikacji konferencyjnej wydawanej przez IEEE, natomiast rozszerzone wersje artykułów będą zaproszone do czasopisma z listy filadelfijskiej (będzie osobny specjalny numer wybranego czasopisma zawierający jedynie materiały z SNAA’2011).

Lista konferencji z dziedziny eksploracji danych 01/06/2011

Posted by Mikołaj Morzy in eksploracja danych, nauka.
add a comment

KDNuggets przynosi zestawienie topowych konferencji w dziedzinie eksploracji danych. Przyznam szczerze, że mój osobisty ranking był nieco inny, ale ten opublikowany przez KDNuggets jest poparty twardymi liczbami.

lp. nazwa publikacje cytowania pub/cyt
1 KDD – Knowledge Discovery and Data Mining 4140 10223 2.47
2 ICDE – International Conference on Data Engineering 7028 8370 1.19
3 ICDM – IEEE International Conference on Data Mining 3414 2463 0.72
4 CIKM – International Conference on Information and Knowledge Management 4452 2242 0.50
5 SDM – SIAM International Conference on Data Mining 1432 1256 0.88
6 ECML/PKDD – Principles of Data Mining and Knowledge Discovery 2062 1129 0.55
7 PAKDD – Pacific-Asia Conference on Knowledge Discovery and Data Mining 2526 711 0.28
8 DMKD – Research Issues on Data Mining and Knowledge Discovery , (SIGMOD Workshop, 1996-2004) 212 637 3.00
9 DASFAA – Database Systems for Advanced Applications 2232 364 0.16
10 DaWaK – Data Warehousing and Knowledge Discovery 1010 330 0.33

Pełną listę konferencji dotyczących eksploracji danych można sprawdzić tutaj.

Ngram Viewer: eksploracja ewolucji języka w czasie 01/06/2011

Posted by Mikołaj Morzy in dataset, eksploracja danych, nauka, Uncategorized, zbiór danych.
1 comment so far

Google Labs logoGoogle nie przestaje zadziwiać. Właśnie natknąłem się na Google Ngram Viewer, aplikację umożliwiającą śledzenie częstotliwości występowania zlepków słów we wszystkich książkach dostępnych przez Google Books. Na wstępie uwaga: przyzwyczailiśmy się (przynajmniej w eksploracji danych) używać terminu n-gram do określania sekwencji następujących po sobie n znaków, np. słowo eksploracja może być podzielona na bi-gramy: ek-ks-kp-pl-lo-or-ra-ac-cj-ja. Moje pierwsze wrażenie było takie, że Google używa tego terminu niepoprawnie (wg. nich jest to sekwencja n słów występujących w tekście). Jednak krótki rzut oka do Wikipedii pokazuje, że ich użycie jest prawidłowe:

An n-gram is a subsequence of n items from a given sequence. The items in question can be phonemes, syllables, letters, words or base pairs according to the application.

Do dyspozycji są zbiory danych z książek opublikowanych w Anglii, Stanach Zjednoczonych, można też ograniczyć analizę do książek w językach: chińskim, niemieckim, hiszpańskim, francuskim, hebrajskim i rosyjskim. Dane są dostępne zarówno przez interfejs Google’a, jak i w formacie do pobrania i samodzielnego przetwarzania (dane są dostępne na licencji Creative Commons 3.0). Jeśli zechcecie wykorzystać ten korpus danych, to powinniście w referencjach umieścić pracę

Jean-Baptiste Michel*, Yuan Kui Shen, Aviva Presser Aiden, Adrian Veres, Matthew K. Gray, William Brockman, The Google Books Team, Joseph P. Pickett, Dale Hoiberg, Dan Clancy, Peter Norvig, Jon Orwant, Steven Pinker, Martin A. Nowak, and Erez Lieberman Aiden. Quantitative Analysis of Culture Using Millions of Digitized Books. Science (ta publikacja nie jest dostępna za darmo ze strony czasopisma Science, ale jeśli ktoś przez przypadek kliknie tutaj…)

I zupełnie na marginesie: oto jak można połączyć naukę z marketingiem. Przy okazji pracy nad Ngram Viewer ekipa z Google (przy współpracy z młodymi ludźmi z Harvardu i MIT) ukuła nowy termin: culturomics. Prawda, że zgrabne i chwytliwe?

%d blogerów lubi to: