jump to navigation

Agregator blogów naukowych 01/26/2010

Posted by Mikołaj Morzy in nauka.
4 komentarze

Researchblogging.org logoNatknąłem się w sieci na bardzo ciekawą inicjatywę. Agregator Research Blogging stanowi dużą kolekcję blogów pisanych przez osoby pracujące na uczelniach lub zajmujące się badaniami naukowymi w ramach jednostek i instytutów badawczych, firm, agend rządowych, itp. Zakres tematyczny agregowanych blogów jest szeroki i obejmuje między innymi takie dziedziny, jak: antropologia, astronomia, biologia, chemia, informatyka, geografia, medycyna, matematyka, fizyka, filozofia, psychologia, socjologia, czy tematy ogólnoakademickie. Wszystkie blogi są ręcznie walidowane i akceptowane przez edytorów. Nie miałem jeszcze czasu, żeby dokładniej poczytać, jakiego rodzaju blogi o informatyce są tam zamieszczone, ale mam taki zamiar, więc na pewno uzupełnię ten wpis o sugestie i rekomendacje tych blogów, które wydadzą mi się szczególnie interesujące.

Próbowałem zgłosić tam data mining a la polonaise, ale się nie udało. Oto odpowiedź, którą dostałem:

Hi,

Thanks for registering your blog at https://dataminingalapolonaise.wordpress.com/ with ResearchBlogging.org.

Unfortunately, ResearchBlogging.org cannot currently accept your application for registration because we
do not support Polish-language blogs at this time.

We do plan on supporting additional languages in the future. What you can do to help is see if you can generate some interest among other bloggers in Polish — it’s important to get a critical mass of bloggers in a given language before we bring a new language online. We need a community of bloggers in each language to ensure that the blogging meets our guidelines.

Thanks for your interest in ResearchBlogging.org.

Dave


Dave Munger
Editor, ResearchBlogging.org

Stąd mój apel: jeśli prowadzisz, szanowna czytelniczko/szanowny czytelniku, blog o tematyce naukowej, poświęć 2 minuty aby zarejestrować swój blog na ResearchBlogging.org. Najprawdopodobniej otrzymasz dokładnie tę samą odpowiedź co ja, ale być może uda nam się przekroczyć masę krytyczną zgłoszeń i nasz głos zostanie zauważony. Prawdopodobnie, tak jak ja, uważasz, że z wielu przyczyn polska nauka znajduje się w kompletnym zaścianku. Potraktuj ten apel jako najprostszy i najszybszy sposób autopromocji siebie i swojej uczelni.

Książka o eksploracji danych (i znów za darmo) 01/24/2010

Posted by Mikołaj Morzy in Uncategorized.
4 komentarze

Handbook of Data Mining coverNie wiem zupełnie, co o tym myśleć. Gdy patrzę na stronę wydawnictwa, widzę, że „The Handbook of Data Mining” jest dostępny za 88 funtów (w promocji). A potem zaglądam na scribd.com i widzę, że ta sama książka jest dostępna zupełnie za darmo. Czyli że przyjemność posiadania książki w twardej oprawie kosztuje, wg. dzisiejszego kursu funta, ok. 410 zł.

Jeszcze nie przeczytałem tej książki, więc trudno mi się wypowiadać o jej merytorycznej zawartości. Na liście autorów znajdują się znane nazwiska, między innymi Johannes Gehrke, Geoff Webb, Mohammed Zaki czy Padhraic Smyth. Lista tematów poruszanych w książce też jest bardzo obszerna:

  • indukcja drzew decyzyjnych
  • reguły asocjacyjne
  • sieci neuronowe
  • wnioskowanie bayesowskie
  • ukryte modele Markowa
  • wzorce sekwencji
  • analiza składowych głównych
  • analiza skupień
  • przebiegi czasowe
  • metody wstępnego przetwarzania danych
  • odkrywanie i selekcja cech
  • bezpieczeństwo i prywatność danych
  • zarządzanie danymi na potrzeby eksploracji danych
  • przykłady domen zastosowania technik eksploracji danych

Jeśli ktoś jest pewny, że kopia umieszczona w scribd.com jest kradziona, to proszę o kontakt, niezwłocznie usunę wówczas ten post.

Czy publikowanie w czasopismach naukowych jest prostytucją? 01/23/2010

Posted by Mikołaj Morzy in nauka.
3 komentarze

Wow, to jest dopiero tytuł! Niestety, nie mój.  Bruno S. Frey zadaje to pytanie w swoim bardzo ciekawym artykule pt. „Publishing as Prostitution? Choosing Between One‘s Own Ideas and Academic Failure„. Artykuł liczy prawie 30 stron, więc postaram się przybliżyć jego podstawowe tezy. Już w streszczeniu prof. Frey zaczyna z wysokiego C:

Survival in academia depends on publications in refereed journals. Authors only get their papers accepted if they intellectually prostitute themselves by slavishly following the  demands made by anonymous referees without property rights on the journals they advise. Intellectual prostitution is neither beneficial to suppliers nor consumers. But it is  avoidable. The editor (with property rights on the journal) should make the basic decision of whether a paper is worth publishing or not. The referees only give suggestions on how to improve the paper. The author may disregard this advice. This reduces intellectual prostitution and produces more original publications.

Cały artykuł traktuje o prostytucji naukowców rozumianej jako poświęcanie swoich przekonań (dotyczących publikowanej pracy) na rzeczy oczekiwanej nagrody (faktycznej publikacji w czasopiśmie). Tezy prof. Freya są następujące:

  • większość czasopism otrzymuje dużo więcej zgłoszeń niż posiada możliwości publikacji, czasopisma posiadające acceptance rate na poziomie 5% czy 10% nie są niczym wyjątkowym,
  • tak duża konkurencja oznacza, że publikacja musi zaspokoić wymagania wszystkich recenzentów, ponieważ nawet jedna recenzja neutralna może spowodować odrzucenie publikacji,
  • w efekcie, każdy recenzent dostaje de facto prawo weta jeśli chodzi o każdą recenzowaną publikację,
  • recenzenci nie posiadają żadnych praw własności w odniesieniu do czasopism, dla których recenzują, więc nie mają silnej motywacji aby działać jak „udziałowcy” czasopism, zainteresowani ich rozwojem i sukcesem, a ich recenzje mogą być krzywdzące i pozbawione zawartości merytorycznej.

Cały proces zgłoszenia publikacji i odpowiedzi na recenzje, nazwany zabawnie Journal Publication Game, wygląda następująco (grafika zaczerpnięta z oryginalnego artykułu):

Journal Publication Game

Journal Publication Game

Jak wynika z tej gry, cały proces publikacji sprowadza się do tego, czy (a) autor się sprostytuuje (b) czy otrzyma „na osłodę” gratyfikację w postaci publikacji koniecznej w karierze naukowej. Prof. Frey zwraca uwagę na bardzo długi czas, jaki za zwyczaj upływa między zgłoszeniem publikacji i otrzymaniem pierwszej rundy recenzji (od 6 miesięcy do 3 lat) oraz na znaczący nakład pracy ponoszony przez zgłaszającego (który zostanie zmarnowany w przypadku odrzucenia artykułu).

I tutaj zaczynają się ciekawe fragmenty artykułu. Jak się okazuje, w literaturze brak jest jakichkolwiek badań nad zachowaniami recenzentów (być może były takie publikacje, ale zostały odrzucone przez recenzentów). Niejawne założenie jest takie, że recenzenci pracują dla dobra ogólnie pojmowanej nauki i ich główną motywację stanowi troska o zachowanie wysokiego poziomu badań. Brak też jakichkolwiek badań nad zachowaniem się edytorów czasopism, nie jest jasne, jakimi kryteriami się kierują i jakie są ich związki z recenzentami. Ponieważ, jak już wspomniałem, recenzenci nie są finansowo ani prawnie związani z czasopismem, założenie, że działają w najlepiej pojętym interesie wydawnictwa jest po prostu błędne. Prof. Frey twierdzi, że recenzenci znajdują się w sytuacji niskiego kosztu, tzn. że wykonywane przez nich recenzje nie mają żadnego wpływu na ich pozycję zawodową tak długo, jak długo recenzenci zachowują formalne zasady wykonywania swojej profesji. Stąd recenzenci mogą na potrzeby swojej pracy formułować arbitralne kryteria oceny lub, co gorsza, wykorzystywać prawo weta do ochrony swoich interesów (np. przez odrzucanie artykułów krytykujących ich pracę lub obalających wykonywane przez nich badania). Wcale nie musi to odbywać się celowo, recenzenci mogą podświadomie identyfikować swoje uprzedzenia lub prywatne interesy z „najlepiej pojętym interesem nauki”. Jak widać, interesy recenzentów i edytorów wcale się nie pokrywają. Edytorzy nie są anonimowi, ich nazwiska są znane w środowisku i często identyfikowane z poszczególnymi czasopismami, często edytorzy mają powiązania finansowe i prawne z poszczególnymi tytułami, są więc w najwyższym stopniu zainteresowani rozwojem „swoich” czasopism.

A jak aktualny stan rzeczy wpływa na jakość publikowanych prac? Odpowiedzi prof. Freya znajdziemy w rozdziale III zatytułowanym „Intellectual Prostitution and No Fun”. Tradycyjne przekonanie jest takie, że system peer-review ma gwarantować wysoką jakość publikacji, dzięki czemu tylko najlepsze prace są drukowane. Łatwo jednak argumentować, że system ten jest nadmiernie konserwatywny i negatywnie nastawiony do nowych idei. Frey podaje następujący przykład: trzech recenzentów ma ocenić artykuł prezentujący nowatorską ideę. Każdy z nich niezależnie może odrzucić artykuł ponieważ:

  • nowa idea jest trudniejsza do zrozumienia i oceny niż zawartość tradycyjnych prac,
  • nowa idea może podważyć pozycję i dorobek recenzenta, którym najczęściej jest znana osoba z danej dziedziny,
  • nowa idea może nie być doprecyzowana i dopracowana tak, jak starsze koncepcje, ukorzenione w literaturze.

Oczywiście, najprawdopodobniej nowa idea jest po prostu błędna i już to samo w sobie wystarczy, aby ją odrzucić. Ale nie można nie zauważać, że powyższe czynniki też mogą odegrać rolę przy odrzuceniu artykułu, poważnie ograniczając innowacyjność danej dyscypliny.

Jakie więc wnioski wyciąga prof. Frey  ze swojej niewesołej oceny obecnego stanu rzeczy? Po pierwsze, naukowcy powinni być traktowani tak samo jak artyści, dla których możliwość wolnego i nieskrępowanego wyrażania swoich uczuć i przekonań stanowi fundament jakiejkolwiek wartościowej działalności artystycznej. Co więcej, najbardziej wartościowe dzieła to właśnie te dzieła, które płyną pod prąd, które oburzają i obrażają, które kwestionują zastane zasady i otwierają nowe obszary działalności artystycznej. Czasy, w których artyści produkowali to, czego wymagał od nich rynek, znamy pod nazwą Średniowiecza. Renesans, ze swoim uwolnieniem artystów ze smyczy, zaowocował eksplozją kreatywności. Podobny przywilej powinien być udziałem naukowców.

Ten fragment artykułu uważam za najbardziej kontrowersyjny i po prostu błędny, a porównanie artystów i naukowców jest zwyczajnie nietrafione. Artyści nie są skrępowani kryterium prawdy, mogą tworzyć dowolne dzieła w oderwaniu od mód i kanonów estetyki. W przeciwieństwie do nich, naukowcy są ograniczeni przez kryterium naukowej prawdziwości, kreatywność nie może przecież oznaczać w nauce publikacji dowolnych bzdur tylko dlatego, że akurat takie czuję dziś natchnienie.

Wreszcie następuje konkretna propozycja. Według prof. Freya można wybrać opcje indywidualne lub próbować zmienić system wydawniczy. Opcje indywidualne obejmują:

  • podporządkowanie się żądaniom recenzentów i zaakceptowanie obecnego stanu rzeczy (prostytucja),
  • zaprzestanie publikowania w czasopismach recenzowanych (nierealne, takie czasopisma nie mają wystarczającej wagi),
  • walka z edytorami i recenzentami (donkiszotyzm).

Ponieważ żadna z powyższych opcji nie jest dla Freya prawdziwym rozwiązaniem problemu, proponuje on wprowadzenie zmian do aktualnego procesu publikowania artykułów naukowych. A jego rozwiązanie jest proste, procedura oceny artykułu powinna być następująca:

  1. artykuł zostaje zgłoszony do czasopisma
  2. edytor czasopisma ocenia, czy artykuł powinien być publikowany czy nie (decyzja ostateczna
  3. edytor może skonsultować swoją decyzję z radą programową czasopisma, ale nie w formie recenzji, a jedynie opinii nt. publikacji
  4. jeśli edytor zdecyduje o publikacji, artykuł trafia do recenzji, recenzenci są proszeni o sugestie dotyczące ulepszenia artykułu
  5. autor może wykorzystać sugestie recenzentów, ale może je całkowicie zignorować bez żadnego wpływu na publikację

Konsekwencje powyższej procedury są następujące: decyzja o publikacji/odrzuceniu artykułu skraca się do paru tygodni (zamiast miesięcy czy lat), autorzy podejmują trud ulepszenia artykułu tylko wówczas, gdy mają gwarancję publikacji (nie tracą czasu i energii), recenzeni służą pomocą i radą a nie oceną, co całkowicie zmienia ich stosunek do recenzowanych prac. Główna odpowiedzialność za zawartość merytoryczną czasopisma spada na barki edytora, czyli osoby, która jest najbardziej zainteresowana rozwojem danego czasopisma. Dodatkowo, edytor podejmuje decyzję o przyjęciu/odrzuceniu artykułu dysponując możliwością porównania artykułu do pozostałych zgłoszonych artykułów. Recenzent, z drugiej strony, nie ma wglądu w jakość pozostałych publikacji zgłoszonych do czasopisma i opiera się na subiektywnej mierze jakości danej publikacji.

Propozycja prof. Freya ma też kilka punktów, które wymagają doprecyzowania:

  • Czy autorzy mają jakikolwiek powód, aby uwzględnić opinie recenzentów, skoro i tak ich praca będzie opublikowana? Tak, ponieważ uwzględnienie wartościowych uwag recenzentów leży w interesie autora, tylko artykuły najwyższej jakości mają szanse uzyskać duży wpływ na daną dziedzinę.
  • Czy edytorzy podołają poszerzonej liście obowiązków? Tak, bycie edytorem czasopisma jest bardzo prestiżową funkcją i jakość czasopisma bezpośrednio przenosi się na status zawodowy edytora, praca włożona w zapewnianie wysokiej jakości czasopisma leży w najlepiej pojętym interesie edytora.
  • Czy recenzenci zgodzą się recenzować prace nie mając wpływu na ich ostateczną formę? Faktycznie, w tym systemie trudniej będzie zachęcić recenzentów do pracy. Prof. Frey proponuje wprowadzenie różnego rodzaju udogodnień i preferencji, np. otwarcie czasopisma na eseje publikowane przez recenzentów albo udostępnienie każdemu recenzentowi niewielkiej przestrzeni (np. pół strony) do zamieszczenia swoich krytycznych komentarzy do poszczególnych artykułów.

Prof. Frey jest ekonomistą, autorem ponad 250 publikacji w najlepszych czasopismach dotyczących ekonomii i socjologii, edytorem wielu czasopism, członkiem rad programowych konferencji i czasopism branżowych. Opisywana przez niego rzeczywistość jest mi zupełnie obca, w informatyce nie spotkałem się z tak poważnymi zarzutami w odniesieniu do systemu peer-review (choć oczywiście można znaleźć mnóstwo narzekań), ale być może w naukach ekonomicznych i społecznych tak to wygląda. Tak czy inaczej, artykuł wart jest przeczytania i przemyślenia.

Nie bądź takim naukowcem, czyli o komunikacji wiedzy 01/20/2010

Posted by Mikołaj Morzy in nauka.
3 komentarze

book coverW jednym z ostatnich odcinków mojego ulubionego podcastu Point of Inquiry D.J.Grothe rozmawia z Randym Olsonem, biologiem morskim z Uniwersytetu Harvarda, który przez 15 lat zajmował się pracą naukową, aby porzucić ją na rzecz pracy filmowej. W swoim dorobku ma filmy ściśle związane z nauką, takie jak „Flock of Dodos” czy „Sizzle: a Global Warming Comedy„. Randy Olson przedstawia swoją najnowszą książkę, „Don’t Be Such a Scientist” i dzieli się ze słuchaczami swoimi przemyśleniami na temat roli komunikacji i jej jakości w przekazywaniu wiedzy. W wywiadzie dyskutuje różnicę  między edukacją i komunikacją, analizuje zmiany społeczne i technologiczne ostatnich lat, które nie pozostają bez wpływu na sposób, w jaki możemy przekazywać wiedzę, wreszcie, pokazuje na gigantów popularyzacji nauki, takich jak Stephen Jay Gould czy Carl Sagan jako przykłady doskonałych komunikatorów wiedzy.

Wiele z uwag, które padają w wywiadzie, wydają się trywialne i banalne. Zbyt często jednak spotykam wykładowców, dla których prowadzenie wykładów jest przykrym obowiązkiem, studentki i studenci są niechcianym i niepotrzebnym dodatkiem do pensji, a przestrzeń między audytorium i katedrą przypomina Wielki Kanion. Oczywiście, za wszelką cenę należy ustrzegać się „pajacykowania” podczas wykładów, zresztą, studenci są fantastycznym barometrem. Jeśli widzą kogoś, kto biega wokół pulpitu, sypie żarcikami a każdy slajd to animacja w PowerPoincie, to niekoniecznie wysoko sobie taki produkt cenią. Ale tak jak forma bez treści jest marnowaniem czasu, tak treść bez formy jest marnowaniem możliwości: możliwości przekazania czegoś wspaniałego, zainteresowania drugiej osoby swoją pracą, zasiania ziarna fascynacji nauką. Jak zawsze, trzeba znaleźć złoty środek. Wszystkim, którzy prowadzą jakiekolwiek zajęcia dydaktycze polecam wysłuchanie tego wywiadu, na pewno stanie się powodem i okazją do przemyślenia celów i jakości prowadzonych przez siebie zajęć.

A tutaj krótka zapowiedź tego, co w książce:

Indiana House Bill No. 246 01/08/2010

Posted by Mikołaj Morzy in humor, nauka.
1 comment so far

Trzy najsłynniejsze zadania geometryczne sformułowane w starożytności przez Pitagorejczyków to:

  • kwadratura koła: skonstruuj kwadrat o polu równym polu danego koła przy użyciu cyrkla i linijki,
  • trysekcja kąta: podziel dany kąt na trzy równe części przy użyciu cyrkla i linijki,
  • podwojenie sześcianu: skonstruuj sześcian o objętości dwukrotnie większej niż objętność danego sześcianu przy użyciu cyrkla i linijki

Wszystkie trzy problemy są nierozwiązywalne przy pomocy metod klasycznych, tj. za pomocą cyrkla i linijki, a wiadomo to dzięki Pierre’owi Wantzelowi od początku XIX wieku. Na szczęście, ani konsensus naukowy ani dowody matematyczne nie powstrzymują różnych zapaleńców przed spróbowaniem niemożliwego. W tym konkretnym przypadku powitajmy na scenie niejakiego dr. Edwina J. Goodwina, lekarza z Solitude w hrabstwie Posey stanu Indiana.

Dr Goodwin znalazł rozwiązanie problemu kwadratury koła. Postanowił więc czym prędzej zabezpieczyć swoje odkrycie, wykorzystując do tego celu parlament stanowy Indiany.  W 1897 roku przygotował więc propozycję ustawy, zatytułowanej „A Bill for an act introducing a new mathematical truth and offered as a contribution to education to be used only by the State of Indiana free of cost by paying any royalties whatever on the same, provided it is accepted and adopted by the official action of the Legislature of 1897” i przedstawił swoją propozycję niejakiemu Taylorowi I. Recordowi, który był reprezentantem hrabstwa Posey w parlamencie stanowym. Taylor I. Record był farmerem i drwalem, więc jego wiedza matematyczna kończyła się tam, gdzie kończyły się palce na obu rękach, niemniej jednak postanowił zgłosić formalnie projekt ustawy. Jak już widać po tytule, dr Goodwin był lokalnym patriotą i chciał, aby obywatele stanu Indiana mieli przywilej korzystania z odkrytej przez niego „nowej matematycznej prawdy” za darmo, mieszkańcy pozostałych stanów mieli jednak odprowadzać tantiemy. Projekt trafił najpierw do Komisji  ds Kanałów, a następnie został przekazany do Komisji ds Edukacji, która postanowiła rekomendować ustawę parlamentowi stanowemu do zatwierdzenia. 5 lutego 1897 roku parlament stanowy Indiany przyjął uchwałę jednomyślnie w pierwszym czytaniu.

Co zawierała uchwała? Zawierała ni mniej ni więcej tylko dowód przeprowadzenia kwadratury koła. Dr Goodwin opisał dokładnie całą procedurę, wprowadzając przy okazji kilka nowinek do geometrii klasycznej. Przykładowo, w drugiej sekcji uchwały czytamy: „stosunek promienia koła do jego obwodu ma się jak 4 do 5/4„. Innymi słowy, \pi = 4 : \frac{5}{4} = 3.2. Właśnie tak, parlament stanowy Indiany przegłosował jednomyślnie, że \pi = 3.2. W uchwale czytamy także, że „stosunek przekątnej kwadratu do jego boku ma się jak 10 do 7„, czyli parlament przegłosował także, że na terenie stanu Indiana \sqrt{2} = \frac{10}{7} = 1.429. Dodajmy, że lepsze przybliżenia obu fundamentalnych wartości były już znane w starożytności.

Na szczęście w tym morzu głupoty pojawił się głos rozsądku. Zrządzeniem przypadku w parlamencie Indiany w czasie głosowania uchwały nr 246 znajdował się profesor Clarence Abiathar Waldo z Departamentu Matematyki Uniwersytetu Purdue. Profesor Waldo zdziwił się, słysząc, że parlament debatuje o matematyce. Gdy usłyszał debatę, zdziwienie ustąpiło miejsca przerażeniu. W trakcie wieczoru udało mu się jednak wyjaśnić kilku parlamentarzystom, że debatują nad kompletnym nonsensem. Dodatkowo, zaalarmowana prasa zaczęła szydzić z głosowanej uchwały. Gdy uchwała trafiła 13 lutego do drugiego czytania, tym razem została publicznie wyśmiana i odrzucona. W pewnym momencie ktoś ponoć zaoferował się, że przedstawi dr. Goodwina profesorowi Waldo. Ten ostatni miał odpowiedzieć: „I am already acquainted with as many crazy people as I care to know„.

Z pełnym tekstem ustawy można się zapoznać tutaj. Mój ulubiony fragment to koniec trzeciej sekcji, który warto tu zacytować w całości:

In further proof of the value of the author’s proposed contribution to education and offered as a gift to the State of Indiana, is the fact of his solutions of the trisection of the angle, duplication of the cube and quadrature of the circle having been already accepted as contributions to science by the American Mathematical Monthly, the leading exponent of mathematical thought in this country. And be it remembered that these noted problems had been long since given up by scientific bodies as insolvable mysteries and above man’s ability to comprehend.

Prawo Benforda 01/06/2010

Posted by Mikołaj Morzy in nauka, teoria.
2 komentarze

Prawo Benforda, zwane także prawem pierwszej cyfry (choć istnieje także alternatywne sformułowanie dotyczące drugiej najbardziej znaczącej cyfry), dotyczy rozkładu częstości występowania poszczególnych cyfr na najbardziej znaczącej pozycji w dużej kolekcji danych. Okazuje się, że cyfry nie są rozłożone jednostajnie, lecz zgodnie z rozkładem

P(d)=\log_{10}(1+\frac{1}{d})

gdzie d oznacza cyfrę z przedziału <1,9>. Prawo działa także dla liczb innych niż wyrażonych w systemie dziesiętnym, zmienia się tylko podstawa logarytmu.

Najciekawsze jest to, że prawo Benforda działa tylko wówczas, jeśli kolekcja danych jest generowana przez rzeczywisty proces, którym rządzi rozkład wykładniczy potęgowy (patrz komentarze).  Dotyczy to np. wielkości miast, długości rzek, rozmiarów populacji miast, cen w sklepach, itp. Dzieje się tak dlatego, że w przypadku rozkładów potęgowych otrzymujemy jednostajny rozkład cyfr po zlogarytmowaniu oryginalnych wartości, tzn. jest takie samo prawdopodobieństwo, że rzeka ma od 10 do 100 km długości, jak to, że rzeka ma od 100 do 1000 km długości. Rozkłady potęgowe są bardzo często spotykane w przyrodzie i naukach społecznych, toteż pole do stosowania prawa Benforda jest szerokie. Innym ważnym czynnikiem jest aby rozkład wartości był niezależny od skali, na jakiej jest mierzony (tzw. scale invariance). Tak się akurat składa, że tylko rozkłady potęgowe posiadają tę cechę, ponieważ mając dany rozkład potęgowy f(x)=ax^k jeśli przeskalujemy x o stałą c, otrzymamy f(cx)=a(cx)^k=c^kf(x)\propto f(x).

Prawo Benforda nie działa, jeśli kolekcja danych została spreparowana przy użyciu rozkładów losowych i pseudo-losowych, ponieważ rozkład najbardziej znaczącej cyfry staje się wówczas jednostajny. Okazuje się, że można ten fakt wykorzystać do zidentyfikowania, czy zbiór danych został sfałszowany. Zaproponowano wykorzystanie prawa Benforda do audytu sprawozdań finansowych, księgowości, wyników wyborów, itp. Dziś dowody na podstawie prawa Benforda są akceptowane jako dowody sądach amerykańskich. Całkiem niedawno prawo Benforda zostało wykorzystane do nadzorowania uczciwości przeprowadzania wyborów. W szczególności, dużo kontrowersji wzbudziły ostatnie wybory prezydenckie w Iranie. Walter Mebane wykorzystuje prawo Benforda do stwierdzenia, że prawdopodobnie wyniki zostały sfałszowane.

Z czystej ciekawości postanowiłem sprawdzić, czy prawo Benforda stosuje się do cen przedmiotów wystawianych w serwisie Allegro. Poniżej przedstawiam rozkład najbardziej znaczącej cyfry cen produktów wyliczony na podstawie próbki liczącej ponad 300 tysięcy przedmiotów (na osi odciętych najbardziej znacząca cyfra ceny, na osi rzędnych procent aukcji z daną ceną), zgodność jest uderzająca:

Dla uczciwości dodać należy, że Frank Benford sprawdził poprawność tego  prawa dla dużej liczby różnych zbiorów danych i opublikował wyniki swoich prac w 1935 roku, natomiast oryginalnym odkrywcą prawa był astronom Simon Newcomb w 1881 roku. Podobno odkrył je czytając tablice logarytmów i zauważając, że początkowe strony tablic (z logarytmami zaczynającymi się od cyfry 1) były dużo bardziej zużyte, niż inne strony. Swoją drogą, czytanie tablic logarytmów wygląda na dziwaczne hobby.

Off topic (part deux) 01/05/2010

Posted by Mikołaj Morzy in nauka.
1 comment so far

Jakiś czas temu przyglądaliśmy się rzeczom bardzo małym. Tym razem przyjrzymy się rzeczom, które są bardzo bardzo bardzo duże. Jeśli ktoś jeszcze sobie nie uświadomił, że nie jesteśmy centrum Wszechświata, to poniższe dwie minuty powinny to boleśnie uświadomić.

A jeśli możecie poświęcić sześć minut i jesteście w melancholijnym nastroju, to posłuchajcie o najważniejszym zdjęciu wykonanym kiedykolwiek przez ludzkość (ważniejszym, niż majtki Gosi Andrzejewicz).

Od jutra wracamy do postów o nauce i eksploracji danych.

UPDATE

Zły astronom Phil Plait podsyła odnośnik do demonstracji pokazującej skalę wszechświata. Od całego wszechświata (93 mld lat świetlnych), poprzez obserwowalny wszechświat (14 mld lat świetlnych) aż po preony, z których składają się kwarki, neutrina i długość Plancka. To jest podróż, od której gotuje się mózg. Koniecznie do obejrzenia tutaj.

S Nowym Godom! 01/04/2010

Posted by Mikołaj Morzy in humor, muzyka.
add a comment

Sprawdziłem swoją listę postanowień noworocznych z zeszłego roku i jestem przerażony. W zasadzie większośc mógłbym znów powtórzyć. W tym roku nie zrobię takiego głupstwa, niczego nie będę sobie obiecywał ani nie będę robił żadnych głupich list. Zamiast tego złożę Wam, drogie czytelniczki i szanowni czytelnicy, najserdeczniejsze życzenia wszelkiej pomyślności w nowym roku: szczęścia, zdrowia, zadowolenia z pracy, satysfakcji z każdego dnia. A od jutra wracamy z regularnym rozkładem jazdy blogowania na temat.

A do życzeń dołączają się niezwykłej urody młodzieńcy z zespołu Stieklovata:

disclaimer: pieśń znalazł Marek Wojciechowski

%d blogerów lubi to: