jump to navigation

Raport o usługach szerokopasmowych 2010 12/22/2010

Posted by Mikołaj Morzy in biznes, Uncategorized.
add a comment

Niecały miesiąc temu miałem przyjemność wystąpić na konferencji „VII Forum Usług Szerokopasmowych: Gdy Sieć jest wszędzie„. Właśnie zauważyłem, że organizator konferencji, Computerworld, wydał broszurę z raportem zawierającym wybrane artykuły. Co prawda konferencja była stricte biznesowa, a nie naukowa, ale muszę uczciwie przyznać, że dowiedziałem się wiele o perspektywach rozwoju sieci w Polsce i Unii Europejskiej (szczególnie w kontekście Agendy Cyfrowej Unii Europejskiej). W raporcie na uwagę zasługuje artykuł „Polska to punkt na światowej mapie FFTx” Tomasza Świderka (o przyszłości łączy szerokopasmowych jako sposobu podłączania gospodarstw domowych) oraz „50+ w sieci„, bardzo ciekawa rozmowa z dr. Dominikiem Batorskim o miejscu i roli osób dojrzałych i starszych w Internecie oraz ich sposobach użytkowania Sieci.

Reklamy

Zbliża się kolejna konferencja PLOUG 09/26/2010

Posted by Mikołaj Morzy in bazy danych, biznes.
add a comment

Już za miesiąc rozpoczyna się w Zakopanem kolejna, XVI Konferencja Użytkowników i Deweloperów Oracle organizowana przez Stowarzyszenie Polskiej Grupy Użytkowników Systemu Oracle (PLOUG). Jak zawsze, będzie mnóstwo referatów, warsztatów i tutoriali dotyczących technologii bazodanowych i aplikacyjnych, zgłoszono 32 referatów i 29 tematów warsztatów i tutoriali, do tego imprezy towarzyszące i okazja, żeby podzielić się w gronie praktyków i ekspertów swoimi doświadczeniami, problemami i pytaniami. Konferencja odbywa się w terminie 19-22.10.2010 w WDW Kościelisko, szczegóły konferencji i formularz rejestracyjny znajdziecie Państwo na stronach konferencji.

W tym roku będę miał przyjemność zaprezentować dwa referaty plenarne, ich tytuły i streszczenia poniżej:

Oracle 11g Statistical Functions: statystyka dla dużych i małych

Baza danych Oracle 11g posiada wbudowany bardzo szeroki wachlarz narzędzi statystycznych. W połączeniu z narzędziami Oracle OLAP i Oracle Data Mining zbiór narzędzi statystycznych, w które wyposażona jest baza danych Oracle 11g tworzy potężne środowisko analityczne. W zależności od potrzeb użytkownicy mogą wykorzystywać tylko najprostsze funkcje, np. statystykę opisową lub testowanie hipotez, funkcje analityczne lub funkcje regresji liniowej, ale mogą także sięgnąć po mocniejsze narzędzia: testowanie dopasowania rozkładów, analizę wariancji (ANOVA), analizę Pareto, parametryczne i bezparemetryczne modele korelacji czy testy Chi-kwadrat. W niniejszym artykule przedstawiono pełny przegląd narzędzi statystycznych oferowanych przez bazę danych Oracle 11g, ilustrując poszczególne narzędzia przykładami zastosowań biznesowych.

Oracle WebCenter 11g czyli Przedsiębiorstwo 2.0

Oracle WebCenter 11g to środowisko służące do wdrażania produktów Web 2.0 w przedsiębiorstwach komercyjnych. W skład WebCenter 11g wchodzą narzędzia do tworzenia aplikacji społecznościowych, portali biznesowych, czy serwisów inter- i intra-netowych opartych na ideach Web 2.0, takich jak: komunikatory internetowe, blogi, serwisy wiki, fora dyskusyjne, kanały RSS, tagi i folksonomie, sieci społecznościowe czy komunikacja za pomocą VoIP. Platforma Oracle WebCenter 11g umożliwia szybkie wdrożenie takiej architektury do systemu informatycznego przedsiębiorstwa i organizacji, zarówno w formie gotowego pakietu, jak i zestawu narzędzi umożliwiającego samodzielne stworzenie rozwiązania najlepiej dopasowanego do danej rzeczywistości biznesowej. W artykule przedstawiono ogólną koncepcję Oracle WebCenter 11g, opisano główne składowe tej platformy: WebCenter Framework, WebCenter Services, WebCenter Spaces, oraz WebCenter Interactions.

Oprócz referatów plenarnych przygotowałem także dwa warsztaty, informacje o liczbie wolnych miejsc są dostępne na stronach „z ostatniej chwili”

[WP Semantic] Oracle Semantic Technologies: Web 3.0 w działaniu

Sieć semantyczna, zwana także modelem Web 3.0, to wizja Internetu jutra, w którym dane są przechowywane, opisywane i powiązane w taki sposób, aby mogły być wykorzystane nie tylko przez ludzi, ale także przez maszyny (programy, pająki sieciowe czy inteligentnych agentów). Format danych powinien umożliwiać maszynom „rozumienie” danych w stopniu wystarczającym do tego, aby dane mogły podlegać automatycznej integracji, negocjacji, czy manipulacji. Opcja Oracle Spatial 11g serwera bazy danych Oracle 11g Enterprise Edition zawiera zaawansowane mechanizmy zarządzania danymi semantycznymi. Umożliwia ona, między innymi, wykorzystanie języków RDF, RDFS i OWL bezpośrednio w bazie danych, wzbogacanie danych relacyjnych o warstwę semantyki, wydawanie zapytań do danych relacyjnych przy wsparciu ontologii zdefiniowanych w OWL, pełny wachlarz operacji DML dla danych przechowywanych w RDF i OWL, wnioskowanie za pomocą silników RDF i OWL, a także wydawanie zapytań w języku zbliżonym do standardu SPARQL. Celem warsztatu jest popularyzacja technologii semantycznych oraz zaznajomienie uczestników z możliwościami narzędzi oferowanych w ramach pakietu Oracle Semantic Technologies.

 • Profil uczestnika: osoby projektujące i implementujące aplikacje bazodanowe.
 • Poziom wiedzy uczestnika: brak wymagań.
 • Forma zajęć: demonstracja z samodzielnymi ćwiczeniami praktycznymi.
 • Cel uczestnictwa: zapoznanie się z funkcjonalnością Oracle Semantic Technologies.
 • Czas trwania: 4 godz.

[WP Stat] Oracle Statistical Functions: statystyka dla dużych i małych

Wiele współcześnie projektowanych i implementowanych aplikacji wymaga efektywnych narzędzi statystycznych. Baza danych Oracle 11g oferuje bogaty zestaw takich narzędzi, począwszy od narzędzi podstawowych (funkcje analityczne, funkcje rankingu hipotetycznego, funkcje regresji liniowej) aż po zaawansowane (testowanie hipotez, dopasowywanie rozkładów, analiza wariancji, analiza Pareto, modele korelacji, testy Chi-kwadrat, itp.) Celem warsztatu jest zaprezentowanie uczestnikom szerokiego przeglądu wszystkich narzędzi statystycznych oferowanych przez bazę danych Oracle 11g, oraz przedstawienie hipotetycznych scenariuszy wykorzystania wybranych narzędzi.

 • Profil uczestnika: osoby projektujące i implementujące aplikacje bazodanowe.
 • Poziom wiedzy uczestnika: elementarna wiedza z dziedziny statystyki.
 • Forma zajęć: demonstracja z samodzielnymi ćwiczeniami praktycznymi.
 • Cel uczestnictwa: zapoznanie się z wszystkimi narzędziami Oracle Statistical Functions.
 • Czas trwania: 4 godz.

Eksploracja i eksploratorki/eksploratorzy – wyniki ogólnoświatowej ankiety 03/19/2010

Posted by Mikołaj Morzy in biznes, eksploracja danych, nauka.
6 Komentarzy

Rok temu pisałem o ankiecie organizowanej przez Rexer Analytics. Właśnie dostałem jej podsumowanie. Z podsumowania wynika niezbicie, że wszystkie osoby zajmujące się eksploracją danych są mądre, piękne, spełnione zawodowo i emocjonalnie, oraz zupełnie nie przystają do informatycznych stereotypów.

Najciekawsze wyniki są związane z porównaniem odpowiedzi udzielanych przez reprezentatki i reprezentantów akademii i biznesu. Wyraźnie np. widać zupełnie inne preferencje dotyczące wykorzystywanych narzędzi. W ankiecie wzięło udział 137 osób reprezentujących akademię i 392 osoby reprezentujące biznes. Poniżej wykres obrazujący ranking ulubionych narzędzi:

Preferencje dot. narzędzi do eksploracji danych

Poza kwestią wyboru narzędzi ankieta sprawdzała także stopień satysfakcji z możliwości wykorzystywanego narzędzia.

Satysfakcja z wykorzystywanego narzędzia

Zaciekawiło mnie, w których działach przedsiębiorstw najczęściej są wykorzystywane techniki eksploracji danych. Okazuje się, że przede wszystkim w marketingu i logistyce. Bardzo cieszy wysoka pozycja departamentów R&D.

Gdzie wykorzystywane są techniki eksploracji danych?Najbardziej zdziwiły mnie wyniki pytania o typ wykształcenia osób zajmujących się ekploracją danych. Gdybym miał zgadywać, powiedziałbym, że 70% to informatyczki i informatycy. Okazuje się, że stanowimy zaledwie ćwierć społeczności! Osobiście bardzo się cieszę, że coraz więcej osób z wykształceniem socjologicznym i ekonomicznym garnie się do eksploracji danych.

Wykształcenie osób zajmujących się eksploracją danych

Ostatnie pytanie interesuje mnie w szczególności, ponieważ pozwala mi dostosować zawartość prowadzonego przeze mnie kursu do wymagań i oczekiwań rynku. Zdziwiła mnie wysoka pozycja regresji, choć, z drugiej strony, trudno o bardziej klasyczną metodę analizy danych. Zupełnie nie rozumiem, dlaczego tak wysoko na liście znalazła się faktoryzacja analiza czynnikowa, zastanawia mnie też stosunkowo wysoka pozycja sieci neuronowych. To może mieć związek z powszechnym wykorzystaniem sieci neuronowych w badaniach naukowych lub z obecnością tego narzędzia w popularnych pakietach do eksploracji.

Popularne metody eksploracji danych

Pełne podsumowanie wyników ankiety można znaleźć tutaj: Rexer Analytics 2009 Data Miner Survey Summary

Long Tail, czyli upadła hipoteza 08/22/2009

Posted by Mikołaj Morzy in biznes, teoria.
add a comment

W 2004 roku Chris Anderson opublikował w magazynie Wired artykuł pt. The long tail. Koncepcje przedstawione w tym artykule zostały następnie przez niego rozwinięte i opublikowane w postaci książki pt. The Long Tail : Why the Future of Business Is Selling Less of More. Podtytuł książki mówi sam za siebie. Główna idea Andersona jest następująca: ponieważ handel elektroniczny, a w szczególności handel dobrami cyfrowymi, likwiduje koszty przechowywania i umożliwia bezpośredni dostęp klientów do dowolnego produktu, oznacza to całkowitą zmianę paradygmatu handlu. W przeciwieństwie do tradycyjnego handlu, zdominowanego przez niewielką liczbę popularnych i łatwo dostępnych produktów (książek, filmów, albumów) handel elektroniczny aktywuje i udostępni produkty niszowe, kolekcjonerskie, dotychczas trudno dostępne. Poniższy rysunek (zaczerpnięty z artykułu Anity Elberse), dobrze ilustruje to zjawisko.

longtailWedług Andersona, dostępność produktów niszowych spowoduje, że „długi ogon” ulegnie pogrubieniu (tzn. wzrośnie sprzedaż produktów niszowych kosztem sprzedaży produktów popularnych) i sprzedawcy będą mogli realizować zyski w obszarze „długiego ogona” produktów niszowych. Argumentacja była prosta:

 • produkty dotychczas trudno dostępne stają się dostępne na jedno kliknięcie myszki,
 • systemy rekomendacyjne ułatwiają eksplorację niezbadanych obszarów długiego ogona,
 • klienci nadają produktom niszowym większą wartość ze względu na ich niszowy charakter.

Przez wiele lat proponenci idei Web 2.0 przyjmowali koncepcję Andersona za udowodniony i sprawdzony model funkcjonowania handlu elektronicznego w erze Web 2.0. Całe szczęście, że w nauce dogmaty nigdy nie utrzymują się zbyt długo (w końcu nauka jest najbardziej rewolucyjną dyscypliną, jej podstawą i motorem działania jest kwestionowanie zastałych praw0. Okazuje się, że cała koncepcja „długiego ogona” jest z gruntu fałszywa, sprzeczna z ekonomiczną teorią zachowania grupowego i nie znajdująca potwierdzenia w danych empirycznych! W opublikowanym w Harvard Business Review artykule Should You Invest in the Long Tail? Anita Elberse dowodzi, że żadne zjawisko „długiego ogona” nie istnieje. Wręcz przeciwnie, rynki elektroniczne powodują tylko jeszcze dalej idącą dominację przedmiotów popularnych (wyraźne spłaszczenie ogona). Rynek elektroniczny to rynek typu winner-takes-it-all a zachowanie się uczestników jest zgodne z teorią zachowań grupowych Williama McPhee. Według Elberse nie istnieją użytkownicy zainteresowani tylko i wyłącznie produktami niszowymi, użytkownicy kupujący produkty z „długiego ogona” robią to niejako przy okazji kupowania produktów popularnych. Widać wyraźne zwiększenie dominacji bardzo wąskiej grupy przedmiotów hiper-popularnych (blockbusters), a średnie oceny produktów niszowych są zdecydowanie niższe niż oceny produktów popularnych. Elberse dochodzi do następujących wniosków w odniesieniu do rynków i dóbr elektronicznych:

 • producenci powinni skupiać wysiłki marketingowe na swoich najbardziej popularnych produktach,
 • produkcja produktów niszowych musi się odbywać najniższym możliwym kosztem, ponieważ możliwości sprzedania tych produktów są jeszcze mniejsze niż na rynku tradycyjnym,
 • sprzedaż produktów niszowych może być zwiększona przez systemy rekomendacyjne,
 • wiele produktów niszowych to produkty, które kiedyś były popularne, lecz przeniosły się do „długiego ogona” w wyniku zestarzenia się; istnieje realna szansa ich marketingu w połączeniu z produktami popularnymi (tzw. odgrzewane kotlety),
 • poszerzenie oferty o produkty niszowe umożliwia przyciągnięcie „ciężkich” klientów (tzn. klientów którzy dokonują wielu transakcji), ponieważ produkty niszowe są kupowane zdecydowanie częściej przez „ciężkich klientów”.

Artykuł jest bardzo ciekawy i zdecydowanie warty lektury.

post scriptum

Chris Anderson opublikował swoją recenzję artykułu Elberse, która z kolei przygotowała swoją odpowiedź.

The State Of Business Intelligence 2008 11/28/2008

Posted by Mikołaj Morzy in biznes.
add a comment

business intelligence

W ramach nadrabiania zaległości, natrafiłem na bardzo ciekawy artykuł we wrześniowym numerze Information Week. Artykuł stanowi wprowadzenie do corocznego raportu na temat stanu rynku narzędzi BI (business intelligence), który to raport został stworzony na podstawie ankiety rozesłanej do 350 profesjonalistów zawodowo zajmujących się BI. Pełny raport można pobrać po darmowej rejestracji. Wymowa raportu jest pozytywna: rynek nadal się rozwija, wiele firm planuje inwestycje w narzędzia BI, specjaliści w tej dziedzinie zarobią na chleb. A zatem, do nauki!

%d blogerów lubi to: