Statystyka, prognozowanie, ekonometria, data mining
Reklama analizy statystyczne, statystyka, analiza wyników badań
Statystyka, prognozowanie, ekonometria, data mining
Forum miłośników statystyki - Statystycy całego Świata - Łączcie się :-)

FAQFAQ  SzukajSzukaj  UżytkownicyUżytkownicy  GrupyGrupy  StatystykiStatystyki
RejestracjaRejestracja  ZalogujZaloguj  Programy statystyczneProgramy statystyczne  DownloadDownload
 Ogłoszenie 
Zanim napiszesz posta zapoznaj się z regulaminem forum Zalecamy korzystać z TEX'a przy pisaniu wzorów Zlot użytkowników R - WZUR 3.0

Poprzedni temat «» Następny temat
Przesunięty przez: mathkit
2009-01-05, 15:21
Prawdopodobieństwo warunkowe
Autor Wiadomość
laclos 
Szeregowy


Posty: 3
Skąd: Warszawa
Wysłany: 2008-11-08, 16:41   Prawdopodobieństwo warunkowe

Powiedzmy, że posiadam wyniki pewnej ankiety: przeprowadzonej na losowo wybranych użytkownikach internetu: np. 10000 osób. Każdy z nich odpowiedział na 2 pytania:

- wiek w latach
- ilość godzin spędzana przeciętnie dziennie w internecie.

Dodatkowo posiadam dane statystyczne o użytkownikach pewnej strony internetowej, którzy odpowiedzieli tylko na 1wsze pytanie. Z danych tych wynika, że rozkład empiryczny wieku użytkowników tej strony różni się od rozkładu empirycznego wieku użytkowników internetu (np. odwiedzają ją w przeważającym stopniu osoby w wieku 13-18 lat).

Pytanie: Czy posiadając powyższe dane istnieje możliwość otrzymania rozkładu empirycznego ilości godzin spędzanych w internecie w ciągu dnia przez użytkowników tejże strony internetowej? Jeśli taka możliwość istnieje to prosiłbym o podpowiedź co do techniki, którą należy użyć.
Ostatnio zmieniony przez mathkit 2009-01-05, 15:18, w całości zmieniany 1 raz  
 
     
Google

Wysłany:    Reklama google.

 
 
Lady Tilly 
Chorąży


Pomogła: 9 razy
Wiek: 30
Posty: 129
Skąd: Poznań
Wysłany: 2008-11-08, 19:19   Re: Prośba o podpowiedź

laclos napisał/a:
13-18 lat).

Hmm - przedział wiekowy jest dość wąski...
Proponuję wziąć pod uwagę całą zbiorowość a jeśli istnieją duże różnice w rozkładzie empirycznym - napisać jakie żeby było wiadomo.
Jeśli chodzi o twoje pytanie (tłustym drukiem) to możesz zrobić tak - podzielić dzień na liczbę godzin np. mniej nież jedną godzinę spędza -tyle internautów, powyżej 1 godziny do 3 (przypuśćmy) - dziennie spędza tyle internautów... itd. Możesz na tej podstawie sporządzić szereg rozdzielczy i sporządzić diagram.
_________________
Co to jest statystyka?
- Jeśli trzymasz głowę w lodzie a nogi w ogniu to średnio biorąc jest ci dobrze.
 
 
     
laclos 
Szeregowy


Posty: 3
Skąd: Warszawa
Wysłany: 2008-11-08, 20:40   

Dzięki, za odpowiedź. Jeśli chodzi o szczegóły, to niestety nie mogę ich podać, gdyż cały problem jest sformułowany bardzo ogólnie. Przytoczę go w takim razie.

Postawiono mi problem w jaki sposób (ogólnie) oszacować liczbę unikalnych użytkowników dowolnej witryny internetowej za pomocą ciasteczek (cookie). Normalnie to wiadomo - użytkownik dokonuje odsłony, dostaje ciasteczko i już więcej nie jest zliczany. Jednakże w pytaniu muszę wziąć poprawkę na osoby kasujące ciasteczka, komputery z których korzysta kilka osób (np. w bibliotece czy w komputerze rodzinnym), jak i osoby, które korzystają z kilku komputerów (np. w pracy i w domu przeglądają onet). Żadnych danych, takie pytanie "jakościowe".

Jedynym rozwiązaniem, które narzuciło mi się, to posiadanie danych statystycznych dotyczących ogólnie użytkowników internetu odnośnie powyższych problemów (a więc zawierający odpowiedzi na pytania typu "Czy Pan/Pani odwiedza te same witryny internetowe z komputera w domu i pracy/szkoły", albo "Jak często kasuje Pan/Pani ciasteczka w swoim komputerze?"). Mając takie dane statystyczne można byłoby zbadać "zafałszowanie" ilości unikalnych użytkowników przez problemy wyżej wymienione i wprowadzić poprawki, gdyby nie jedno "ale" z którym jest związane moje poprzednie pytanie.

O ile zbiór osób odwiedzających np. onet można uznać za reprezentatywny dla całego internetu, to np. zbiór osób odwiedzających serwis "fotka.pl" czy "statystycy.pl" już reprezentatywny dla całego internetu nie jest i jego preferencje w sposób znaczący mogą odbiegać od "typowych", a więc oszacowanie ilości unikalnych użytkowników takich witryn mogłoby charakteryzować się sporym błędem.
 
     
cogito 
Podporucznik


Pomógł: 30 razy
Posty: 297
Skąd: Wrocław
Wysłany: 2008-11-08, 20:45   

Cytat:
Czy posiadając powyższe dane istnieje możliwość otrzymania rozkładu empirycznego ilości godzin spędzanych w internecie w ciągu dnia przez użytkowników tejże strony internetowej?


Jezeli mozesz przyjac ze rozklad warunkowy (LiczbaGodzinWInternecie | wiek) jest taki sam (*) dla przecietnego internauty jak dla uzytkownika tej konkretnej strony to mozna to zrobic.

Wystarczy skorzystac z faktu, ze rozklad liczby LiczbaGodzinWInternecie dla tej strony bedzie rowny \inf_{wiek uczestnikow strony} f(LiczbaGodzinWInternecie | wiek) dP(wiek)

Innymi slowy mozesz znajac rozklad wieku odpowiednio zmieszac warunkowe rozklady LiczbaGodzinWInternecie | wiek zeby otrzymac rozklad LiczbaGodzinWInternecie

(*) to zalozenie wcale nie musi byc prawdziwe, bez niego jednak nie da sie wiele zrobic

[ Dodano: 2008-11-08, 20:53 ]
przeczytalem wlasnie Twoja odpowiedz i podziele sie goracym wrazeniem, ze
Cytat:
O ile zbiór osób odwiedzających np. onet można uznać za reprezentatywny dla całego internetu

imho onet nie jest reprezentatywny, btw imho zaden pojedynczy serwis nie jest reprezentatywny,
duze serwisy sa profilowane
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
Wyświetl posty z ostatnich:   
Odpowiedz do tematu
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
Nie możesz załączać plików na tym forum
Możesz ściągać załączniki na tym forum
Dodaj temat do Ulubionych zakładek(IE)
Wersja do druku

Skocz do:  

Powered by phpBB modified by Przemo © 2003 phpBB Group
salon fryzjerski warszawa |mieszkania w suwałkach | Ogłoszenia Podlasie | implanty | Bukmacherzy | Liga Polska | numizmatyka | Typy bukmacherskie | betterware | bilety autokarowe | wynajem agregatów prądotwórczych | forum | portal studencki | płyty warstwowe | bronze crane statues | fotografia ślubna szczecin | alufelgi chromowane | okulary przeciwsłoneczne | rolety | hotel poznań | restauracja poznań | Ogrody Warszawa | strony internetowe olsztyn | stairlift | Patelnia elektryczna | Kosmetyki naturalne Florame | Radiografia | Nauka Jazdy Warszawa | konferansjer |
Strona wygenerowana w 0,29 sekundy. Zapytań do SQL: 10