Reklama
|
Statystyka, prognozowanie, ekonometria, data mining
Forum miłośników statystyki - Statystycy całego Świata - Łączcie się :-)
|
Przesunięty przez: mathkit 2009-01-05, 15:21 |
Prawdopodobieństwo warunkowe |
| Autor |
Wiadomość |
laclos
Szeregowy

Posty: 3 Skąd: Warszawa
|
Wysłany: 2008-11-08, 16:41 Prawdopodobieństwo warunkowe
|
|
|
Powiedzmy, że posiadam wyniki pewnej ankiety: przeprowadzonej na losowo wybranych użytkownikach internetu: np. 10000 osób. Każdy z nich odpowiedział na 2 pytania:
- wiek w latach
- ilość godzin spędzana przeciętnie dziennie w internecie.
Dodatkowo posiadam dane statystyczne o użytkownikach pewnej strony internetowej, którzy odpowiedzieli tylko na 1wsze pytanie. Z danych tych wynika, że rozkład empiryczny wieku użytkowników tej strony różni się od rozkładu empirycznego wieku użytkowników internetu (np. odwiedzają ją w przeważającym stopniu osoby w wieku 13-18 lat).
Pytanie: Czy posiadając powyższe dane istnieje możliwość otrzymania rozkładu empirycznego ilości godzin spędzanych w internecie w ciągu dnia przez użytkowników tejże strony internetowej? Jeśli taka możliwość istnieje to prosiłbym o podpowiedź co do techniki, którą należy użyć. |
| Ostatnio zmieniony przez mathkit 2009-01-05, 15:18, w całości zmieniany 1 raz |
|
|
|
 |
Google
|
Wysłany: Reklama google.
|
|
|
|
|
|
|
|
|
Lady Tilly
Chorąży

Pomogła: 9 razy Wiek: 30 Posty: 129 Skąd: Poznań
|
Wysłany: 2008-11-08, 19:19 Re: Prośba o podpowiedź
|
|
|
| laclos napisał/a: | | 13-18 lat). |
Hmm - przedział wiekowy jest dość wąski...
Proponuję wziąć pod uwagę całą zbiorowość a jeśli istnieją duże różnice w rozkładzie empirycznym - napisać jakie żeby było wiadomo.
Jeśli chodzi o twoje pytanie (tłustym drukiem) to możesz zrobić tak - podzielić dzień na liczbę godzin np. mniej nież jedną godzinę spędza -tyle internautów, powyżej 1 godziny do 3 (przypuśćmy) - dziennie spędza tyle internautów... itd. Możesz na tej podstawie sporządzić szereg rozdzielczy i sporządzić diagram. |
_________________ Co to jest statystyka?
- Jeśli trzymasz głowę w lodzie a nogi w ogniu to średnio biorąc jest ci dobrze. |
|
|
|
 |
laclos
Szeregowy

Posty: 3 Skąd: Warszawa
|
Wysłany: 2008-11-08, 20:40
|
|
|
Dzięki, za odpowiedź. Jeśli chodzi o szczegóły, to niestety nie mogę ich podać, gdyż cały problem jest sformułowany bardzo ogólnie. Przytoczę go w takim razie.
Postawiono mi problem w jaki sposób (ogólnie) oszacować liczbę unikalnych użytkowników dowolnej witryny internetowej za pomocą ciasteczek (cookie). Normalnie to wiadomo - użytkownik dokonuje odsłony, dostaje ciasteczko i już więcej nie jest zliczany. Jednakże w pytaniu muszę wziąć poprawkę na osoby kasujące ciasteczka, komputery z których korzysta kilka osób (np. w bibliotece czy w komputerze rodzinnym), jak i osoby, które korzystają z kilku komputerów (np. w pracy i w domu przeglądają onet). Żadnych danych, takie pytanie "jakościowe".
Jedynym rozwiązaniem, które narzuciło mi się, to posiadanie danych statystycznych dotyczących ogólnie użytkowników internetu odnośnie powyższych problemów (a więc zawierający odpowiedzi na pytania typu "Czy Pan/Pani odwiedza te same witryny internetowe z komputera w domu i pracy/szkoły", albo "Jak często kasuje Pan/Pani ciasteczka w swoim komputerze?"). Mając takie dane statystyczne można byłoby zbadać "zafałszowanie" ilości unikalnych użytkowników przez problemy wyżej wymienione i wprowadzić poprawki, gdyby nie jedno "ale" z którym jest związane moje poprzednie pytanie.
O ile zbiór osób odwiedzających np. onet można uznać za reprezentatywny dla całego internetu, to np. zbiór osób odwiedzających serwis "fotka.pl" czy "statystycy.pl" już reprezentatywny dla całego internetu nie jest i jego preferencje w sposób znaczący mogą odbiegać od "typowych", a więc oszacowanie ilości unikalnych użytkowników takich witryn mogłoby charakteryzować się sporym błędem. |
|
|
|
 |
cogito
Podporucznik

Pomógł: 30 razy Posty: 297 Skąd: Wrocław
|
Wysłany: 2008-11-08, 20:45
|
|
|
| Cytat: | | Czy posiadając powyższe dane istnieje możliwość otrzymania rozkładu empirycznego ilości godzin spędzanych w internecie w ciągu dnia przez użytkowników tejże strony internetowej? |
Jezeli mozesz przyjac ze rozklad warunkowy (LiczbaGodzinWInternecie | wiek) jest taki sam (*) dla przecietnego internauty jak dla uzytkownika tej konkretnej strony to mozna to zrobic.
Wystarczy skorzystac z faktu, ze rozklad liczby LiczbaGodzinWInternecie dla tej strony bedzie rowny \inf_{wiek uczestnikow strony} f(LiczbaGodzinWInternecie | wiek) dP(wiek)
Innymi slowy mozesz znajac rozklad wieku odpowiednio zmieszac warunkowe rozklady LiczbaGodzinWInternecie | wiek zeby otrzymac rozklad LiczbaGodzinWInternecie
(*) to zalozenie wcale nie musi byc prawdziwe, bez niego jednak nie da sie wiele zrobic
[ Dodano: 2008-11-08, 20:53 ]
przeczytalem wlasnie Twoja odpowiedz i podziele sie goracym wrazeniem, ze
| Cytat: | | O ile zbiór osób odwiedzających np. onet można uznać za reprezentatywny dla całego internetu |
imho onet nie jest reprezentatywny, btw imho zaden pojedynczy serwis nie jest reprezentatywny,
duze serwisy sa profilowane |
_________________ pozdrawiam
Przemek
www.biecek.pl |
|
|
|
 |
|
|
Nie możesz pisać nowych tematów Nie możesz odpowiadać w tematach Nie możesz zmieniać swoich postów Nie możesz usuwać swoich postów Nie możesz głosować w ankietach Nie możesz załączać plików na tym forum Możesz ściągać załączniki na tym forum
|
Dodaj temat do Ulubionych zakładek(IE) Wersja do druku
|
salon fryzjerski warszawa |mieszkania w suwałkach | Ogłoszenia Podlasie | implanty | Bukmacherzy | Liga Polska | numizmatyka | Typy bukmacherskie | betterware | bilety autokarowe | wynajem agregatów prądotwórczych | forum | portal studencki | płyty warstwowe | bronze crane statues | fotografia ślubna szczecin | alufelgi chromowane | okulary przeciwsłoneczne | rolety | hotel poznań | restauracja poznań | Ogrody Warszawa | strony internetowe olsztyn | stairlift | Patelnia elektryczna | Kosmetyki naturalne Florame | Radiografia | Nauka Jazdy Warszawa | konferansjer | | | Strona wygenerowana w 0,29 sekundy. Zapytań do SQL: 10 |
|
|