Statystyka, prognozowanie, ekonometria, data mining
Reklama analizy statystyczne, statystyka, analiza wyników badań
Statystyka, prognozowanie, ekonometria, data mining
Forum miłośników statystyki - Statystycy całego Świata - Łączcie się :-)

FAQFAQ  SzukajSzukaj  UżytkownicyUżytkownicy  GrupyGrupy  StatystykiStatystyki
RejestracjaRejestracja  ZalogujZaloguj  Programy statystyczneProgramy statystyczne  DownloadDownload
 Ogłoszenie 
Zanim napiszesz posta zapoznaj się z regulaminem forum Zalecamy korzystać z TEX'a przy pisaniu wzorów Zlot użytkowników R - WZUR 3.0

Poprzedni temat «» Następny temat
Przesunięty przez: mathkit
2008-11-26, 10:38
Test t-studenta
Autor Wiadomość
Rat 
Szeregowy


Posty: 4
Skąd: Lublin
Wysłany: 2010-03-04, 22:08   Rozkład dowolny. A jakie założenia?

Witam.

Mam pewne pytanie. W książkach widnieje znany rozkład do weryfikacji hipotezy o wartości oczekiwanej nieznanego rozkładu.

Warunki jakie przytaczają autorzy to:

- liczna próba
- istnienie wartości oczekiwanej i wariancji
- wariancja większa od 0

Nie spotkałem się natomiast z założeniami jakimi mają podlegać same zmienne losowe - "dowolne" to raczej zbyt szeroka klasa. Pytanie: Jakie więc są założenia dla zmiennych losowych ewentualnie w jakiej literaturze te warunki są podane?

hipotezy:



statystyka:


zbiór krytyczny:


wyznaczanie liczby k:
 
     
Google

Wysłany:    Reklama google.

 
 
bulva 
Chorąży


Pomógł: 5 razy
Posty: 172
Skąd: Zgierz
Wysłany: 2010-03-04, 22:28   

Założenia testu studenta:

* Obie twoje próbki pochodzą z populacji o rozkładzie normalnym (test Shapiro - Wilk'a lub Kolmogorov'a - Smirnov'a, graficznie QQ-plot).
* Równość wariancji w obu populacjach (znowu, ponieważ masz tylko swoją próbkę a nie całą populację sprawdzasz to testem Levene'a albo Bartlett'a, graficznie box-ploty).
* Obserwacje są niezależne (miały jednakowa szanse znaleźć się w próbce)
 
     
Rat 
Szeregowy


Posty: 4
Skąd: Lublin
Wysłany: 2010-03-05, 00:26   

Dzięki, ale to nie jest to. Wiem że założenia co do tego testu są o wiele słabsze. Dwa ostatnie założenia które podałeś
-równość wariancji
-niezależność obserwacji
muszą być oczywiście spełnione bo próba jest prosta, jednak rozkłady nie muszą być tutaj normalne. Jeżeli są normalne wykorzystuje się do tego celu statystykę:



i dobiera zbiór krytyczny bazując na rozkładzie Studenta z n-1 stopniami swobody. Czyli tutaj klasa rozkładów dla których działa ten test jest dość mocno ograniczona (do rozkładów normalnych).

Natomiast test o którym wspomniałem ma dotyczyć 'dowolnych' rozkładów nie tylko normalnego (jest tak podane np. w książce: 'Zarys matematyki wyższej' Leitner str. 315, czy chociażby tutaj 'Nieznane odchylenie, duża próba') . Problem polega na tym że taki 'dowolny' to on być nie może i muszą być określone jakieś jeszcze inne warunki, które musi spełniać ten rozkład. To znaczy jeżeli te 3 warunki są spełnione to dla pewnej klasy rozkładów (powiedzmy A) stochastyczna zbieżność podanej przeze mnie statystyki może być wystarczająco szybka tak że odrzucenie faktycznie odbędzie się na zadanym poziomie istotności. Niestety dla pewnej (nieokreślonej właśnie w książkach) klasy rozkładów (powiedzmy B) zbieżność stochastyczna statystyki jest zbyt wolna aby te 3 warunki gwarantowały to że błąd I rodzaju faktycznie będzie wynosił tyle ile przyjmiemy na początku. I mi właśnie chodzi o to jak szeroka jest ta klasa rozkładów A.
 
     
bulva 
Chorąży


Pomógł: 5 razy
Posty: 172
Skąd: Zgierz
Wysłany: 2010-03-05, 13:10   

To już jest odporność testu na niespełnione założenia, CTG przy dużej próbie (regułą kciuka uznaje się tutaj 30) zapewnia normalność statystyki T, którą przybliża się rozkładem studenta ponieważ w praktyce nigdy nie znasz odchylenia ani wartości oczekiwanej (estymujesz je).
Postać statystyki T o której tutaj piszesz różni się tym iż raz estymator odchylenia jest obciążony raz nie.


To jest ten sam test, test t. Jest on faktycznie dość odporny zwłaszcza na niespełnione założenie 1). Pierwsza wersja ma większa moc jeśli dane pochodzą z rozkładu normalnego. Druga wersja wykorzystuje tylko błąd standardowy estymatora (który jest obciążony jeśli dane są normalne).
 
     
Rat 
Szeregowy


Posty: 4
Skąd: Lublin
Wysłany: 2010-03-05, 21:40   

Tak, ale nie o to mi do końca chodzi. Chodzi mi natomiast o te właśnie rozkłady dla których 'reguła kciuka' 30 próbek nie ma zastosowania. Może podam przykład.
Powiedzmy że badacz analizuje rozkład X, o którym nic z początku nie wie. Przyjmijmy że w rzeczywistości ten rozkład wygląda tak:





Jest on więc skrajnie dziwaczny bo występuje jedna duża wartość której prawd. zajścia jest bardzo małe. I teraz nie ma bata aby badacz wylosował wartość nr 3 po prostu ma nikłe na to szanse.
Z tego powodu najpewniej dojdzie on do wniosku że badany przez niego rozkład ma wartość oczekiwaną .
Przyjmijmy jednak że z jakiś przyczyn stawia on hipotezę pobiera próbkę 100 elementową i weryfikuje ją zadanym przeze mnie rozkładem na jakimś poziomie istotności powiedzmy . Wtedy, jak łatwo sprawdzić wynik wpadnie do zbioru krytycznego (wartości nr 3 nie wylosował). Czyli zadowolony odrzuca hipotezę na poziomie istotności 0.05. A tu zong bo rozkład w rzeczywistości ma wartość oczekiwaną 0. Jasne jest że w normalnym trybie nie wyciągnie on poprawnego wniosku o wartości oczekiwanej rozkładu. Musiałby przy tym pobrać bardzo dużą próbkę ale przecież nie wie on o tym jaki potworek kryje się w tym rozkładzie.

Podany przeze mnie przypadek jest skrajnie prosty i niewystępujący w praktyce ale podaję go żeby zilustrować problem. W zasadzie można go dowolnie komplikować i urozmaicać.

Pytanie jednak brzmi jak wielka jest klasa takich rozkładów i czym się one charakteryzują? Lub równoważne, dla jakich rozkładów 'reguła kciuka 30 próbek' ma zastosowanie? Oczywiście w praktyce można przyjąć że mamy akurat do czynienia z tym 'poprawnym' rozkładem z którym nie ma takich problemów. Ale wydaje się że rzetelność naukowa wymaga aby przynajmniej badacz zdawał sobie sprawę z ograniczeń stosowanej przez siebie metody. Na koniec chcę jeszcze powiedzieć że rozbieżności w wartościach przyjmowanych przez te 'rozkłady potworki' być może nie muszą być aż tak drastyczne ale tego dokładnie nie wiem i o to właśnie pytam.
 
     
MK 
Podporucznik


Pomógł: 27 razy
Posty: 191
Skąd: Warszawa
Wysłany: 2010-03-06, 01:18   

Co do przykładu, to nawet gdybyśmy wiedzieli, że np. tego typu rozkład się nie nadaje, to nie wiedząc o tej anomalii (z próby) i tak nie wiemy, że się nie nadaje :)

Nie ma analitycznych formuł na szybkość zbieżności do rozkładu normalnego. Wszystko zależy od tego jak bardzo dany rozkład jest "podobny" do normalnego. Pewnymi (różnymi) miernikami są statystyki używane do testowania normalności. Dla różnych typów rozkładów można też próbować robić symulacje.
 
     
bulva 
Chorąży


Pomógł: 5 razy
Posty: 172
Skąd: Zgierz
Wysłany: 2010-03-06, 17:31   

Są metody na wyznaczanie szybkości zbieżnosci w CTG - twierdzenie Berry-Essena o tym właśnie mówi. Niemniej jednak wydaje mi się że kolega Rat usiłuje troszeczke na siłe znaleźć dziure w całym ;). Taki rozkład jaki podałeś wogóle się nie nadaje do testu studenta i natychmiast się to wychwyci na różnych wykresach. Zawsze masz całą gamę nieparametrycznych metod, które niejednokrotnie mają dużo większa moc i bardzo łatwe do spełnienia założenia. No i dokładnie, jak masz wątpliwości są jeszcze symulacje.
 
     
Rat 
Szeregowy


Posty: 4
Skąd: Lublin
Wysłany: 2010-03-06, 23:53   

O to to. Właśnie o coś takiego jak tw. Berry-Essena mi chodziło. Od razu lepsze samopoczucie :-) Tylko dlaczego dziurę w całym? Mnie naprawdę to dołowało ;-) Że ten rozkład taki podałem to jak napisałem zależało mi na prostocie. Weź sobie dowolny rozkład dyskretny i można łatwo go przerobić dobierając odpowiednio wartość z zadanym prawdopodobieństwem, która to anomalia zmienia gwałtownie parametry rozkładu. Zresztą w przypadku rozkładów ciągłych jest to samo tylko tutaj trzeba by było zmodyfikować prawdopodobieństwo dla pewnego małego przedziału. Łatwo przecież to zrobić. No a symulacje czy cokolwiek innego nie wykryją tych wszystkich potencjalnych anomalii jeżeli zawczasu nie znamy postaci rozkładu bo niby jak? Nawet jak pobrałoby się dużą próbkę i wykryło tę o nr 3 to i tak jakie masz gwarancje (jak nie znasz jawnie rozkładu) że nie ma tam jeszcze jakiejś jednej której prawd. zajścia jest jeszcze mniejsze? Tego nie da się sprawdzić. Można tylko liczyć na to że natura nie jest zbyt wyrafinowana pod tym względem.

MK- Ale przynajmniej wiemy czego wiedzieć nie możemy, a to już naprawdę coś no i sen spokojniejszy :mrgreen:
 
     
emka89.89 
Szeregowy


Posty: 1
Skąd: Bełżyce
  Wysłany: 2010-03-07, 16:28   Hipoteza

Przeciętna długość produkowanego elementu powinna być równa wynosi 5 m, przy odchyleniu standardowym równym 0,1. Sprawdzić, czy na poziomie istotności 0,05 średnia długość elementu odpowiada wymaganej. Zmierzono 12 elementów, otrzymane wyniki podane są w tabeli.
i xi
1 5,02
2 4,88
3 4,91
4 4,89
5 4,87
6 5,01
7 5,09
8 5,06
9 4,95
10 4,93
11 4,96
12 4,85

w podobnym zadaniu stosowaliśmy wzór R= x-m (x to średnia bo nie umiem tej kreski na górze zrobić.)
Obliczalismy remp oraz -rk

[ Dodano: 2010-03-07, 19:51 ]
nikt nie wie?? :-(
 
     
mathkit 
Kapitan



Pomógł: 33 razy
Wiek: 26
Posty: 651
Skąd: Katowice
Wysłany: 2010-03-07, 23:05   

Musisz zastosować test dla wartości średniej. Scaliłem Twój post do odpowiedniego wątku.
 
 
     
Bimbina 
Szeregowy


Wiek: 23
Posty: 1
Skąd: Gdynia
  Wysłany: 2010-03-22, 08:24   Problem z Exelem

Witam mam pewien problem, może dla wielu głupi... jak już oblicze w exelu test T.... Uzyskam pewna wartość czy teraz mam to sprawdzić w jakiś tabelach?
Prosze o pomoc muszę uporać sie ze statystyka do magisterki i za żadne skarby ie potrafię sobie przypomnieć jak to sie robiło...

[ Dodano: 2010-03-23, 22:20 ]
Już coś wymyśliłam i doszłam... ale pojawiła się nowy problem. Musze zinterpretować wyniki do magisterki. Prowadziłam obserwacje ilości ptaków na danym terenie , teraz muszę sprawdzić czy istnieje istotne różnica pomiędzy porami roku. Jak mam to policzyć czy porównać średnie z poszczególnych pór roku czy grupy w których zawierać się będę obserwacje które miały miejsce w danej porze roku.
 
     
_kurt_ 
Szeregowy


Posty: 7
Skąd: Chęciny
Wysłany: 2010-04-05, 17:35   

Pomóżcie!!!!!!!!!!!!!
mam dwie grupy badań tych samych osób przed i po okr. przygotowawczym oraz trzy różne testy wydolności które mam porównać ze sobą za pomocą t-Studenta znam średnie, odchyl. standardowe i liczebność grupy
są to grupy zależne a nie pamiętam jak to zacząć bo statystykę miałem na I semestrze
oto dane podpowiedzcie rozw.
n=12
R.Costilla Test Coopera PWC 170 VO2max (l/min) VO2max(l/min)

VO2max VO2max (W) I II
(ml/kg/min) (ml/kg/min) 150W 150W
I II I II I II


45 50 52,5 55,58 207,67 230,9 3,35 3,56 Średnia artmety.
5,64 4,84 2,39 2,54 49,96 83,96 0,45 0,75 Odchylenie standardowe
Wyniki badań
I- Próba wykonana przed okresem przygotowawczym
II- Próba wykonana po okresem przygotowawczym

jak bym mógł to poprosiłbym na e-maila można wysłać podpowiedź M_lorak@poczta.fm
 
     
Shidley 
Major
Shidley



Pomógł: 65 razy
Wiek: 38
Posty: 1251
Skąd: Gdańsk
Wysłany: 2010-04-06, 12:44   

mnie to wygląda na test dla prób zależnych (te same osoby w grupie?) - proponuje testy dla średnich... trzy
_________________
Każdy ma to na co zasłużył...
 
     
_kurt_ 
Szeregowy


Posty: 7
Skąd: Chęciny
Wysłany: 2010-04-06, 21:41   

grupy są te same a tak dokładnie to są wyniki grupy zawodników przed i po okresie przygotowawczym w trzech testach sprawnościowych mam porównać wyniki przed i po treningu oraz różnicę między testami (Coopera, Costilla oraz PWC170)
nie pamiętam czy mam postawić Ho i H1, H2 (H1 trening poprawił wydolność, H2 trening nie poprawił wydolności) czy tylko Ho i H1
proszę o pomoc i wskazówki jak zacząć

[ Dodano: 2010-04-06, 21:43 ]
i jeszcze jedno promotor kazał to obliczyć przez t-studenta
 
     
Shidley 
Major
Shidley



Pomógł: 65 razy
Wiek: 38
Posty: 1251
Skąd: Gdańsk
Wysłany: 2010-04-07, 08:57   

zacznij od Ho:m1=m2 wobec H1:m1<m2 (m1 średnia przed , m2 średnia po)
_________________
Każdy ma to na co zasłużył...
 
     
Wyświetl posty z ostatnich:   
Odpowiedz do tematu
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
Nie możesz załączać plików na tym forum
Możesz ściągać załączniki na tym forum
Dodaj temat do Ulubionych zakładek(IE)
Wersja do druku

Skocz do:  

Powered by phpBB modified by Przemo © 2003 phpBB Group
salon fryzjerski warszawa |mieszkania w suwałkach | Ogłoszenia Podlasie | implanty | Bukmacherzy | Liga Polska | numizmatyka | Typy bukmacherskie | betterware | bilety autokarowe | wynajem agregatów prądotwórczych | forum | portal studencki | płyty warstwowe | bronze crane statues | fotografia ślubna szczecin | alufelgi chromowane | okulary przeciwsłoneczne | rolety | hotel poznań | restauracja poznań | Ogrody Warszawa | strony internetowe olsztyn | stairlift | Patelnia elektryczna | Kosmetyki naturalne Florame | Radiografia | Nauka Jazdy Warszawa | konferansjer |
Strona wygenerowana w 0,48 sekundy. Zapytań do SQL: 10