Statystyka, prognozowanie, ekonometria, data mining
Reklama analizy statystyczne, statystyka, analiza wyników badań
Statystyka, prognozowanie, ekonometria, data mining
Forum miłośników statystyki - Statystycy całego Świata - Łączcie się :-)

FAQFAQ  SzukajSzukaj  UżytkownicyUżytkownicy  GrupyGrupy  StatystykiStatystyki
RejestracjaRejestracja  ZalogujZaloguj  Programy statystyczneProgramy statystyczne  DownloadDownload
 Ogłoszenie 
Zanim napiszesz posta zapoznaj się z regulaminem forum Zalecamy korzystać z TEX'a przy pisaniu wzorów Zlot użytkowników R - WZUR 3.0

Poprzedni temat «» Następny temat
Test normalności shapiro-wilka
Autor Wiadomość
Basia 
Szeregowy


Posty: 12
Skąd: Wrocław
Ostrzeżeń:
 1/3/6
Wysłany: 2009-07-22, 13:50   interpretacja testów K-S i S-W w Statistica

Witam, potrzebuję pomocy przy ustalaniu normalności rozkładu do testu t studenta w programie Statistica. Piszę pracę licencjacką eksperymentalną, a statystykę będziemy mieć szerzej omawianą dopiero na magisterce. Poszłam na korepetycje, pokazano mi, jak zrobić test t studenta na jednym przykładzie i wszystko wydawało się jasne, ale kiedy sama wzięłam się za następny przykład, utknęłam przy sprawdzaniu normalności rozkładu. Czy możecie mi wyjaśnić w przystępny sposób (taki dla osoby mało w statystyce zorientowanej), co oznaczają kolejne liczby w takim na przykład zapisie:

D=0,1951; p<0,0100; p-Lillieforsa<0,01
SW-W=0,9109; p=0,00000

A jeśli wynika z tego, że rozkład nie jest normalny, to czy mogę na podstawie wykresu normalności i wykresu odchyleń od normalności stwierdzić, że można go pod taki podciągnąć i liczyć test t-studenta? Mój korepetytor tak właśnie zrobił dla jednej zmiennej, co do której miałam wątpliwości, czy będzie rozkład normalny, a pozostałych nie sprawdzał w ogóle, jakby wyszedł z założenia, że to wcale nie jest takie istotne.

Bardzo proszę o pomoc, nie stać mnie na chodzenie z każdą wątpliwością na korepetycje :-(
 
     
Google

Wysłany:    Reklama google.

 
 
Crunchy 
Porucznik
Crunchy


Pomógł: 38 razy
Posty: 484
Skąd: Katowice
Wysłany: 2009-07-22, 17:19   Re: interpretacja testów K-S i S-W w Statistica

Basia napisał/a:
Czy możecie mi wyjaśnić w przystępny sposób (taki dla osoby mało w statystyce zorientowanej), co oznaczają kolejne liczby w takim na przykład zapisie:

D=0,1951; p<0,0100; p-Lillieforsa<0,01
SW-W=0,9109; p=0,00000

p < 0.05 znaczy rozkład nie jest zgodny z normalnym

Basia napisał/a:
A jeśli wynika z tego, że rozkład nie jest normalny, to czy mogę na podstawie wykresu normalności i wykresu odchyleń od normalności stwierdzić, że można go pod taki podciągnąć i liczyć test t-studenta? Mój korepetytor tak właśnie zrobił dla jednej zmiennej, co do której miałam wątpliwości, czy będzie rozkład normalny, a pozostałych nie sprawdzał w ogóle, jakby wyszedł z założenia, że to wcale nie jest takie istotne.

Nie, i zmień korepetytora. Wartość testu jest wieksza niż ocena "na oko". Nie jest ważne, o ile z góry zakładamy użycie testów nieparametrycznych.
 
     
Basia 
Szeregowy


Posty: 12
Skąd: Wrocław
Ostrzeżeń:
 1/3/6
Wysłany: 2009-07-22, 19:07   Re: interpretacja testów K-S i S-W w Statistica

Crunchy napisał/a:
p < 0.05 znaczy rozkład nie jest zgodny z normalnym


Tak właśnie myślałam, ale wcześniej dla upewnienia wprowadziłam zbiór liczb tworzących idealny rozkład normalny i pogubiłam się przy wyniku "p < n.i." w teście K-S. Czy to nie oznacza również "mniej niż 0.05"? Jak wpisuję to hasło w Google, wyskakują mi różne informacje o pniach ;-)
 
     
andy264 
Szeregowy


Posty: 8
Skąd: Warszawa
Wysłany: 2009-08-05, 23:54   Test zgodności z rozkładem normalnym Shapiro - Wilka

Witam serdecznie,

Mam do Was ponownie serdeczną prośbę o podanie namiarów na literaturę, w której dobrze opisany jest test Shapiro-Wilka na badanie zgodności z rozkładem normalnym. Fajnie by było jakby w książce był podany i rozpisany dobrze przykład oraz podane tablice.

Dodatkowo, chciałbym Was prosić o namiary na książkę, w której znajdę opisany sposób postępowania w przypadku gdy po zastosowaniu ww. testu okaże się, że badana cecha nie ma rozkładu normalnego, a w odniesieniu do dalszych badań niezbędne jest aby miała. Wiem, że przeprowadza się wtedy tranfsormację logarytmiczną, jednakże nie znalazłem w literaturze jak to zrobić.

Z góry dzięki za pomoc.
Serdecznie pozdrawiam
Andy
 
     
MK 
Podporucznik


Pomógł: 27 razy
Posty: 191
Skąd: Warszawa
Wysłany: 2009-08-06, 18:50   

A sama Wikipedia nie wystarczy?
http://en.wikipedia.org/w...%80%93Wilk_test
http://en.wikipedia.org/wiki/Power_transform

To są tylko podstawienia do wzorów

W formie papierowej tablice do testu S-W są np. w Domański, Pruska - "Nieklasyczne metody statystyczne"
 
     
andy264 
Szeregowy


Posty: 8
Skąd: Warszawa
Wysłany: 2009-08-07, 10:56   

Mam do Was kilka pytań w związku z przeprowadzanym przezemnie testem na zgodność z rozkładem normalnym.

Posortowany szereg zmiennych wygląda następująco:

52
49
41
18
10
7
5
5
4
4
3
3
3
2
2
2
1
0
0
0
0
0
0
0
-1
-3
-7
-9
-13
-16
-28

Korzystając ze wzoru który podał Mathkit w poście shapiro-wilk obliczyłem statystykę W=0,777. Sprawdziłem ją załączonym w poście programikiem, który potwierdził zgodnosć. Zakładam że poziom istotoności α=0,1, wtedy wartość krytyczna Wkr=0,940

Jeżeli: " Q To jest obszar krytyczny, czyli obszar odrzucenia hipotezy zerowej, mówiącej o tym, że badana próbka pochodzi z rozkładu normalnego. Q = {W:W<W(α/2) \cup W>W(1-α/2)}"

W moim przypadku:
W<W(α/2) => 0,777 <W(0,05) => 0,777 < 0,929 jak widać nierówność jest prawdziwa.
czyli już widać, że W należy do obszaru krytycznego co świadczy o fakcie iż rozkład zmiennej nie jest rozkładem normalnym (hipotezę zerową nalezy odrzucić). Notapbene programik do badania normalności rozkładu dostępny na stronie wikipedii również odrzucił H0.

Mam do Was dwie prośby:

1. nie rozumiem wzoru w wikipedii w linku podanym przez MK. czy ktoś mógłby mi go przybliżyć:



dlaczego w tym przypadku w liczniku nie mamy różnicy wartości zmiennych tylko cały szereg - jak to interpretować? byc może coś pominąłem.

2. Ten problem jest bardziej skomplikowany. Czy ktoś z Was mógłby na moim przykładzie pokazać jak nalezy dokonać przekształcenia logarytmicznego szeregu aby sprowadzić go do postaci normalnej. Bo wzoru załączonego w tym linku nie rozumiem.

Z góry dziękuję za pomoc.
Andy
 
     
Crunchy 
Porucznik
Crunchy


Pomógł: 38 razy
Posty: 484
Skąd: Katowice
Wysłany: 2009-08-07, 20:25   

andy264 napisał/a:

2. Ten problem jest bardziej skomplikowany. Czy ktoś z Was mógłby na moim przykładzie pokazać jak nalezy dokonać przekształcenia logarytmicznego szeregu aby sprowadzić go do postaci normalnej.

Raczej z tych niemożliwych.

wg.png
Plik ściągnięto 1029 raz(y) 5,4 KB

 
     
MK 
Podporucznik


Pomógł: 27 razy
Posty: 191
Skąd: Warszawa
Wysłany: 2009-08-07, 21:32   

andy264 napisał/a:

1. nie rozumiem wzoru w wikipedii w linku podanym przez MK. czy ktoś mógłby mi go przybliżyć:



dlaczego w tym przypadku w liczniku nie mamy różnicy wartości zmiennych tylko cały szereg - jak to interpretować? byc może coś pominąłem.



Popatrz na Lemat 1 w http://sci2s.ugr.es/keel/...shapiro1965.pdf
 
     
andy264 
Szeregowy


Posty: 8
Skąd: Warszawa
Wysłany: 2009-08-10, 08:10   

Crunchy napisał/a:
Raczej z tych niemożliwych.


Jak mam to rozumieć? nie da się przekształcić tego szeregu do postaci normalnej? Czy moglibyście mi pokazać z jakiego wzoru powinienem skorzystać w celu dokonania transformacji logarytmicznej. Jeżeli powinienem użyć wzór w linku załączonym powyżej to czy moglibyście mi go wyjasnić.

Z góry dziękuję,
Andy
 
     
Basia 
Szeregowy


Posty: 12
Skąd: Wrocław
Ostrzeżeń:
 1/3/6
Wysłany: 2009-08-12, 01:26   

Ech, już myślałam, że przebrnęłam przez całą statystykę w swojej pracy, ale teraz naszły mnie kolejne wątpliwości. Mianowicie jak to możliwe, że dla tego pierwszego rozkładu w teście S-W wychodzi p = 0,00000, czyli powinnam odrzucić hipotezę zerową zakładającą rozkład normalny, a dla dwóch następnych, które absolutnie nie wyglądają na normalne, p wynosi 0,8362 i 0,6546? Mój błąd w obliczeniach odpada, bo liczy to program, ja jedynie zaznaczam "test Shapiro - Wilka". Dla pozostałych zmiennych wyniki się zgadzają, więc nie mam pojęcia, dlaczego w tych 3 przypadkach wychodzi na odwrót...

 
     
Maro 
Podporucznik


Pomógł: 9 razy
Posty: 340
Skąd: Nisko
Wysłany: 2009-08-12, 12:21   

wrzuć te dane w formacie *.sav to zobaczę czy tak samo jest w spss. Pozdrawiam
 
 
     
Basia 
Szeregowy


Posty: 12
Skąd: Wrocław
Ostrzeżeń:
 1/3/6
Wysłany: 2009-08-12, 15:17   

Niestety w programie Statistica uparcie pojawia mi się informacja, że nastąpił błąd przy zapisywaniu w formacie .sav, a plik .xls jest niedozwolony na forum. Pojadę więc do niego link:
http://www.speedyshare.com/683854267.html

Na końcu wstawiłam jeszcze dla porównania dwie zmienne, które w teście S-W liczonym w Statistice mają p = 0.0000.
 
     
Maro 
Podporucznik


Pomógł: 9 razy
Posty: 340
Skąd: Nisko
Wysłany: 2009-08-12, 16:00   

Dziwna sprawa.

Kiedy testuję wszystkie zmienne łącznie, to okazuje się, że każdy z rozkładów jest normalny. Kiedy testuję osobno, normalne są tylko rozkłady B i C (te gdzie jest po 10 obserwacji).

Test Shapiro-Wilka stosujemy do testowania rozkładów, gdy obserwacji jest mniej niż 100, powyżej stosujemy test Kołomogorowa-Smirnowa. W załaczonych raportach są wyniki obu testów i są one zgodne. Zupełnie nie wiem co z tym zrobić, trzeba poczekać na specjalistów :-)

Pozdrawiam.

test_norm_pliki.rar
Pobierz Plik ściągnięto 67 raz(y) 85,29 KB

 
 
     
Crunchy 
Porucznik
Crunchy


Pomógł: 38 razy
Posty: 484
Skąd: Katowice
Wysłany: 2009-08-12, 17:45   

Basia napisał/a:
Mianowicie jak to możliwe, że dla tego pierwszego rozkładu w teście S-W wychodzi p = 0,00000, czyli powinnam odrzucić hipotezę zerową zakładającą rozkład normalny, a dla dwóch następnych, które absolutnie nie wyglądają na normalne

A normalność rozkładu oceniamy testami czy "na oko"...?

dcomp.png
Plik ściągnięto 962 raz(y) 6,59 KB

 
     
Maro 
Podporucznik


Pomógł: 9 razy
Posty: 340
Skąd: Nisko
Wysłany: 2009-08-12, 17:52   

Crunchy napisał/a:

A normalność rozkładu oceniamy testami czy "na oko"...?
No jasne, że testami, ale daj spokój, spójrz na statystyki opisowe zmiennej oznaczonej jako "A" w bazie którą załączyłem. Wszystkie znaki na niebie i ziemi mówią, że to rozkład normalny ;-) A jeśli nienormalny to pod jakim względem? skośności? kurtozy? czy rozkład wielomodalny może być normalny? (wykres 2 w poście Basi)

A może wiesz, też skąd takie rozbieżności pomiędzy testowaniem osobno i łącznie w spss? Dziwne to.
 
 
     
Wyświetl posty z ostatnich:   
Odpowiedz do tematu
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
Nie możesz załączać plików na tym forum
Możesz ściągać załączniki na tym forum
Dodaj temat do Ulubionych zakładek(IE)
Wersja do druku

Skocz do:  

Powered by phpBB modified by Przemo © 2003 phpBB Group
salon fryzjerski warszawa |mieszkania w suwałkach | Ogłoszenia Podlasie | implanty | Bukmacherzy | Liga Polska | numizmatyka | Typy bukmacherskie | betterware | bilety autokarowe | wynajem agregatów prądotwórczych | forum | portal studencki | płyty warstwowe | bronze crane statues | fotografia ślubna szczecin | alufelgi chromowane | okulary przeciwsłoneczne | rolety | hotel poznań | restauracja poznań | Ogrody Warszawa | strony internetowe olsztyn | stairlift | Patelnia elektryczna | Kosmetyki naturalne Florame | Radiografia | Nauka Jazdy Warszawa | konferansjer |
Strona wygenerowana w 0,32 sekundy. Zapytań do SQL: 12