Reklama
|
Statystyka, prognozowanie, ekonometria, data mining
Forum miłośników statystyki - Statystycy całego Świata - Łączcie się :-)
|
|
Założenie o normalności rozkładu zmiennej Y|X |
| Autor |
Wiadomość |
sylwia
Szeregowy sylwia

Posty: 1 Skąd: Łódź
|
Wysłany: 2008-06-22, 12:56 Założenie o normalności rozkładu zmiennej Y|X
|
|
|
| mam drobne pytanko, czy w regresji wielokrotnej krokowej wszystkie zmienne muszą mieć rozkład normalny? |
| Ostatnio zmieniony przez mathkit 2008-09-29, 10:55, w całości zmieniany 1 raz |
|
|
|
 |
Google
|
Wysłany: Reklama google.
|
|
|
|
|
|
|
|
|
cogito
Podporucznik

Pomógł: 30 razy Posty: 297 Skąd: Wrocław
|
Wysłany: 2008-06-22, 13:42
|
|
|
w modelu regresji zaklada sie rozkald dla zmiennej objasnianej Y
to Y powinien miec rozklad normalny (pod warunkiem X)
w praktyce, odstajace obserwacje w zmiennych X moga wplywac na jakosc estymacji wspolczynnikow modelu regresji |
_________________ pozdrawiam
Przemek
www.biecek.pl |
|
|
|
 |
biometricus
Szeregowy

Posty: 17 Skąd: Warszawa
|
Wysłany: 2008-09-14, 21:35
|
|
|
| cogito napisał/a: | | w praktyce, odstajace obserwacje w zmiennych X moga wplywac na jakosc estymacji wspolczynnikow modelu regresji |
Przemek, wchodzisz w tematy, o których należałoby napisać dużo więcej (przynajmniej jeden rozdział). Wystarczy powiedzieć, że zmiennej X powinny być deterministyczne i niezależne, więc bynajmniej rozkładu normalnego mieć nie muszą (nie mogą, jako że nie są losowe). Jeżeli zaś są losowe, no to cóż... trzeba by napisać ten rozdział... Estymacja, a przede wszystkim jej jakość (precyzja), model II regresji i te sprawy, nie takie to łatwe. Obserwacje odstające rzeczywiście mogą dać do wiwatu, nie powiem, ale są na to sposoby - choćby regresja ważona. Ale nie zaczynajmy tego rozdziału...
Biometricus |
|
|
|
 |
Pearson
Podporucznik Pearson


Pomógł: 9 razy Posty: 169 Skąd: Wrocław
|
Wysłany: 2008-09-15, 13:23
|
|
|
| A ja powiem, że nie muszą mieć. |
|
|
|
 |
biometricus
Szeregowy

Posty: 17 Skąd: Warszawa
|
Wysłany: 2008-09-15, 20:13
|
|
|
| Pearson napisał/a: | | A ja powiem, że nie muszą mieć. |
Takie proste to też nie jest, bo co w przypadku, gdy zmienne przyczynowe są losowe? Czy mogą mieć dowolny rozkład, czy może wielowymiarowy rozkład normalny? |
|
|
|
 |
Pearson
Podporucznik Pearson


Pomógł: 9 razy Posty: 169 Skąd: Wrocław
|
Wysłany: 2008-09-15, 23:18
|
|
|
| biometricus napisał/a: | | Takie proste to też nie jest, bo co w przypadku, gdy zmienne przyczynowe są losowe? Czy mogą mieć dowolny rozkład, czy może wielowymiarowy rozkład normalny? |
Chodzi o f(y|x). Uważam, że normalności nie jest konieczna. |
|
|
|
 |
cogito
Podporucznik

Pomógł: 30 razy Posty: 297 Skąd: Wrocław
|
Wysłany: 2008-09-16, 00:34
|
|
|
biomet:
| Cytat: |
Wystarczy powiedzieć, że zmiennej X powinny być deterministyczne i niezależne,
|
Niezaleznosc standardowo definiuje sie dla zmiennych losowych,
pearson:
| Cytat: |
Chodzi o f(y|x). Uważam, że normalności nie jest konieczna
|
zgadzam sie w zupelnosci,
jest wiele modeli regresji w ktorych zaklada sie inny rozklad na f(y|x)
w standardowej regresji liniowej zaklada sie normalnosc f(y|x) i przy tym zalozeniu konstruuje sie testy, przedzialy ufnosci itp |
|
|
|
 |
biometricus
Szeregowy

Posty: 17 Skąd: Warszawa
|
Wysłany: 2008-09-16, 03:53
|
|
|
cogito:
| Cytat: | | Niezaleznosc standardowo definiuje sie dla zmiennych losowych, |
Źle się wyraziłem. Zmienne te powinny być ortogonalne. To klasyczne założenie regresji. |
|
|
|
 |
Pearson
Podporucznik Pearson


Pomógł: 9 razy Posty: 169 Skąd: Wrocław
|
Wysłany: 2008-09-17, 09:38
|
|
|
| cogitoII napisał/a: | | jest wiele modeli regresji w ktorych zaklada sie inny rozklad na f(y|x) |
Nie o to mi chodziło, choć to prawda. Ale o to:
| Cytat: | | w standardowej regresji liniowej zaklada sie normalnosc f(y|x) |
Zakłada się, ale nie jest ona konieczna. Czego nie możesz zrobić, jeśli zapomnisz o tym założeniu?
I jeszcze jedno:
| biometricus napisał/a: | | Zmienne te powinny być ortogonalne |
Jeśli trzymałbyś się tego założenia, to nigdy byś regresji nie zbudował. Potrzeba, aby zm. były słabo skorelowane między sobą. |
|
|
|
 |
cogito
Podporucznik

Pomógł: 30 razy Posty: 297 Skąd: Wrocław
|
Wysłany: 2008-09-17, 11:27
|
|
|
| Cytat: |
Zakłada się, ale nie jest ona konieczna. Czego nie możesz zrobić, jeśli zapomnisz o tym założeniu?
|
Jezeli nie znasz rozkladu y|x a zalozysz ze jest normlany (czyli stosujesz zwykla regresje)
to np.:
- rozklad wspolczynnikow beta sie zmieni
- nie wyznaczysz poprawnie przedzialow ufnosci dla wspolczynnikow beta
- nie kontrolujesz bledu pierwszego rodzaju testujac istotnosci wspolczynnikow beta
- nie wyznaczysz poprawnie przedzialow ufnosci dla predykcji.
- nie powinienes wykorzystywac wsp R2
| Cytat: |
Potrzeba, aby zm. były słabo skorelowane między sobą.
|
Korelacja to wspolczynnik, ktory wyznacza sie dla zmiennych losowych.
biomet może pozwolić sobie na ortogonalnosc, bo w biometrii czesto ma sie do czynienia z ukladami doswiadczalnymi i tam X'y sa takie jak chcemy
Slaba strona stwierdzenia ,,słabo skorelowane'' jest fakt ze nie wiadomo gdzie jest ta granica i jedyne co pozostaje to przymkniecie oka na potencjalne konsekwencje.
|
_________________ pozdrawiam
Przemek
www.biecek.pl |
|
|
|
 |
Pearson
Podporucznik Pearson


Pomógł: 9 razy Posty: 169 Skąd: Wrocław
|
Wysłany: 2008-09-17, 22:54
|
|
|
| cogitoII napisał/a: | Jezeli nie znasz rozkladu y|x a zalozysz ze jest normlany (czyli stosujesz zwykla regresje)
to np.:
- rozklad wspolczynnikow beta sie zmieni
- nie wyznaczysz poprawnie przedzialow ufnosci dla wspolczynnikow beta
- nie kontrolujesz bledu pierwszego rodzaju testujac istotnosci wspolczynnikow beta
- nie wyznaczysz poprawnie przedzialow ufnosci dla predykcji.
- nie powinienes wykorzystywac wsp R2
|
Chodzi o to, że ja nic nie zakładam. Przedziały, istotność współczynników mogę wyznaczyć korzystając z testów bootstrapowych.
| cogitoII napisał/a: | biomet może pozwolić sobie na ortogonalnosc, bo w biometrii czesto ma sie do czynienia z ukladami doswiadczalnymi i tam X'y sa takie jak chcemy
|
Jasne, niektóre układy są z def. ortogonalne. Ale nie miałem takich na myśli.
| cogitoII napisał/a: |
Slaba strona stwierdzenia ,,słabo skorelowane'' jest fakt ze nie wiadomo gdzie jest ta granica i jedyne co pozostaje to przymkniecie oka na potencjalne konsekwencje. |
To może inaczej. Zmienne są skorelowane ze sobą na poziomie r=0.3. Czy obie zmienne włączysz do modelu? Bo zgodnie z waszymi sugestiami, włączasz jedynie zmienne nieskorelowane, czyli r=0.
W praktyce badawczej nigdy (pomijam układy eksperymentalne) r nie jest =0.
Są odpowiednie podejścia pozwalające rozstrzygnąć, czy korelacja między zmiennymi może być niebezpieczna. |
|
|
|
 |
cogito
Podporucznik

Pomógł: 30 razy Posty: 297 Skąd: Wrocław
|
Wysłany: 2008-09-18, 00:20
|
|
|
| Cytat: |
Chodzi o to, że ja nic nie zakładam. Przedziały, istotność współczynników mogę wyznaczyć korzystając z testów bootstrapowych.
|
Uzywanie testow bootstrapowych z pewnoscia pozwala na radzenie sobie z wieloma przypadkami, ale to nie jest juz zwyka regresja liniowa i standardowe metody
Poza tym dla wrednych rozkladow bootstrap tez nie pomoze a rozwiazanie w postaci kosmicznie szerokich przedzialow ufnosci czy bardzo konserwatywnego testu to zadne rozwiazanie.
| Cytat: |
Są odpowiednie podejścia pozwalające rozstrzygnąć, czy korelacja między zmiennymi może być niebezpieczna.
|
Jakie metody?
Chetnie bym o nich cos solidnego przeczytal, bede wiec zobowiazany za odnosniki do ciekawych pozycji.
Bazowanie na VIF traktuje raczej jako opium dla ludu. |
_________________ pozdrawiam
Przemek
www.biecek.pl |
|
|
|
 |
Pearson
Podporucznik Pearson


Pomógł: 9 razy Posty: 169 Skąd: Wrocław
|
Wysłany: 2008-09-19, 15:48
|
|
|
| cogitoII napisał/a: | Uzywanie testow bootstrapowych z pewnoscia pozwala na radzenie sobie z wieloma przypadkami, ale to nie jest juz zwyka regresja liniowa i standardowe metody
Poza tym dla wrednych rozkladow bootstrap tez nie pomoze a rozwiazanie w postaci kosmicznie szerokich przedzialow ufnosci czy bardzo konserwatywnego testu to zadne rozwiazanie. |
Chodzi o to, że jeśli dostaniesz zadanie polegające na zbudowaniu regresji, to nie powiesz swojemu zleceniodawcy, że nic z tego, bo rozkład nie jest normalny. Radzisz sobie wykorzystując dostępne narzędzia - rozdzielanie na klasyczne i nieklasyczne (niestandardowe) podejścia nie jest dobre. Z może wyrzucisz model do kosza?
Swoimi odpowiedziami chcę zwrócić uwagę na fakt, że przy okazji regresji liniowej ową normalność traktuje się jak dogmat i odrzucenie hipotezy o normalności = wyrzucenie modelu do kosza.
| cogitoII napisał/a: | Jakie metody?
Chetnie bym o nich cos solidnego przeczytal, bede wiec zobowiazany za odnosniki do ciekawych pozycji.
Bazowanie na VIF traktuje raczej jako opium dla ludu.
|
Jak w całej statystyce, nie ma rzeczy pewny i jednoznacznych. Tak też tutaj istnieją pewne podejścia ułatwiające podjęcie decyzji. Do nich zaliczam: condition index and condition number, multicollinearity index, variance decomposition proportions (oparty na analizie głownych składowych), VIF.
Nie przytoczę Ci teraz dokładnych źródeł, więc specjalnie podałem po angielsku. Jak będę miał chwilę, to poszukam w swoich zasobach. |
|
|
|
 |
|
|
Nie możesz pisać nowych tematów Nie możesz odpowiadać w tematach Nie możesz zmieniać swoich postów Nie możesz usuwać swoich postów Nie możesz głosować w ankietach Nie możesz załączać plików na tym forum Możesz ściągać załączniki na tym forum
|
Dodaj temat do Ulubionych zakładek(IE) Wersja do druku
|
salon fryzjerski warszawa |mieszkania w suwałkach | Ogłoszenia Podlasie | implanty | Bukmacherzy | Liga Polska | numizmatyka | Typy bukmacherskie | betterware | bilety autokarowe | wynajem agregatów prądotwórczych | forum | portal studencki | płyty warstwowe | bronze crane statues | fotografia ślubna szczecin | alufelgi chromowane | okulary przeciwsłoneczne | rolety | hotel poznań | restauracja poznań | Ogrody Warszawa | strony internetowe olsztyn | stairlift | Patelnia elektryczna | Kosmetyki naturalne Florame | Radiografia | Nauka Jazdy Warszawa | konferansjer | | | Strona wygenerowana w 0,17 sekundy. Zapytań do SQL: 10 |
|
|