Statystyka, prognozowanie, ekonometria, data mining
Reklama analizy statystyczne, statystyka, analiza wyników badań
Statystyka, prognozowanie, ekonometria, data mining
Forum miłośników statystyki - Statystycy całego Świata - Łączcie się :-)

FAQFAQ  SzukajSzukaj  UżytkownicyUżytkownicy  GrupyGrupy  StatystykiStatystyki
RejestracjaRejestracja  ZalogujZaloguj  Programy statystyczneProgramy statystyczne  DownloadDownload
 Ogłoszenie 
Zanim napiszesz posta zapoznaj się z regulaminem forum Zalecamy korzystać z TEX'a przy pisaniu wzorów Zlot użytkowników R - WZUR 3.0

Poprzedni temat «» Następny temat
Założenie o normalności rozkładu zmiennej Y|X
Autor Wiadomość
sylwia 
Szeregowy
sylwia


Posty: 1
Skąd: Łódź
Ostrzeżeń:
 1/3/6
Wysłany: 2008-06-22, 12:56   Założenie o normalności rozkładu zmiennej Y|X

mam drobne pytanko, czy w regresji wielokrotnej krokowej wszystkie zmienne muszą mieć rozkład normalny?
Ostatnio zmieniony przez mathkit 2008-09-29, 10:55, w całości zmieniany 1 raz  
 
     
Google

Wysłany:    Reklama google.

 
 
cogito 
Podporucznik


Pomógł: 30 razy
Posty: 297
Skąd: Wrocław
Wysłany: 2008-06-22, 13:42   

w modelu regresji zaklada sie rozkald dla zmiennej objasnianej Y
to Y powinien miec rozklad normalny (pod warunkiem X)

w praktyce, odstajace obserwacje w zmiennych X moga wplywac na jakosc estymacji wspolczynnikow modelu regresji
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
biometricus 
Szeregowy


Posty: 17
Skąd: Warszawa
Wysłany: 2008-09-14, 21:35   

cogito napisał/a:
w praktyce, odstajace obserwacje w zmiennych X moga wplywac na jakosc estymacji wspolczynnikow modelu regresji


Przemek, wchodzisz w tematy, o których należałoby napisać dużo więcej (przynajmniej jeden rozdział). Wystarczy powiedzieć, że zmiennej X powinny być deterministyczne i niezależne, więc bynajmniej rozkładu normalnego mieć nie muszą (nie mogą, jako że nie są losowe). Jeżeli zaś są losowe, no to cóż... trzeba by napisać ten rozdział... Estymacja, a przede wszystkim jej jakość (precyzja), model II regresji i te sprawy, nie takie to łatwe. Obserwacje odstające rzeczywiście mogą dać do wiwatu, nie powiem, ale są na to sposoby - choćby regresja ważona. Ale nie zaczynajmy tego rozdziału...

Biometricus 8-)
 
     
Pearson 
Podporucznik
Pearson



Pomógł: 9 razy
Posty: 169
Skąd: Wrocław
Wysłany: 2008-09-15, 13:23   

A ja powiem, że nie muszą mieć.
 
     
biometricus 
Szeregowy


Posty: 17
Skąd: Warszawa
Wysłany: 2008-09-15, 20:13   

Pearson napisał/a:
A ja powiem, że nie muszą mieć.


Takie proste to też nie jest, bo co w przypadku, gdy zmienne przyczynowe są losowe? Czy mogą mieć dowolny rozkład, czy może wielowymiarowy rozkład normalny?
 
     
Pearson 
Podporucznik
Pearson



Pomógł: 9 razy
Posty: 169
Skąd: Wrocław
Wysłany: 2008-09-15, 23:18   

biometricus napisał/a:
Takie proste to też nie jest, bo co w przypadku, gdy zmienne przyczynowe są losowe? Czy mogą mieć dowolny rozkład, czy może wielowymiarowy rozkład normalny?


Chodzi o f(y|x). Uważam, że normalności nie jest konieczna.
 
     
cogito 
Podporucznik


Pomógł: 30 razy
Posty: 297
Skąd: Wrocław
Wysłany: 2008-09-16, 00:34   

biomet:
Cytat:

Wystarczy powiedzieć, że zmiennej X powinny być deterministyczne i niezależne,


Niezaleznosc standardowo definiuje sie dla zmiennych losowych,

pearson:
Cytat:

Chodzi o f(y|x). Uważam, że normalności nie jest konieczna


zgadzam sie w zupelnosci,
jest wiele modeli regresji w ktorych zaklada sie inny rozklad na f(y|x)

w standardowej regresji liniowej zaklada sie normalnosc f(y|x) i przy tym zalozeniu konstruuje sie testy, przedzialy ufnosci itp
 
     
biometricus 
Szeregowy


Posty: 17
Skąd: Warszawa
Wysłany: 2008-09-16, 03:53   

cogito:

Cytat:
Niezaleznosc standardowo definiuje sie dla zmiennych losowych,

Źle się wyraziłem. Zmienne te powinny być ortogonalne. To klasyczne założenie regresji.
 
     
Pearson 
Podporucznik
Pearson



Pomógł: 9 razy
Posty: 169
Skąd: Wrocław
Wysłany: 2008-09-17, 09:38   

cogitoII napisał/a:
jest wiele modeli regresji w ktorych zaklada sie inny rozklad na f(y|x)

Nie o to mi chodziło, choć to prawda. Ale o to:
Cytat:
w standardowej regresji liniowej zaklada sie normalnosc f(y|x)

Zakłada się, ale nie jest ona konieczna. Czego nie możesz zrobić, jeśli zapomnisz o tym założeniu?

I jeszcze jedno:
biometricus napisał/a:
Zmienne te powinny być ortogonalne

Jeśli trzymałbyś się tego założenia, to nigdy byś regresji nie zbudował. Potrzeba, aby zm. były słabo skorelowane między sobą.
 
     
cogito 
Podporucznik


Pomógł: 30 razy
Posty: 297
Skąd: Wrocław
Wysłany: 2008-09-17, 11:27   

Cytat:

Zakłada się, ale nie jest ona konieczna. Czego nie możesz zrobić, jeśli zapomnisz o tym założeniu?


Jezeli nie znasz rozkladu y|x a zalozysz ze jest normlany (czyli stosujesz zwykla regresje)
to np.:
- rozklad wspolczynnikow beta sie zmieni
- nie wyznaczysz poprawnie przedzialow ufnosci dla wspolczynnikow beta
- nie kontrolujesz bledu pierwszego rodzaju testujac istotnosci wspolczynnikow beta
- nie wyznaczysz poprawnie przedzialow ufnosci dla predykcji.
- nie powinienes wykorzystywac wsp R2

Cytat:

Potrzeba, aby zm. były słabo skorelowane między sobą.


Korelacja to wspolczynnik, ktory wyznacza sie dla zmiennych losowych.

biomet może pozwolić sobie na ortogonalnosc, bo w biometrii czesto ma sie do czynienia z ukladami doswiadczalnymi i tam X'y sa takie jak chcemy

Slaba strona stwierdzenia ,,słabo skorelowane'' jest fakt ze nie wiadomo gdzie jest ta granica i jedyne co pozostaje to przymkniecie oka na potencjalne konsekwencje.
;-)
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
Pearson 
Podporucznik
Pearson



Pomógł: 9 razy
Posty: 169
Skąd: Wrocław
Wysłany: 2008-09-17, 22:54   

cogitoII napisał/a:
Jezeli nie znasz rozkladu y|x a zalozysz ze jest normlany (czyli stosujesz zwykla regresje)
to np.:
- rozklad wspolczynnikow beta sie zmieni
- nie wyznaczysz poprawnie przedzialow ufnosci dla wspolczynnikow beta
- nie kontrolujesz bledu pierwszego rodzaju testujac istotnosci wspolczynnikow beta
- nie wyznaczysz poprawnie przedzialow ufnosci dla predykcji.
- nie powinienes wykorzystywac wsp R2

Chodzi o to, że ja nic nie zakładam. Przedziały, istotność współczynników mogę wyznaczyć korzystając z testów bootstrapowych.

cogitoII napisał/a:
biomet może pozwolić sobie na ortogonalnosc, bo w biometrii czesto ma sie do czynienia z ukladami doswiadczalnymi i tam X'y sa takie jak chcemy

Jasne, niektóre układy są z def. ortogonalne. Ale nie miałem takich na myśli.

cogitoII napisał/a:

Slaba strona stwierdzenia ,,słabo skorelowane'' jest fakt ze nie wiadomo gdzie jest ta granica i jedyne co pozostaje to przymkniecie oka na potencjalne konsekwencje.

To może inaczej. Zmienne są skorelowane ze sobą na poziomie r=0.3. Czy obie zmienne włączysz do modelu? Bo zgodnie z waszymi sugestiami, włączasz jedynie zmienne nieskorelowane, czyli r=0.
W praktyce badawczej nigdy (pomijam układy eksperymentalne) r nie jest =0.
Są odpowiednie podejścia pozwalające rozstrzygnąć, czy korelacja między zmiennymi może być niebezpieczna.
 
     
cogito 
Podporucznik


Pomógł: 30 razy
Posty: 297
Skąd: Wrocław
Wysłany: 2008-09-18, 00:20   

Cytat:

Chodzi o to, że ja nic nie zakładam. Przedziały, istotność współczynników mogę wyznaczyć korzystając z testów bootstrapowych.


Uzywanie testow bootstrapowych z pewnoscia pozwala na radzenie sobie z wieloma przypadkami, ale to nie jest juz zwyka regresja liniowa i standardowe metody

Poza tym dla wrednych rozkladow bootstrap tez nie pomoze a rozwiazanie w postaci kosmicznie szerokich przedzialow ufnosci czy bardzo konserwatywnego testu to zadne rozwiazanie.

Cytat:

Są odpowiednie podejścia pozwalające rozstrzygnąć, czy korelacja między zmiennymi może być niebezpieczna.


Jakie metody?
Chetnie bym o nich cos solidnego przeczytal, bede wiec zobowiazany za odnosniki do ciekawych pozycji.

Bazowanie na VIF traktuje raczej jako opium dla ludu.
_________________
pozdrawiam
Przemek
www.biecek.pl
 
     
Pearson 
Podporucznik
Pearson



Pomógł: 9 razy
Posty: 169
Skąd: Wrocław
Wysłany: 2008-09-19, 15:48   

cogitoII napisał/a:
Uzywanie testow bootstrapowych z pewnoscia pozwala na radzenie sobie z wieloma przypadkami, ale to nie jest juz zwyka regresja liniowa i standardowe metody

Poza tym dla wrednych rozkladow bootstrap tez nie pomoze a rozwiazanie w postaci kosmicznie szerokich przedzialow ufnosci czy bardzo konserwatywnego testu to zadne rozwiazanie.

Chodzi o to, że jeśli dostaniesz zadanie polegające na zbudowaniu regresji, to nie powiesz swojemu zleceniodawcy, że nic z tego, bo rozkład nie jest normalny. Radzisz sobie wykorzystując dostępne narzędzia - rozdzielanie na klasyczne i nieklasyczne (niestandardowe) podejścia nie jest dobre. Z może wyrzucisz model do kosza?
Swoimi odpowiedziami chcę zwrócić uwagę na fakt, że przy okazji regresji liniowej ową normalność traktuje się jak dogmat i odrzucenie hipotezy o normalności = wyrzucenie modelu do kosza.

cogitoII napisał/a:
Jakie metody?
Chetnie bym o nich cos solidnego przeczytal, bede wiec zobowiazany za odnosniki do ciekawych pozycji.
Bazowanie na VIF traktuje raczej jako opium dla ludu.

Jak w całej statystyce, nie ma rzeczy pewny i jednoznacznych. Tak też tutaj istnieją pewne podejścia ułatwiające podjęcie decyzji. Do nich zaliczam: condition index and condition number, multicollinearity index, variance decomposition proportions (oparty na analizie głownych składowych), VIF.
Nie przytoczę Ci teraz dokładnych źródeł, więc specjalnie podałem po angielsku. Jak będę miał chwilę, to poszukam w swoich zasobach.
 
     
Wyświetl posty z ostatnich:   
Odpowiedz do tematu
Nie możesz pisać nowych tematów
Nie możesz odpowiadać w tematach
Nie możesz zmieniać swoich postów
Nie możesz usuwać swoich postów
Nie możesz głosować w ankietach
Nie możesz załączać plików na tym forum
Możesz ściągać załączniki na tym forum
Dodaj temat do Ulubionych zakładek(IE)
Wersja do druku

Skocz do:  

Powered by phpBB modified by Przemo © 2003 phpBB Group
salon fryzjerski warszawa |mieszkania w suwałkach | Ogłoszenia Podlasie | implanty | Bukmacherzy | Liga Polska | numizmatyka | Typy bukmacherskie | betterware | bilety autokarowe | wynajem agregatów prądotwórczych | forum | portal studencki | płyty warstwowe | bronze crane statues | fotografia ślubna szczecin | alufelgi chromowane | okulary przeciwsłoneczne | rolety | hotel poznań | restauracja poznań | Ogrody Warszawa | strony internetowe olsztyn | stairlift | Patelnia elektryczna | Kosmetyki naturalne Florame | Radiografia | Nauka Jazdy Warszawa | konferansjer |
Strona wygenerowana w 0,17 sekundy. Zapytań do SQL: 10