Strona główna Grupy pl.sci.medycyna Regresja

Grupy

Szukaj w grupach

 

Regresja

Liczba wypowiedzi w tym wątku: 12


« poprzedni wątek następny wątek »

1. Data: 2004-07-22 16:23:26

Temat: Regresja
Od: "vonBraun" <i...@s...pl> szukaj wiadomości tego autora

"Binary Logistic Regression" /nie znam dokładnej polskiej nazwy/
robię to używając SPSSa - generuje m.in. parametry pozwalające
obliczyć prawdopodobienstwo przynależności do jednej z dwu grup
badanych (np. tych którzy zmarli i tych którzy przezyli).
Na podstawie zmierzonych jeszcze za życia zmiennych
Przykladowo:
b
Zmienna1 1,166
Zmienna2 -2,111
stala 1,32

prawdopodobienstwo przynaleznosci do grupy zmarlych
liczymy ze wzoru

e^(1,166*Zmienna1+(-2,111)*Zmienn2+1,32)
P=-------------------------------------------
1+e^(1,166*Zmienna1+(-2,111)*Zmienn2+1,32)


Wszystko jest dobrze dopóki zmienne są mierzalne
niemniej program pozwala sobie radzić ze zmiennymi
kategorialnymi (przyjmującymi np. wartość 0 i 1
gdzie 0 mężczyzna 1 kobieta)

Program SPSS wylicza prawdopodobieństwo i można je zapisać
w postaci nowej zmiennej - więc wartości te (czyli "P")
są mi znane.
Chciałbym mieć jednak możliwość przewidywania
prawdopodobieństwa zgonu dla nowych pacjentów.

I tu zaczynają się schody.
Dopóki zmienne które analizuję są mierzalnymi
wartościami np. na skali interwałowej wyniki
powyższego wzoru nie odbiegają od wyliczonych
przez program. Mogę sobie liczyć to np
excellem wg powyższego wzoru i wszystko wychodzi.
Ma to znaczenie dla wnioskowania o zagrożeniu zgonem.

Gdy jednak dołączam do równania regresji
zmienne zerojedynkowe (na skali nominalnej)
pojawia się znacząca niedokładność "ręcznych"
wyliczeń i wyliczeń zapisanych przez program.

Wnioskuję więc, że powyższy wzór nie ma już zastosowania.
Jak go zmodyfikować aby wychodziło?

W jaki sposób wykorzystuje się obliczone
parametry (mam na byśli owe "b") dla zmiennych kategorialnych
które
podaje program na zakończenie analizy regresji
do przewidywania prawdopodobieństwa faktu, że
zmienna zależna przyjmie określoną wartość?

Jeśli ktoś liczył regresję logistyczną SPSS-em
proszę o pomoc.


pozdrawiam
vonBraun

--
Wysłano z serwisu OnetNiusy: http://niusy.onet.pl

› Pokaż wiadomość z nagłówkami


Zobacz także


2. Data: 2004-07-22 23:07:06

Temat: Re: Regresja
Od: Robert Pyzel <r...@g...Bez.Spamu.pl> szukaj wiadomości tego autora

W artykule <7...@n...onet.pl> vonBraun tako rzecze:

A dałeś to na pl.sci.matematyka? Bo twój problem jest bardziej z tamtej
dziedziny (choć liczysz dane medyczne).


--
"Ćwiczenie Tai Chi jest doskonałym treningiem szybkości.
Mający 90 lat mistrzowie Tai Chi, poruszają się równie
szybko jak młodzi początkujący."
Robert Pyzel r p y z e l @ g a z e t a . p l (usuń BezSpamu z adresu)

› Pokaż wiadomość z nagłówkami


3. Data: 2004-07-23 12:07:55

Temat: Re: Regresja
Od: "vonBraun" <i...@s...pl> szukaj wiadomości tego autora

> W artykule <7...@n...onet.pl> vonBraun tako rzecze:
>
> A dałeś to na pl.sci.matematyka? Bo twój problem jest bardziej z tamtej
> dziedziny (choć liczysz dane medyczne).
>
[...]
> Robert Pyzel r p y z e l @ g a z e t a . p l (usuń BezSpamu z adresu)

Dałem - ale zamknięci w swej wieży z kości słoniowej
matematycy jak na razie nie odpowiadają zajmując
się problemami niezrozumiałymi dla większości śmiertelników.;-)

pozdrawiam
vonBraun



--
Wysłano z serwisu OnetNiusy: http://niusy.onet.pl

› Pokaż wiadomość z nagłówkami


4. Data: 2004-07-23 14:26:46

Temat: Re: Regresja
Od: b...@f...hoga.WYTNIJTO.pl (Pawel Baranowski) szukaj wiadomości tego autora

"vonBraun" <i...@s...pl> napisal
<7...@n...onet.pl>:

>> W artykule <7...@n...onet.pl> vonBraun tako
>> rzecze:
>>
>> A daleś to na pl.sci.matematyka? Bo twój problem jest bardziej z
>> tamtej dziedziny (choc liczysz dane medyczne).
>>
>[...]
>> Robert Pyzel r p y z e l @ g a z e t a . p l (usun BezSpamu z adresu)
>
>Dalem - ale zamknieci w swej wiezy z kości sloniowej
>matematycy jak na razie nie odpowiadają zajmując
>sie problemami niezrozumialymi dla wiekszości śmiertelników.;-)
>
spróbuj na pl.sci.ekonomiczne - regresja jest wykorzystywana często w
badaniach ekonometrycznych (w tym także modele logitowe, bo o takie Ci
chodzi zapewne).
ze swojej strony poszukam kogoś kto się zajmował logitami jakby co to
podeślę Go do Ciebie.

Pozdrawiam

--
Adres antyspamowy - przed odpowiedzia skasuj slowo "WYTNIJTO"

Litosc jest jednak uczuciem zbednym tam, gdzie przemawia Historia.
(Cz.Milosz, "Zniewolony umysl")

www.ekonomia.ho.pl

› Pokaż wiadomość z nagłówkami


5. Data: 2004-07-23 15:17:57

Temat: Re: Regresja
Od: "vonBraun" <i...@s...pl> szukaj wiadomości tego autora

p...@p...onet.pl@staticline1576.toya.net.p
l
Message-ID: <X...@2...180.128.20
>

> spróbuj na pl.sci.ekonomiczne - regresja jest wykorzystywana często w
> badaniach ekonometrycznych (w tym także modele logitowe, bo o takie Ci
> chodzi zapewne).
> ze swojej strony poszukam kogoś kto się zajmował logitami jakby co to
> podeślę Go do Ciebie.
>
> Pozdrawiam



Dzięki, zaraz to zrobię
jakby co pamiętaj o mnie,
męcze się z tym od kilku dni,
próbuję przekodowywać wartości
zmiennych nominalnych
używać zamiast zer i jedynek minus
jedynki i jedynki, dwójki i zera
itp, i podstawiać je do wzoru
ale nie wychodzi :-(.



pozdrawiam
vonBraun

--
Wysłano z serwisu OnetNiusy: http://niusy.onet.pl

› Pokaż wiadomość z nagłówkami


6. Data: 2004-07-23 17:11:50

Temat: Re: Regresja
Od: "Robert" <r...@m...pl> szukaj wiadomości tego autora

> "Binary Logistic Regression" /nie znam dokładnej polskiej nazwy/

Uzywa sie nazwy regresja logistyczna (ogolnie)

> b
> Zmienna1 1,166
> Zmienna2 -2,111
> stala 1,32

te wartosci to jak rozumiem wspolczynniki regresji, zmienne (1 i 2) to
zmienne niezalezne ktorych wplyw na przezycie chcesz zbadac.

> prawdopodobienstwo przynaleznosci do grupy zmarlych
> liczymy ze wzoru
>
> e^(1,166*Zmienna1+(-2,111)*Zmienn2+1,32)
> P=-------------------------------------------
> 1+e^(1,166*Zmienna1+(-2,111)*Zmienn2+1,32)

No i dobrze, dla danych zmiennych masz wzor z ktorego mozesz policzyc
prawdopodobienstwo przezycia (podstawiajac konkretne wartosci zmiennych 1 i
2).

> Wszystko jest dobrze dopóki zmienne są mierzalne
> niemniej program pozwala sobie radzić ze zmiennymi
> kategorialnymi (przyjmującymi np. wartość 0 i 1
> gdzie 0 mężczyzna 1 kobieta)

zgadza sie, zmienne niezalezne moga byc zarowno mierzalne jak i jakosciowe.

> (...)
> Wnioskuję więc, że powyższy wzór nie ma już zastosowania.
> Jak go zmodyfikować aby wychodziło?

Nie bardzo rozumiem.
Ten wzor na pewno nie ma zastosowania, gdyz byl wyliczony dla konkretnych
zmiennych (zmienna 1 i 2) ktore byly mierzalne. Jezeli chcesz wykorzystac
inne zmienne niezalezne dostaniesz inne wspolczynniki regresji i wzor ktory
stworzysz na ich podstawie powinien byc dobry.

> W jaki sposób wykorzystuje się obliczone
> parametry (mam na byśli owe "b") dla zmiennych kategorialnych
> które
> podaje program na zakończenie analizy regresji
> do przewidywania prawdopodobieństwa faktu, że
> zmienna zależna przyjmie określoną wartość?

Dokladnie tak jak to jest podane we wzorze ktory zacytowales powyzej...

> Jeśli ktoś liczył regresję logistyczną SPSS-em

Niestety nie liczylem nigdy regresji logistycznej SPSS-em...

Pozdrawiam

Robert Milewski


› Pokaż wiadomość z nagłówkami


7. Data: 2004-07-23 18:06:57

Temat: Re: Regresja
Od: "vonBraun" <i...@s...pl> szukaj wiadomości tego autora

"Robert"
w news:cdrgsn$rgf$2@sunflower.man.poznan.pl>
[...]
Rozumiem ze dotad sie rozumiemy;-))))

> zgadza sie, zmienne niezalezne moga byc zarowno mierzalne jak i jakosciowe.
>
> > (...)
> > Wnioskuję więc, że powyższy wzór nie ma już zastosowania.
> > Jak go zmodyfikować aby wychodziło?
>
> Nie bardzo rozumiem.
> Ten wzor na pewno nie ma zastosowania, gdyz byl wyliczony dla konkretnych
> zmiennych (zmienna 1 i 2) ktore byly mierzalne. Jezeli chcesz wykorzystac
> inne zmienne niezalezne dostaniesz inne wspolczynniki regresji i wzor ktory
> stworzysz na ich podstawie powinien byc dobry.
>
> > W jaki sposób wykorzystuje się obliczone
> > parametry (mam na byśli owe "b") dla zmiennych kategorialnych
> > które
> > podaje program na zakończenie analizy regresji
> > do przewidywania prawdopodobieństwa faktu, że
> > zmienna zależna przyjmie określoną wartość?
>
> Dokladnie tak jak to jest podane we wzorze ktory zacytowales powyzej...

Wszystko wskazuje na to ze nie.

Dopoki wykonuję analize regresji na zmiennych ilosciowych,
podstawiam do wzoru i liczę pradopodobieństwo wszystko jest OK.

Kiedy do analizy regresji dołączam zmienne jakościowe
przyjmujące np wartość 0 1 , po czym otrzymuje dla nich
parametry "b", to wraz z liczba zmiennych
jakosciowych narasta niedokladnosc pomiedzy wartosciami
P wyliczonymi "recznie" ze wzoru a wartosciami liczonymi
przerz program. Nie zalezy to od wersji SPSS wiec
raczej niemozliwe aby aplikacja miala blad.

Byc moze rzecz tkwi w jakims sposobie rekodowania
zmiennych jakosciowych (np. na -1 i 1 zamiast 0 i 1)
ale akurat to tez nie dziala.

Podkreslam ze nie licze na "starych" parametrach po dolaczeniu
nowych zmiennych! To byloby bez sensu. Nowe rownanie regresji
z dolaczonymi zmiennymi jakosciowymi daje nowe parametry.
Nowe Zmienne: Np Zmienna3 i Zmienna4 (jakościowe) dostają
tez swoje parametry.
Pisząc "ten wzór" mam na myśli jego ogólniejszą postać:

e^(B0+B1*X1+B2*X2+...Bn*Xn)
p=------------------------------------------------
1 + e^(B0+B1*X1+B2*X2+...Bn*Xn)


Skoro pojawia się niedokładność to znaczy,
że coś jest nie tak - może trzeba jakoś rekodować zmienne
przed podstawieniem do wzoru??? Ale jak?


pozdrawiam
vonBraun
PS.Potrzebuje poprawnego obliczenia po to aby poprawnie klasyfikowac nowych
pacjentow a sprawdzam to na "starych"


--
Wysłano z serwisu OnetNiusy: http://niusy.onet.pl

› Pokaż wiadomość z nagłówkami


8. Data: 2004-07-23 19:53:37

Temat: Re: Regresja
Od: "vonBraun" <i...@s...pl> szukaj wiadomości tego autora

"Robert"
w news: cdrgsn$rgf$...@s...man.poznan.pl

> Ten wzor na pewno nie ma zastosowania, gdyz byl wyliczony dla konkretnych
[...]
> Pozdrawiam
>
>    Robert Milewski
>
>

Konkretnie wygląda to tak:
Oto wyniki:
(sugeruje przekopiowanie do notatnika windows
jesli tabelki zle wygladaja)

ZMIENNE PARAMETR B
NN(1) -3,534
NW(1) -3,851
NPL(1) -4,158
NK(1) -4,316
L_STERYD(1) -10,394
WIEK 0,084
CZASOD -0,052
Constant 17,784

Pacjent pokrwawia z przewodu pokarmowego
W rownaniu regresji (backward conditional)
pozostały zmienne: Niewydolność nerek
, wątroby, nowotwor, niewydolnosc krazenia
i leki sterydowe (wszystko 0-1 czyli Nie=0 Tak=1)
oznaczone jedynką w nawiasie.
Wiek i czas do diagnostyki gastro. ( te są na skali
co najmniej porządkowej) plus stala regresji

Wyniki pierwszych 3 pacjentów ( w kolumnach) zmienne w rzędach

NN(1) 0 0 0
NW(1) 0 0 0
NPL(1) 0 0 0
NK(1) 1 0 0
L_STERYD(1) 0 1 0
WIEK 75 62 41
CZASOD 24 6 48

Zmienne po przeliczeniu "razy" parametr

NN(1) 0 0 0
NW(1) 0 0 0
NPL(1) 0 0 0
NK(1) -4,316 0 0
L_STERYD(1) 0 -10,394 0
WIEK 6,3 5,208 3,444
CZASOD -1,248 -0,312 -2,496
Constant 17,784 17,784 17,784

sumuje w kolumnach dla każdego pacjenta

pac1 pac2 pac3
18,52 12,286 18,732

Tworzę w Excellu formułę:
=EXP(Jedna_z_sumpowyżej)/(1+EXP(Jedna_z_sumpowyżej))

pac1 pac2 pac3
0,99999999 0,99999538 0,99999999

A program podaje, że powinno być:

pac1 pac2 pac3
0,70548 0,99889 0,00053

Co robie nie tak???????????
Dodam że klasyfikacja wychodzi nieźle
(przynajmniej dopóki prawdopodobienstwa liczy program)
bo klasyfikuje blednie tylko 2 pacjentow ktorzy
zmarli.



pozdrawiam
vonBraun

--
Wysłano z serwisu OnetNiusy: http://niusy.onet.pl

› Pokaż wiadomość z nagłówkami


9. Data: 2004-07-23 22:59:33

Temat: Re: Regresja
Od: "Robert" <r...@m...pl> szukaj wiadomości tego autora

> Konkretnie wygląda to tak:
> Oto wyniki:
> (sugeruje przekopiowanie do notatnika windows
> jesli tabelki zle wygladaja)
>
> ZMIENNE PARAMETR B
> NN(1) -3,534
> NW(1) -3,851
> NPL(1) -4,158
> NK(1) -4,316
> L_STERYD(1) -10,394
> WIEK 0,084
> CZASOD -0,052
> Constant 17,784

Dla pewnosci z uporem maniaka zapytam, czy obliczajac te wspolczynniki
regresji miales juz ustalone tak jak piszesz 0=Nie 1=Tak dla kazdej z pieciu
pierwszych zmiennych? Te wspolczynniki mi sie nie podobaja (na tyle na ile
mozna je ocenic nie widzac wszystkich danych)...
Pisales w pierwszym poscie, ze wyliczane prawdopodobienstwo dotyczy
przynaleznosci do grupy zmarlych, to tez nie bardzo sie zgadza. Wystepowanie
niewydolnosci nerek, watroby, krazenia, nowotworow i l. ster. powoduje
zmniejszenie sumy B0+B1*X1+B2*X2+...Bn*Xn, zatem powoduje wykladnicze
zmniejszenie wartosci e^suma a to powoduje zmniejszenie wartosci
e^suma/(1+e^suma) czyli wynikaloby ze spada prawdopodobienstwo przynalezenia
do grupy zmarlych, a to oczywiscie prawda byc nie moze. Czy tez patrzac na
pacjenta nr 3 u ktorego nie wystepuje zaden z powyzszych objawow, suma
wychodzi ponad 18, e^18 to liczba wyrazona w milionach, zatem
prawdopodobienstwo przynaleznosci do gr. zmarlych wychodzi prawie 1.
Przyjrzyj sie jeszcze raz czy to co podajesz jako PARAMETR B to na pewno
wspolczynniki regresji.

Z innych uwag, jaka masz liczebnosc grupy? Powinno byc wiecej niz
10*(ilosc_parametrow + 1)
i czy wszystkie parametry wychodza istotne, bo jezeli nie, to nieistotne
nalezy odrzucic i powtorzyc obliczenia.

Nie mam niestety pod reka SPSS-a, jezeli dane nie sa "poufne" mozesz mi
podeslac a sprawdze jak to wyglada w Statistice.

Pozdrawiam

Robert Milewski


› Pokaż wiadomość z nagłówkami


10. Data: 2004-07-24 00:26:46

Temat: Re: Regresja
Od: "vonBraun" <i...@s...pl> szukaj wiadomości tego autora

Robert w news:cds58q$949$1@sunflower.man.poznan.pl

> Dla pewnosci z uporem maniaka zapytam, czy obliczajac te wspolczynniki
> regresji miales juz ustalone tak jak piszesz 0=Nie 1=Tak dla kazdej z pieciu
> pierwszych zmiennych? Te wspolczynniki mi sie nie podobaja (na tyle na ile
> mozna je ocenic nie widzac wszystkich danych)...
> Pisales w pierwszym poscie, ze wyliczane prawdopodobienstwo dotyczy
> przynaleznosci do grupy zmarlych, to tez nie bardzo sie zgadza. Wystepowanie
> niewydolnosci nerek, watroby, krazenia, nowotworow i l. ster. powoduje
> zmniejszenie sumy B0+B1*X1+B2*X2+...Bn*Xn, zatem powoduje wykladnicze
> zmniejszenie wartosci e^suma a to powoduje zmniejszenie wartosci
> e^suma/(1+e^suma) czyli wynikaloby ze spada prawdopodobienstwo przynalezenia
> do grupy zmarlych, a to oczywiscie prawda byc nie moze. Czy tez patrzac na
> pacjenta nr 3 u ktorego nie wystepuje zaden z powyzszych objawow, suma
> wychodzi ponad 18, e^18 to liczba wyrazona w milionach, zatem
> prawdopodobienstwo przynaleznosci do gr. zmarlych wychodzi prawie 1.
> Przyjrzyj sie jeszcze raz czy to co podajesz jako PARAMETR B to na pewno
> wspolczynniki regresji.
>
> Z innych uwag, jaka masz liczebnosc grupy? Powinno byc wiecej niz
> 10*(ilosc_parametrow + 1)
> i czy wszystkie parametry wychodza istotne, bo jezeli nie, to nieistotne
> nalezy odrzucic i powtorzyc obliczenia.
>
> Nie mam niestety pod reka SPSS-a, jezeli dane nie sa "poufne" mozesz mi
> podeslac a sprawdze jak to wyglada w Statistice.
>
> Pozdrawiam
>
> Robert Milewski

Dzieki za zainteresowanie, naprowadziłeś mnie na właściwe rozwiązanie.
Przydało się też parę dodatkowych informacji.
Sprawdziłem wszystko (po raz kolejny zresztą ;-)))
"Nie" było 0, "Tak" było 1
(Już zaczynałem zdradzać objawy pomroczności jasnej)

Wyniki wyglądały wtedy tak:

Zmienna B S.E. Wald df Sig. Exp(B)
NN(1) -3,534 1,418 6,213 1 0,013 0,029
NW(1) -3,851 1,495 6,634 1 0,01 0,021
NPL(1) -4,158 1,045 15,819 1 0 0,016
NK(1) -4,316 1,112 15,069 1 0 0,013
L_STERYD(1) -10,394 29,433 0,125 1 0,724 0
WIEK 0,084 0,049 2,87 1 0,09 1,087
CZASOD -0,052 0,024 4,622 1 0,032 0,949
Constant 17,784 29,65 0,36 1 0,549 52903013,83

N-ów mam 124 czyli powinno wystarczyć - 10*8 parametrów to 80.



Wygląda na to, że SPSS dokonuje "samodzielnie" przekodowania zmiennych
do obliczenia regresji,
jeśli jakieś zmienne
wskaże się jako kategorialne
(ciekawe po co mu to
nie chce mi się dochodzić).
Pamiętając o twojej uwadze, że to NIEMOŻLIWE aby czynniki ryzyka korelowały
ujemnie ze zgonem, drogą prób i błędów spróbowałem mu nie wskazywać
które są kategorialne.

Jak mu to wyłączyłem wyszło zupełnie inaczej:

B S.E. Wald df Sig. Exp(B)
NN 3,534 1,418 6,213 1 0,013 34,247
NW 3,851 1,495 6,634 1 0,01 47,051
NPL 4,158 1,045 15,819 1 0 63,949
NK 4,316 1,112 15,069 1 0 74,912
L_STERYD 10,394 29,433 0,125 1 0,724 32663,466
WIEK 0,084 0,049 2,87 1 0,09 1,087
CZASOD -0,052 0,024 4,622 1 0,032 0,949
Constant -8,469 3,65 5,385 1 0,02 0

Tym razem wszystko się zgadza do 3 miejsca po przecinku,
(pomiędzy ręcznymi wyliczeniami P a wykliczeniami SPSS-a)
klasyfikuje nadal 95% poprawnie(!).

Z tego co piszesz wynika, że w ostatecznym rozrachunku
sterydy i wiek są do wyrzucenia - tyle, że jak je wywalę
to skuteczność klasyfikacji w grupie zgonow
spada mi z 87% na 79% (okolo).
Muszę? ( w sensie czy to poważne naciągnięcie zasad)

Mam jeszcze pytanie - może wiesz -
czy to poważny problem
ze jest bardzo duza roznica liczebnosci "przezytych" i "zgonow"
100(przezycia)/24(zgony)
- wyglada tez na to ze nieco lepiej
klasyfikuje w grupie "przezyc" niz zgonow
Moze wynika to z roznicy liczebnosci?
A w sumie bardziej wazne sa zgony - mozna to jakos
"obejsc" w Statistice na przyklad?

Alternatywnie moge sprobowac podzialu Lekki_przebieg/zgon_lub_ciezki przebieg
wtedy sie nieco zrownowazy liczebnosc, ale gorsza jest wtedy łaczna
klasyfikacja 75% (okolo) /pacjenci nie sa tak "ostro" zroznicowani/.

pozdrawiam
vonBraun

--
Wysłano z serwisu OnetNiusy: http://niusy.onet.pl

› Pokaż wiadomość z nagłówkami


 

strony : [ 1 ] . 2


« poprzedni wątek następny wątek »


Wyszukiwanie zaawansowane »

Starsze wątki

do ginekologa
do ginekologa
czy sa dostepne w aptekach testy na grupe krwi
alkohol a nadciśnienie
pilnie szukam

zobacz wszyskie »

Najnowsze wątki

Maseczki za 9 miliardów zlotych ida na przemial
Senet parts 1-3
Chess
Dendera Zodiac - parts 1-5
Vitruvian Man - parts 7-11a

zobacz wszyskie »