Path: news-archive.icm.edu.pl!mat.uni.torun.pl!news.man.torun.pl!newsfeed.pionier.net
.pl!news.man.poznan.pl!not-for-mail
From: "Robert" <r...@m...pl>
Newsgroups: pl.sci.medycyna
Subject: Re: Regresja
Date: Sat, 24 Jul 2004 11:49:55 +0200
Organization: POZMAN - http://www.man.poznan.pl/
Lines: 66
Message-ID: <cdtbc7$45p$1@sunflower.man.poznan.pl>
References: <cds58q$949$1@sunflower.man.poznan.pl>
<7...@n...onet.pl>
NNTP-Posting-Host: 212.33.66.153
X-Trace: sunflower.man.poznan.pl 1090662599 4281 212.33.66.153 (24 Jul 2004 09:49:59
GMT)
X-Complaints-To: t...@m...poznan.pl
NNTP-Posting-Date: Sat, 24 Jul 2004 09:49:59 +0000 (UTC)
X-MimeOLE: Produced By Microsoft MimeOLE V6.00.2800.1441
X-Priority: 3
X-Newsreader: Microsoft Outlook Express 6.00.2800.1437
X-MSMail-Priority: Normal
Xref: news-archive.icm.edu.pl pl.sci.medycyna:150743
Ukryj nagłówki
> Dzieki za zainteresowanie, naprowadziłeś mnie na właściwe rozwiązanie.
No to ciesze sie ze moglem pomoc :)
> Wygląda na to, że SPSS dokonuje "samodzielnie" przekodowania zmiennych
> do obliczenia regresji,
A to bardzo prawdopodobne. Statistica robi tak samo, tyle ze wprost o tym
informuje, byc moze w SPSSie niedopatrzyli tego
> jeśli jakieś zmienne
> wskaże się jako kategorialne
> (ciekawe po co mu to
> nie chce mi się dochodzić).
To moze miec znaczenie przy wiekszej niz 2 ilosci kategorii, jesli
"odleglosci" miedzy kodami nie sa jednolite (np. 1 2 5). Poniewaz zmienna
jest kategorialna nie mozemy korzystac z tej informacji (po przekodowaniu
bedzie 0 1 2)
> Z tego co piszesz wynika, że w ostatecznym rozrachunku
> sterydy i wiek są do wyrzucenia - tyle, że jak je wywalę
> to skuteczność klasyfikacji w grupie zgonow
> spada mi z 87% na 79% (okolo).
> Muszę? ( w sensie czy to poważne naciągnięcie zasad)
Zasadniczo powinno sie tak zrobic, gdyz otrzymuje sie prostszy model i do
tego powinno sie dazyc. Ale o powaznym naciagnieciu zasad nie mozna chyba
mowic, bo to w koncu tez jest model poprawny z dodatkowa informacja o
nieistotnosci 2 czynnikow (co jednak odbija sie na dokladnosci oceny
pozostalych)
> Mam jeszcze pytanie - może wiesz -
> czy to poważny problem
> ze jest bardzo duza roznica liczebnosci "przezytych" i "zgonow"
> 100(przezycia)/24(zgony)
nie jest to problemem, takie sa wyniki i tak oczywiscie moze byc
> - wyglada tez na to ze nieco lepiej
> klasyfikuje w grupie "przezyc" niz zgonow
> Moze wynika to z roznicy liczebnosci?
> A w sumie bardziej wazne sa zgony - mozna to jakos
> "obejsc" w Statistice na przyklad?
liczebnosc jest istotna i jesli wychodzi nam taki stosunek, a interesuje nas
grupa mniej liczna i chcielibysmy zwiekszyc jej liczebnosc to jedyne co
przychodzi do glowy to zwiekszenie liczebnosci calej proby, co wydaje sie
niestety nieoplacalne (zwiekszajac ja o kolejnych 124 pacjentow grupa zgonow
powiekszy sie tylko o okolo 24). Zreszta rozumiem ze zwiekszenia proby nie
bierzemy pod uwage.
> Alternatywnie moge sprobowac podzialu Lekki_przebieg/zgon_lub_ciezki
przebieg
> wtedy sie nieco zrownowazy liczebnosc, ale gorsza jest wtedy łaczna
> klasyfikacja 75% (okolo) /pacjenci nie sa tak "ostro" zroznicowani/.
Oczywiscie mozesz, ale wtedy i przy wnioskach musisz zaznaczac ze grupa
dotyczy nie tylko zgonow ale i przezyc z ciezkim przebiegiem. To jakby
zupelnie inna informacja.
Pozdrawiam
Robert Milewski
|