שאלה מספר ביוסטטיסטיקה למתקדמים פתרון תרגיל מספר 5 מבחן הסימן )המדוייק+המקורב( Sig Test )( מכיוון שלכל חולה ניתנו כל שלושת הטיפולים ובפרט טיפול B וטיפול C הרי שהנתונים הם מזווגים. נגדיר את ההפרש D להיות: ערך לחץ הדם לאחר הטיפול C פחות ערך לחץ הדם לאחר הטיפול B. המבחן המדובר הוא דוצדדי, לפי השערת האפס חציון אוכלוסיית ההפרשים הנ"ל הוא, בעוד שלפי האלטרנטיבה אחרת: H : md H : md כדי להשוות בין שני הטיפולים באמצעות מבחן הסימן נזהה את הסימן של ההפרש )משמיטים הפרשים שערכם הוא (. ניסוח אחר של השערת האפס הוא שאין הבדל בין שכיחות ההפרשים שהם בעלי סימן חיובי לבין שכיחות ההפרשים שהם בעלי סימן שלילי, כלומר ההסתברות לקבל הפרש שלילי שווה להסתברות לקבל הפרש חיובי ולכן שתיהן שוות ל.5. מכאן, נוכל לנסח את ההשערה גם כך: H ) p( ) H ) p( ) כאשר: p() מסמן את ההסתברות להפרש עם סימן חיובי, D D p() מסמן את ההסתברות להפרש עם סימן שלילי. כדי להשתמש במבחן מקורב יש צורך בלפחות הפרשים שהם שונים מ. מכיוון שישנם סה"כ 7 הפרשים בעלי סימן שלילי או חיובי )כלומר הפרשים שהם אינם שווים לערך (, נשתמש במבחן הסימן המדויק, נסמן. 7 ; סה"כ מספר ההפרשים בעלי סימן שלילי הוא, נסמן. סה"כ מספר ההפרשים בעלי סימן חיובי הוא 7, נסמן 7 הבחירה בסוג ההפרש חיובי או שלילי היא שרירותית, נבחר סוג הפרש שלילי. כלומר מערכת ההשערות ניתנת להצגה גם כך: H ).5 H ).5
נחשב מה ההסתברות לקבל ערך קיצוני יותר מזה או שווה לזה שקיבלנו במדגם. נחשב את ה p: value מכיוון ש: באופן הבא: (8>3), חישוב ה p value עבור המבחן הדוצדדי ייעשה p value k k k k k k 7 7 7.56 המסקנה היא שאנו דוחים את השערת האפס עבור כל הסתברות לטעות מסוג, I, סבירה. כלומר ישנו הבדל בין הטיפולים בערך לחץ הדם הסיסטולי. לפי מספר ההפרשים השליליים שהוא נמוך יותר מזה של מספר ההפרשים החיוביים )למעשה כל ההפרשים במקרה זה הם חיוביים( ניתן להסיק כי לחץ הדם הסיסטולי הוא נמוך יותר לאחר קבלת טיפול B )גבוה יותר לאחר טיפול C(. הערה בקשר לחישוב ה p: value אם בחרתם באופן שרירותי את ה p value עבור המבחן הדוצדדי הינו: מדובר באותה ההסתברות. אז מכיוון ש, חישוב. p value כמובן, מטעמי סימטריות, k k )( נגדיר את ההפרש D להיות: ערך לחץ הדם לאחר הטיפול A פחות ערך לחץ הדם לאחר הטיפול B. המבחן המדובר גם הוא דוצדדי, לפי השערת האפס אין הבדל בהסתברויות לקבל סימן חיובי או שלילי של ההפרש, לפי האלטרנטיבה ההסתברות לקבלת סימן חיובי של ההפרש שונה מלקבל סימן שלילי: H H ) p( ) ) p( ) גם כאן נשתמש במבחן הסימן המדויק מכיוון שישנם סה"כ 7 הפרשים בעלי סימן שלילי או חיובי )ישנו הפרש אחד שהוא שווה ל ולכן אנו משמיטים אותו(, נסמן. 6 ; סה"כ מספר ההפרשים בעלי סימן שלילי הוא 3, נסמן: 3. סה"כ מספר ההפרשים בעלי סימן חיובי הוא 73, נסמן: 3 חישוב ה p value יתקבל עלידי חישוב ההסתברות לקבל מספר הפרשים בעלי סימן שלילי שהוא שווה או גבוה מ 3 )או לחילופין עלידי חישוב ההסתברות לקבל מספר הפרשים בעלי סימן חיובי שהוא שווה או נמוך מ 73(, תחת השערת האפס לפיה מספר ההפרשים בעלי סימן שלילי )או חיובי( מפולג בינומי עם מספר ניסיונות 7 והסתברות.5, ~ B 6,.5
מכיוון ש: :p value נחשב את ה,) ~ B6,.5 )או המבחן הדוצדדי ייעשה באופן הבא: (8>3), חישוב ה p value עבור p value k k k 6 6 6 6 3 3 k 6 6 6 6 6 6 6 6 3 6 56 697. 6 6 6 6 המסקנה היא שאנו דוחים את השערת האפס לטובת האלטרנטיבה עבור כל הסתברות לטעות מסוג I שהיא גדולה מ.7, ובפרט טעות מסוג I בגודל.5. לפי מספר ההפרשים שסימנם חיובי לעומת מספר ההפרשים שסימנם הוא שלילי נוכל לומר כי לחץ הדם לאחר טיפול B הוא נמוך יותר )כלומר, גבוה יותר לאחר טיפול A(. NPar Tests Sig Test Frequecies )3( נריץ את הפרוצדורה של מבחן הסימן ב SPSS עבור סעיף )7(: dbp_trt3 dbp_trt a. dbp_trt3 < dbp_trt b. dbp_trt3 > dbp_trt c. dbp_trt3 = dbp_trt Negative Diff ereces a Positive Dif fereces b Ties c Total N 7 7 Test Statistics b dbp_trt3 dbp_trt Exact Sig. (tailed). a a. Biomial dist ribut io used. b. Sig Test 3
NPar Tests Sig Test נריץ את הפרוצדורה של מבחן הסימן ב SPSS עבור סעיף )(: dbp_trt dbp_trt a. dbp_trt < dbp_trt b. dbp_trt > dbp_trt c. dbp_trt = dbp_trt Frequecies Negative Diff ereces a Positive Dif fereces b Ties c Total N 3 3 7 Test Statistics b dbp_trt dbp_trt Exact Sig. (tailed). a a. Biomial dist ribut io used. b. Sig Test בהתייחס לשני הפלטים ה p value עבור המבחן הדוצדדי הוא כפי שקיבלנו בחישובים הידניים. המסקנה היא כמובן כפי שניסחנו עבור כל אחד מהסעיפים בביצוע המבחנים הידניים. )4( הבעיה העקרונית היא ביצוע של מספר מבחנים בוזמנית, כאשר ההסקה היא עבור טעות מסוג I בגודל מסוים, למשל.5. אם נחשב את הטעות מסוג I עבור ביצוע שני המבחנים יחד הטעות תהיה גדולה מ.5. כדי לשמור על טעות מסוג I כוללת בגודל.5 יש להשוות את ה pvalue מול טעות מסוג I כשהיא מחולקת במספר המבחנים שביצענו )תיקון בונפרוני(. כמובן, אם אנו רוצים להשוות בין שלושת הטיפולים אנו צריכים לבצע מבחן נוסף בין זוג הטיפולים A ו C, ולפי תיקון בונפרוני להסיק תחת טעות מסוג I כשהיא מחולקת ל 3. כלומר, כדי לשמור על טעות מסוג I כוללת של.5 ה p value של כל מבחן יושווה ל.533. מכאן, תוצאת מבחן להשוואה בין כל זוג תהא מובהקת רק אם ה p value הוא קטן מ.7. כך, עלסמך ביצוע 3 המבחנים נוכל ללמוד איזה טיפולים הם שונים אחד מהאחר. 4
שאלה מספר )( עבור תאומים מונוזיגוטיים בלבד נבדוק האם משקל הלידה של תינוקות שנפטרו כתוצאה ממוות בעריסה שונה משל הקבוצה האחרת. משום שהנתונים מזווגים )מדובר בזוגות של תאומים( ישנה אפשרות לבדוק זאת באמצעות מבחן הסימן. נגדיר את ההפרש D להיות: משקל הלידה של התאום ללא SIDS פחות משקל הלידה של התאום שנפטר כתוצאה מ.SIDS המבחן שבעניין הוא דוצדדי, לפי השערת האפס ההסתברות לקבל הפרש בעל סימן חיובי שווה להסתברות לקבל הפרש בעל סימן שלילי, בעוד שלפי האלטרנטיבה ההסתברות הראשונה שונה מההסתברות האחרונה. H H ). 5 ). 5 H H ) p( ) ) p( ) לפי אותם הסימונים משאלה )7(: או ישנם סה"כ 7 הפרשים בעלי סימן שלילי או חיובי )ישנו הפרש אחד ששווה לערך אותו אנו משמיטים(, לכן נשתמש במבחן הסימן המדוייק.. ; 9 ; 9 נסמן )לפי אותם הסימונים משאלה )7(( הבחירה בסוג ההפרש חיובי או שלילי היא שרירותית, נבחר סוג הפרש שלילי. כדי לחשב את ה p value עבור המבחן הדוצדדי נכפיל פי את ההסתברות לקבל ערך קיצוני יותר )לפי האלטרנטיבה( או שווה לזה שקיבלנו במדגם. כלומר, מה ההסתברות )מוכפלת פי ( לקבל מספר הפרשים בעלי סימן שלילי שהוא שווה ל או נמוך ממנו. p value k 9 9 k k 9 9 k k 9 k 9 9 k 9... 9 9 k 9 9 9 644 ]הערה: אם בחרתם כסטטיסטי את מספר ההפרשים בעלי סימן חיובי, לחילופין, ה p value יהיה ההסתברות המוכפלת פי לקבל מספר הפרשים בעלי סימן חיובי שהוא לפחות 7. בכל מקרה, נקבל את אותה ההסתברות[. המסקנה היא שאנו לא דוחים את השערת האפס, כלומר אין הבדל במשקלי הלידה בין שתי הקבוצות, בקרב התאומים המונוזיגוטיים. 5
NPar Tests Type = Moozygous Twis Sig Test No SIDS Twi Birthweight SIDS Twi Birthweight Frequecies d )( הפלט המתקבל, כאשר אנו בוחרים רק את התאומים המונוזיגוטיים: Negative Diff ereces a Positive Dif fereces b Ties c Total N 9 a. No SIDS Twi Birthweight < SIDS Twi Birthweight b. No SIDS Twi Birthweight > SIDS Twi Birthweight c. No SIDS Twi Birthweight = SIDS Twi Birthweight d. Type = Moozygous Twis Test Statistics b,c Exact Sig. (tailed) No SIDS Twi Birthweight SIDS Twi Birthweight. a a. Biomial distributio used. b. Sig Test c. Ty pe = Moozy gous Twis ערך ה p value שנתון בפלט הוא עבור מבחן דוצדדי מדוייק הוא 7, וזה צפוי לפי החישובים שלנו מהסעיף הקודם. המסקנה נוסחה בסעיף הקודם. )3( עבור תאומים דיזיגוטיים בלבד נבדוק האם משקל הלידה של תינוקות שנפטרו כתוצאה ממוות בעריסה שונה משל הקבוצה האחרת. ההפרש D מוגדר כמו בסעיף )7(: משקל הלידה של התאום ללא SIDS פחות משקל הלידה של התאום שנפטר כתוצאה מ.SIDS H H ) p( ) ) p( ) המבחן המדובר הוא דוצדדי: ישנם סה"כ 7 הפרשים בעלי סימן שלילי או חיובי )ישנו הפרש אחד ששווה לערך אותו אנו משמיטים(, לכן אפשר להשתמש במבחן הסימן המקורב )אפשר להשתמש במבחן הסימן המדוייק אך ביצועו של זה יהיה ארוך יותר(. 6
. ; נסמן: ; נבחר באופן שרירותי סוג הפרש שלילי. נחשב מה ההסתברות לקבל ערך קיצוני יותר )לפי האלטרנטיבה( מזה או שווה לזה שקיבלנו במדגם. כלומר, מה ההסתברות לקבל מספר הפרשים בעלי סימן שלילי שהוא שווה 3 נמוך מ 7, או גבוה 3 שווה לסימטרי ל 7, תחת השערת האפס. p מפולג בינומי עם הפרמטרים )סה"כ מספר הניסויים( ו )ההסתברות לקבל הפרש שלילי(, ~ B(,.5) במידה והשערת האפס היא נכונה : p.5 כלומר נוכל לחשב תוחלת ושונות תחת השערת האפס : E( ) p.5 Var( ) p q 5.5 4 כאמור, מכיוון שמספר הניסויים הוא גדול מ, מפולג בקירוב נורמלית עם התוחלת והשונות הנ"ל: N(.5,5.5). ~ סטטיסטי המבחן הינו: D D 4.5 5.5,.95 הערך הקריטי עבור רמת מובהקות של.5 הינו 3.84 3.84>, מכאן שלא נדחה את השערת האפס, כלומר אין הבדל בין המשקלים של תינוקות ה SIDS לאלו שלא,SIDS בקרב קבוצת התאומים הדיזיגוטיים. הערה: בדומה להיכרותנו עם מבחן מקנמר יכולנו לחשב את הסטטיסטי Z ולבצע מבחן דוצדדי תחת התפלגות נורמלית סטנדרטית במקום תחת התפלגות. () 7
)4( נחשב את ה p value של סטטיסטי המבחן עבור המבחן בסעיף )3(. ערך סטטיסטי המבחן שקיבלנו הינו. תחת השערת האפס ההתפלגות של השורש הריבועי של הסטטיסטי הינה נורמלית סטנדרטית, מכיוון שהמבחן הוא דו צדדי: P value P( z ).5 כלומר אנו נמצאים "עמוק" באיזור האידחייה. )5( הפלט המתקבל, כאשר אנו בוחרים רק את התאומים הדיזיגוטיים: NPar Tests Type = Dizygous Twis Sig Test No SIDS Twi Birthweight SIDS Twi Birthweight Frequecies d Negative Diff ereces a Positive Dif fereces b Ties c Total N a. No SIDS Twi Birthweight < SIDS Twi Birthweight b. No SIDS Twi Birthweight > SIDS Twi Birthweight c. No SIDS Twi Birthweight = SIDS Twi Birthweight d. Type = Dizygous Twis Test Statistics b,c Exact Sig. (tailed) No SIDS Twi Birthweight SIDS Twi Birthweight. a a. Biomial distributio used. b. Sig Test c. Type = Dizygous Twis לפי ערך ה p value שנתון בפלט הוא עבור מבחן דוצדדי מדוייק. במקרה המסויים הזה ה p values מתלכדים. לפי שני המבחנים המדוייק והמקורב )שאותו חישבנו( 8