סטטיסטיקה 3- שיעור קשר לינארי מטרות: 1.זיהוי הקשר. איתור ערכים קיצוניים קשר מושלם חיובי קשר מושלם שלילי קשר שלילי חלקי קשר חיובי חלקי אין קשר ערכים קיצוניים- במסגרת הקורס לא נוציא ערכים אלו.
נוסחאת פרסון- ההגדרה: Rp יכול להיות בין )-1( ל : 1 )בערך מוחלט( עד.3 קשר חלש בינוני.3-. קשר גבוה.-1 Cov(x,x)= שונות של x נעדיף לבחון את הקשר על פי R של פירסון, כיוון בה COV אנו יכולים לבחון האם יש קשר, אך אנו לא יודעים לתרגם את גודל הקשר למידת העוצמה )נקבל אותה במספרים ולא באחוזים( לעומת R של פירסון. טרנספורמציות: הוספה/ החסרה של קבוע לx/y או לשניהם- אינה משנה את מקדם המתאם rp הכפלה/ חילוק פי קבוע של x/y או של שניהם- אינה משנה את מקדם המתאים rp טרנפורמציות לינאריות של משנות את,rp טרנספורמציות לא לינאריות משנות את ( rp כמו למשל העלאה בריבוע(.1. Rp מבטא קשר סימטרי במובן ש y ו yעל x ייתן תוצאה זהה. xעל הסקה לאוכלוסיה: אוכלוסיה סוגי השערות: ρ- אוכ', r- מדגם
Test mark No. of learning hours before exam חד כיוונית חיובית: : 1 : חד כיוונית שלילית: : 1 : דו כיוונית: : 1 : הנחות: דגימה מקרית של תצפיות התפלגות דו נורמלית- x מתפלג נורמלית עבור כל ערך של y x מתפלג נורמלית עבור כל ערך של y.1..3 התפלגות דו נורמלית נראית כצורה של קובע על מערכת הצירים. דיאגרמות פיזור ומתאמים Graph א. קשר חיובי חזק 11 1 9 7 5 3 5 1 15 5 3 35
Correlations Descriptive Statistics HOURS No. of learning hours before exam MARK Test mark Mean Std. Deviation N.175 5.39 19 7.153.55 19 Correlations b No. of learning hours before exam No. of learning hours before exam Test mark 1. **.. קשר חיובי חזק Test mark. ** 1. **. Correlation is significant at the.1 level (-tailed). b. Listwise N=19 ולכן נדחה H- כלומר מתקיים קשר לינארי באוכלוסייה. Sig<.5
Consumption (KM per Litter) ב. קשר שלילי חזק 3 1 1 Graph Volume (cubic CM) ככול שנפח המנוע גדול יותר, נסע פחות ק"מ לליטר ( צורכים יותר דלק( Correlations Descriptive Statistics ENGINE Volume (cubic CM) FUEL Consumption (KM per Litter) Mean Std. Deviation N 111.791 3.5 19 19. 3.99 19 Correlations b Volume (cubic CM) Consumption (KM per Litter) Volume (cubic CM) 1 -.7 **. Consumption (KM per Litter) -.7 ** 1. **. Correlation is significant at the.1 level (-tailed).
b. Listwise N=19 קשר שלילי חזק נקודה חשובה: לא יודעים מהי העוצמה באוכ', אלא רק במדגם. ניתן לראות כי מתקיים קשר שלילי באוכ' בין נפח המנוע ולק"מ לליטר. ג. מתאמים בעוצמות שונות וכיצד הם מתבטאים בדיאגרמת הפיזור Graph 1 Y3 Y3 1.979**...979** 1.. **. Correlation is significant at the.1 level a. (-tailed). Listwise N=19 Y3 1 Y Y 1.5**...5** 1.. **. Correlation is significant at the.1 level (-tailed). a. Listwise N=19
Y Y5 Y 5 3 15 1 1 5 1 Y5 a. Listwise N=19 Y5 1...7. 1.7. -1 1 קשר שאינו ליניארי )פרבולי( Correlations Y N N Y 1 -.3..39 -.3 1.39. - 1
Y7 Y7 Y ד. חוסר קשר 1 1 Y a. Listwise N= Y 1...99. 1.99. 3 ו. השפעות של ערכים קיצוניים דוגמא לערכים קיצוניים המחלישים את הקשר 1 Y7 Y7 1.3..799.3 1.799. a. Listwise N= 1 3 כמעט ואין קשר אותם נתונים לאחר השמטת תצפיות שבניגוד למגמה Y7 Y7 1.13**...13** 1.. **. Correlation is significant at the.1 level a. (-tailed). Listwise N= 1 1 קשר בינוני
Y Y דוגמא לערכים קיצוניים המחזקים את הקשר 3 1-1 5 1 15 5 Y 1.35**.. Y.35** 1.. **. Correlation is significant at the.1 level a. (-tailed). Listwise N= 3 אותם נתונים לאחר השמטת תצפיות שגורמות למגמה 1-1 1 Y a. Listwise N= Y 1...5. 1.5. רגרסיה לינארית פשוטה משתנה ב"ת- אינסוף קטגוריות- משתנה כמותי משתנה תלוי- כמותי עקום הרגרסיה- קו באוכלוסייה העובר דרך התוחלות של Y המחושבות לכל ערך קבוע של i קיימים אינסוף עקומי רגרסיה אפשריים- אנו נלמד על עקום רגרסיה 1- קו ישר. E(y/x=xi)=µyi מהו הקו הטוב ביותר? עקרון ריבועים פחותים LSE min סטייה/טעות. הקו באוכלוסיה- µyi=α+βxi הקו במדגם-
y i x i ערך אמיתי באוכ'- i ערך אמיתי במדגם- ˆ cov( x, y) sˆ r x ˆ y ˆ x sˆ sˆ y x אנו נעבוד עם הקו של y, לא של x. קשר לינארי, לרגרסיה פשוטה, המתאם הלינארי של פירסון, הסקה לאוכלוסייה, מתאם קווי מדגם, מדגם, ניתוח פלט, עקום הרגרסיה