טרנספורמציה של ציוני בחינות שמואל אבן-זהר יועץ סטטיסטי מבוא: לא מכבר רגשו סטודנטים באחת האוניברסיטאות כאשר נודע להם שפקולטה מסוימת הוציאה הנחייה למרצים שהציון הממוצע שהם נותנים לא יעלה על 80. העניין יצא לתקשורת, והסטודנטים אף איימו לפנות לערכאות, כי מדוע מונעים מהם ציונים גבוהים אם מגיע להם. נראה שהסטודנטים לא כל-כך הבינו את המשמעות הסטטיסטית של "ציון", ואת חשיבות המיקום הקבוצתי של הפרט יותר מאשר הציון הגולמי. על בעיות אלו ואחרות דן המאמר הנוכחי. למעשה, מאמר דומה התפרסם כבר לפני שנים אחדות ב"מידע" )עוד לפני עידן הגרסה האלקטרונית(, והוא מפורסם שנית כאן בגרסה מעודכנת עקב האקטואליות המחודשת שלו כיום. מבחנים וציונים: כל מרצה באוניברסיטה או מורה בבית-הספר ניצב בפני הבעיה של מתן ציונים אובייקטיבים לתלמידים, אשר ישקפו את מידת השליטה שלהם בחומר. לשם כך עליהם לענות על שאלון )המכונה "מבחן"(, והציון הניתן עליו הינו המדד הנפוץ המציין את "מידת הידע" של הסטודנט בנושא הנלמד. הנחת היסוד היא שפריטי המבחן מהווים מדגם אקראי מתוך החומר כולו עליו אמור התלמיד לשלוט. כמו כל כלי מדידה מסוג זה )שאלונים( גם המבחן צריך להיות מהימן ותקף. מהימנות המבחן משמעה - באיזה מידה המבחן בכלל מודד משהו, באיזו מידה המבחן יציב )אם הסטודנט ייבחן שנית האם יקבל פחות או יותר ציון דומה(, והאם כל חלקי המבחן מודדים אותו מדד מסוים )או שהוא מורכב מכמה עולמות תוכן(. קל למדוד את מהימנות המבחן על-ידי חישוב איזה שהוא ממוצע משוקלל של הקורלציות בין ציונים המחושבים בנפרד לחלקי המבחן השונים )ישנם שיטות שונות כמו Split half או,Kronbach's Alpha או ניתוח פריטים וכדומה(. אך תקיפות המבחן - מדד הבודק באיזה מידה המבחן בודק באמת את מה שאנו משערים שהוא בודק )את מידת הידע בנושא המבחן(, מדד זה בעייתי יותר למדידה. הידע הוא פנימי, אינפורמציה השתולה במוחו של הסטודנט ולא ניתן למדדו באופן ישיר. היה נחמד לו ניתן היה לקחת במבחנה "דגימת מוח" ולבדוק את כמות הידע באופן ישיר, כמו בדיקת דם. אין אלו דיבורים בעלמא, שכן ל"ידע הסביבתי" יש ממשות פיסיקלית המתבטאת בפרוטאינים מסוימים במוח האנושי וב- RNA, כמו שה"ידע התורשתי" מתבטא ב- DNA, אך כמובן, לא ניתן לעשות זאת. ציון המבחן, אם כן, הוא אמצעי עקיף למדידת ידע, ואמור לשקף את כמות הידע, אך ברור שאין שום מבחן המודד זאת במדויק. לא רק שהמדידה עצמה מקלקלת את המידה, ולא אחת נכשלים תלמידים עקב התרגשות, או מצליחים בעזרת ניחוש )או שכן טוב(, אלא שמדידה זו אינה אובייקטיבית לחלוטין, ותלויה בהרבה גורמים צדדיים, פיזיולוגיים, בריאותיים, גיל הנבחן, אישיותו וכדומה, שלא לדבר על כתב-היד, מצב הרוח של הבודק, וקריטריונים שונים לקביעת ציון המבחן בין בודק לבודק. הסטודנט העונה על המבחן עובר תהליך של שליפת )אחזור( האינפורמציה ממוחו. הטבעת החומר הנלמד אל המוח דורש קידוד )Encoding( - מעבר מצורה פיסיקלית חיצונית )אור, קול( לצורה פיזיולוגית פנימית )שינויים כימיים ב- RNA, או גם פעילויות חשמליות במוח(. תהליך השליפה הוא הפוך, פענוח )Decoding( - מעבר מצורה פיזיולוגית פנימית לצורה פיסיקלית חיצונית, כתיבה, סימון או דיבור. בכל מעבר כזה ישנו איבוד מסוים של החומר. תהליך הלמידה עצמו המתחולל במוח )Recoding( הינו שזירת קשרים אסוציאטיביים במוח, אך לא זה נושא המאמר הנוכחי. קל להבחין שמודל זה לקוח מעולם המחשב.
ישנם גורמים שונים המפריעים לשליפת מידע, כמו תכונות אישיות של הסטודנט )איטיות בתגובה, חוסר ריכוז( או הפרעות זמניות, שלא יבואו בהכרח לביטוי בעיתוי אחר, וכך אין המבחן משקף ידע אמיתי. יתכן גם ופריטי המבחן אינם מהווים מדגם מייצג של החומר הנלמד. אם למשל השאלות אינן מפוזרות באופן אקראי על-פני כל חומר הקורס אלא מרוכזות על תחילת החומר, גם הסטודנטים שלא הספיקו לגמור ללמוד יכולים להצליח, ואלו שעברו על כל החומר, יספיקו אולי לשכוח את ההתחלה, ויכשלו. אם השאלות לקוחות מסוף החומר הלימודי, ייתכן ובעלי זיכרון קצר, שלא הפנימו את כל החומר יצליחו, וכדומה. מכל האמור לעיל ברור שהציון הגולמי המתקבל במבחן כל שהוא אין לו קיום בפני עצמו ואינו משקף את "אחוז הידע". מטרת מבחן היא )כשמו( - לאבחן בין הטובים יותר והטובים פחות, ולא משנה כלל מהו טווח ציוני המבחן. לכן, חשוב יותר לדעת לגבי כל סטודנט מהו מיקומו היחסי בקבוצה )ציון הפרסנטיל - )Percentile( או מהו מיקומו יחסית לממוצע הכיתה )ציון התקן שלו -,)Score-Z ולא מהו ציונו הגולמי במבחן. מבחן טוב מוגדר כמבחן שציוניו מתפלגים כמו רוב המדדים בטבע - התפלגות נורמאלית )במובנה הסטטיסטי, בעלת עקומת גאוס(, כך שישנם נבחנים מעטים גרועים, מעטים מצוינים, והרוב מתרכז באופן סימטרי סביב הממוצע. מבחינות רבות, במידת האפשר, עדיף מבחן בשיטה האמריקאית )תשובות סגורות לבחירה(, אשר מאפשר מדגם גדול יותר של פריטי ידע, אובייקטיבי יותר, וקל יחסית לבדיקה )באמצעות תוכנית מחשב(. שאלות פתוחות ניתנות לפרושים סובייקטיביים של המרצה, ואף במדעים מדויקים, כמו פתרונות מתמטיים ניתנים להערכות שונות אצל מרצים שונים )כמו האם להחשיב את דרך הפיתרון או לא, וכמה נקודות לתת על תשובה לא מדויקת(. הציון למבחן בו התשובות כתובות בכתב-יד מושפע מאד מבהירות הכתב, מהסדר והניקיון, וכדומה. מבחן אמריקאי רב פריטים ורב אפשריות תשובה מאפשר מידה רבה של אובייקטיביות ומתן שוויון הזדמנויות מלא לכל הנבדקים. המבחן מאפשר לערב את השאלות ואף את התשובות האפשריות בקלות יחסית בסדר אקראי בעזרת מחשב, וכך נמנעת העתקה או תשובות קבעוניות. הבדיקה הממוחשבת חוסכת זמן ומונעת ויכוחים מיותרים עם הסטודנטים, שהרי המחשב "אובייקטיבי" לחלוטין. הבדיקה הממוחשבת מאפשרת לאתר בקלות שאלות שהיו קשות מידי או קלות מידי על-פי מספר הסטודנטים שהצליחו או נכשלו בכל פריט, ולהורידם מהחשבון. כמו כן, ניתן לבדוק מהימנות המבחן )ניתוח פריטים( או/ו ניתוח גורמים, לאתר שאלות שאינן שייכות לעולם התוכן הכללי, וכדומה. היות ונהוג באוניברסיטה )וגם בבתי-ספר( סולם אחיד של טווח ציונים )לגבי ציון עובר( הנע בין 60 ל- 100, על המרצה לדאוג אם כן להעביר את הציונים הגולמיים המתקבלים במבחן כל-שהוא, לטווח קרוב לזה באמצעות נוסחה אחידה ואובייקטיבית. טרנספורמציה זו של הציונים חייבת לשמור על סדר, אך לא חייבת להיות ליניארית. ישנן שיטות שונות לטרנספורמציה של ציונים. חלק מהן יפורטו להלן: א. הבונוס הקבוע: המרצה או המורה מבחין שציוניו נמוכים מדי, והם נעים למשל, בין 40 ל- 80. מצב זה מורה על מבחן קשה מדי. יתכן והוא כולל פריטים שאינם בחומר הנדרש, או שאלות לא ברורות, או שהמרצה פשוט גרוע ולא הצליח להבהיר את החומר. לא סביר שהכיתה כולה חלשה, וגם אם כן, צריך להתאים את הציונים למצב הקבוצתי. במצב זה אפשר פשוט להוסיף לכל תלמיד 20 נקודות. החיסרון: בונוס זה אינו יעיל כשהציונים נעים מ- 0 עד 100, למשל, אך ההתפלגות אינה נורמאלית ורוב הציונים נמוכים מדי. כמו-כן, תוספת הנקודות היא אחידה הן לחלשים והן לחזקים, ואינה פרוגרסיבית.
ב. הבונוס היחסי: המרצה מכפיל כל ציון בפקטור קבוע. אם למשל הציונים נעים בין 40 ל- 80, ניתן להכפיל כל ציון ב- 1.25. כאן מקבל התלמיד הטוב בונוס גדול יותר מהתלמיד הגרוע. החיסרון: יש בזה מידה מסוימת של אי-צדק, תמיכה בחזקים ופחות תמיכה בחלשים. במצב של התפלגות שאינה נורמאלית )בעלת זנב ימני( יתכן והסטודנטים שקיבלו ציונים גבוהים ציונם יקוצץ מאחר ויעבור את הגבול של 100, ולא יהיה ניכר הבדל בין תלמידים מצוינים וטובים. ג. טרנספורמציה בהנחה של התפלגות נורמאלית: בטרנספורמציה זו, המרצה מחליט מהו ממוצע הכיתה המועדף, ומה סטיית התקן הראויה. נניח שהמרצה מעוניין בממוצע של 80 וסטיית תקן 10 נקודות. כידוע, כ- 2.5% מהאוכלוסייה נמצא מעל ציון תקן של 1.96, וכ- 2.5% נמצאים מתחת לציון תקן 1.96-. בהחלטה הנ"ל של המרצה, כל סטיית תקן ערכה 10 נקודות. לכן, ציון 100 נמצא שתי סטיות תקן מעל לממוצע וציון 60 נמצא שתי סטיות תקן מתחת לממוצע. בהנחה )סבירה( שהציונים מתפלגים נורמאלית, ההשלכה הישירה של החלטת המרצה הנ"ל היא שכ- 2.3% מהסטודנטים יכשלו, ואחוז דומה יקבל ציון 100 )ומעלה(. אם המרצה ירצה להגדיל אחוזים אלו, עליו להחליט על טרנספורמציה עם פיזור גבוה יותר, למשל סטיית תקן של 15 נקודות. במצב זה הציון 100 מקביל לציון התקן 1.33 מעל הממוצע וציון 60 ציון התקן שלו הוא 1.33-. מבט בטבלת ההתפלגות הנורמאלית מורה על כך, שבמצב זה 9.18% מהסטודנטים יכשלו ואחוז דומה יקבלו ציון 100 )ומעלה(. מרצה מחמיר יותר יכול להחליט על ממוצע נמוך יותר, או סטיית תקן קטנה יותר. החישוב ייעשה על-ידי הנוסחה - m T = Z * s + כאשר: - T הציון הסופי של הסטודנט - Z ציון התקן של הסטודנט - s סטיית התקן המבוקשת - m ממוצע הכיתה המבוקש. )חישוב ציון Z לכל סטודנט ייעשה לפי הנוסחה הרגילה - m s / =Z( x) כאשר: Z ציון התקן של הסטודנט x הציון הגולמי של הסטודנט אותו קיבל במבחן - m הציון הממוצע של הכיתה - s סטיית התקן של הכיתה(
אם יוחלט על ממוצע 80 וסטיית-תקן 12, סטודנט שקיבל את ציון התקן הממוצע 0, ציונו יהיה לפי הנוסחה 80. סטודנט שציון התקן שלו 1 יקבל ציון 92. לפי טבלת ההתפלגות הנורמאלית כ- 16% מהסטודנטים יעברו ציון זה, ובאותה מידה, כ- 16% יקבלו ציון פחות מ- 68. ציון תקן 1.66 מקנה כבר ציון 100. יותר מ- 5% מהסטודנטים יקבלו ציון זה, וזהו גם אחוז הנכשלים. בהמשך מוצעת הדרך המעשית לחישוב זה, בעזרת גיליון אלקטרוני כל-שהוא. קביעת ממוצע וסטיית תקן קבועים למבחנים מאפשר להשוות רמות שונות של תלמידים לצרכים שונים, או של מבחנים למרצים שונים. לדוגמה: תלמידים מדרום ת"א ומצפונה אינם זוכים לתנאים שווים בלימודיהם, בגלל נקודת זינוק שונה, תנאי הסביבה, אי שוויון במשאבים, ואולי גם טיב המורים. בכל אופן, בהנחה של אינטליגנציה דומה, תלמיד שהגיע לציון גבוה יחסית לקבוצתו בדרום ת"א שווה לתלמיד שהגיע לציון גבוה בצפונה, אף שהציון הגולמי שלהם יהיה שונה. השוואת ממוצע הכיתה יוכל להתאים את ציוני התלמידים למדד אחיד ולהשוותם בנטרול התנאים המגבילים, ויש בזה משום צדק חברתי. דוגמה נוספת: סטודנטים רבים בוחרים קורסים אצל מרצים מסוימים, לא לפי טיב ההרצאה אלא לפי הציונים שאותו מרצה נותן. שוויון בממוצעים בין מרצים שונים ינטרל גורם זה, ויבטל את ההבדלים בין מבחנים קשים וקלים או מרצים מחמירים ומקלים. ד. טרנספורמציה להתפלגות נורמאלית: אם הציונים הגולמיים אינם מתפלגים נורמאלית )התפלגות עם זנב ימני או שמאלי( ניתן להעבירם להתפלגות נורמאלית, למשל, על-ידי לקיחת הפרסנטילים שלהם כציונים )ניתן לעשות זאת בקלות בעזרת הפונקציה Percentile או Percentrank של.EXCEL( הפרסנטיל הוא המיקום באחוזים של כל סטודנט בקבוצה. הממוצע של ציונים אלו יהיה קרוב ל- 50. ניתן כמובן להמשיך ולהעביר ציונים אלו לכל ממוצע התפלגות רצוי בשיטה המתוארת קודם לכן. ה. טרנספורמציה למצבים "קטסטרופאליים": ישנן נוסחאות שונות ל"הצלת מבחן" אשר רבים מהכיתה נכשלו בו )התפלגות לא נורמאלית עם זנב שמאלי(. למשל לפי הנוסחה "שורש ריבועי כפול 10". במצב זה מי שקיבל 100, ימשיך לקבל 100, ומי שקיבל ציון 36 יקבל ציון עובר - 60. טרנספורמציה זו מטיבה מאד עם החלשים ואינה גורעת מהחזקים. ו. ניכוי פריטי מבחן: במבחן אמריקאי ניתן לנכות פריטים שרוב התלמידים בכיתה לא ענו נכון, לפני חישוב הציון הסופי. ניתן לבדוק מה אחוז העונים נכון לכל שאלה. אם למשל ישנם 4 תשובות לכל פריט, ורק כ- 25% ומטה מהכיתה ענו נכון לשאלה מסוימת, יש להניח שהסטודנטים ענו לשאלה זו באופן אקראי. שאלה זו לא מבחינה בין הטובים יותר והפחות טובים, ולכן ניתן להורידה מחישוב הציון. באותו אופן, שאלה שכל התלמידים בכיתה ענו עליה נכון, אף היא אינה מבחינה וניתן להורידה. כמו-כן, ניתן להשתמש במבחן מהימנות )Reliability( עם אופציה של הורדת הפריטים המפחיתים מהימנות Deleted( )Alpha if על מנת להוריד פריטי מבחן שאינם שייכים ל"עולם התוכן" של השאלון, אולם אין זה קריטי במבחן רגיל, היות ו"העיוות" כתוצאה של פריטים שאינם תורמים למבחן הוא זהה לכל הנבדקים. מאחר והתשובות למבחן אינן בהכרח אפילו בסולם אורדינלי, לא ניתן לחשב מהימנות על התשובות הגולמיות אלא יהיה צורך להעביר כל תשובה למדד דיכוטומי של 1 או 0 )נכון או לא נכון(. על
מדדים אלו ניתן לבצע מהימנות, אף שהם בסולם נומינלי, כי מבחינה חישובית, לסולם נומינלי דיכוטומי )בעל שני ערכים( ניתן להתייחס כאילו הוא סולם רציונאלי, שכן לא קיים ערך שלישי לפריט המאפשר לבחון את סולם המדידה. )לו היה ערך שלישי ניתן היה לקבוע את סולם המדידה: אם המרחקים שווים בין הערכים סולם המדידה אינטרוולי, אם לא - הסולם אורדינלי, וכדומה(. לפיכך ניתן לחשב מתאמי פירסון על פריטים דיכוטומיים אלו, ולבדוק את מהימנות שאלון המבחן. ניתן לבדוק אם מבחן מסוים כולל שאלות השייכות לאותו עולם תוכן, או לעולמות תוכן שונים, בעזרת תוכנת ניתוח גורמים Analysis(.)Factor למשל, במבחן מתמטיקה, יתכן וחלק מהשאלות בודקות ידע באלגברה, חלק בגיאומטריה וחלק בסטטיסטיקה. ניתן לחלק ולתת לכל סטודנט ציון נפרד בכל גורם, ולהחליט על משקלות שונים בחישוב הציון הסופי. גם מבחן זה ייעשה על הפריטים המחושבים כנכון או לא נכון )1 או 0( על-פי תשובות הנבחנים. מכל האמור לעיל, נראה שבכל מקרה כדאי לתת מבחן קצת יותר קשה מאשר מבחן קל מדי. קל יותר להסביר לסטודנט תוספת )בונוס( לציון המקורי מאשר להסביר הפחתת ציון. ההסבר שהציון המקורי אינו משמעותי כלל, והמיקום הקבוצתי קובע, אינו עומד בפני טיעונים רגשיים של קיפוח. ממוצע ציונים גבוה מדי גרוע ממש כמו ממוצע ציונים נמוך מדי, מפני שאפקט התקרה )או הרצפה( חסם עליון )100 בדרך כלל( או תחתון, אינם מאפשרים התפלגות נורמאלית של הציונים עם סטיית תקן סבירה. התפלגות נורמאלית וסטיית תקן סבירה חיונית לכל מבחן המתיימר באמת להבחין בין הסטודנטים. יש להסתייג ולא לבצע טרנספורמציה המסתמכת על המיקום הקבוצתי כאשר ישנם מעט מדי נבחנים בקבוצה, כמו במבחני מועד ב'. אולם אם המבחן במועד ב' דומה מאוד במתכונתו ורמת הקושי שלו למבחן במועד א' ניתן להסתמך על מדגם הסטודנטים שבמועד א' לגבי קביעת הציון במועד ב' על-ידי עירוב ציוני שני המבחנים יחד וקביעת הציון על-פי המיקום של הסטודנט בקבוצה. תיאור תוכנית מחשב לחישובים הנ"ל: אף כי ניתן בקלות לכתוב תוכנית מחשב לחישובי הטרנספורמציות הנ"ל בשפה סטטיסטית כמו SAS או,SPSS המשתמש בהם למטרות אלו דומה למי שהורג זבוב בתותח במקום במחבט, מה גם שחסרה לשפות אלו אינטראקטיביות אמיתית. טבעי ביותר לכתוב תוכנית בגיליון אלקטרוני כל שהוא, כמו.EXCEL נתקתק את הנתונים כמטריצה סטטיסטית רגילה של נבדקים*משתנים, כלומר, נבדקים בשורות, והתשובות למבחן )אם זה מבחן אמריקאי( בעמודות. ראה דוגמה לבדיקת וחישוב ציונים של מבחן אמריקאי וטרנספורמציה של הציונים. בדוגמה, בגיליון בשם "תשובות של תלמידים" ישנם 25 פריטים למבחן, ו- 40 נבדקים. בטור A נתקתק את מספר הזיהוי או מספר המחברת של כל הסטודנטים, ומטור C והילך - את תשובות הנבחנים לכל פריט. יש להשאיר שורות ראשונות לכותרות שונות. השורה שלפני הנבחן הראשון )שורה 3 בדוגמה( תכיל את התשובות הנכונות לפי הסדר. בהמשך הטורים )מטור AC והילך, תלוי במספר פריטי המבחן, או בגיליון נפרד. בדוגמה - גיליון בשם "סיכום וציור"( נכין מטריצה נוספת כשבטורים משתנים לוגיים מחושבים המקבילים לפריטי המבחן, אשר ערכם המחושב יהיה 1 או 0 )נכון או לא נכון( לנבדקים השונים. ניתן לעשות זאת בפשטות על-ידי הצבת הפונקציה הלוגית IF בשורת הנבדק הראשון בטור של הפריט הלוגי הראשון )בתא B3 בדוגמה(: =IF(C4=C$3,1,0( כאשר, בשורה 3 נמצאים התשובות הנכונות ומשורה 4 והילך התשובות של הנבחן הראשון. הפונקציה IF מקבלת 3 פרמטרים הביטוי הלוגי, הערך שיוצב במקרה והביטוי הלוגי אמת, והערך שיוצב במקרה
והביטוי הלוגי שקר. הערך של הביטוי הלוגי הנ"ל יהיה 1 אם התשובה הראשונה של הנבדק הראשון זהה לתשובה הנכונה של המבחן, ו- 0 אם לא. בדוגמה המצורפת כאן הביטוי מסובך מעט היות והתשובות נמצאות בגיליון אחר )בשם "תשובות של תלמידים"( ויש לציינו בנוסחה: תשובות של')) IF = תשובות של'= C4!'תלמידים ( C$3),1,0!'תלמידים ה-$ לפני הספרה 3 מקבע שורה זו כך שלא תשתנה בהעתקה. תא זה )B3( יועתק לכל הטורים בהמשך )המקבילים לפריטים( ולכל השורות )הנבדקים( כך שהמטריצה תתמלא בערכים של 1 או 0. בהמשך, מתחת לכל הטורים במטריצה הנ"ל נסכם כל טור )פונקציה,)Sum ונחשב אחוזים )שורה -47 48 בדוגמה( וכך נדע כמה ענו נכון לכל שאלה. נוכל להוריד מהחישוב הסופי שאלות לא מייצגות, כגון, אלו ש- 30% ומטה מהנבחנים ענו נכון )לגבי מבחן בו לכל פריט 4 תשובות אפשריות( או שכל הכיתה ענתה נכון )פריטים 6 2, ו- 15 בדוגמה(. בטור נוסף מימין )טור AA בדוגמה ), נסכם את כל שורות התשובות, ובטור הבא )AB( נעביר לציון באחוזים. )כרגיל בגיליון אלקטרוני, מספיק להציב נוסחא במשבצת אחת ולהעתיקה לכל שאר התאים בטור(. בטור נוסף נחלק מספר זה במספר השאלות ונכפיל ב- 100, וזהו הציון הגולמי. בתא בתחתית הטור של הציון הגולמי נחשב את הממוצע הכיתתי )פונקציה Average( ותחתיו את סטית-התקן )פונקציה.Stdevp( בטור הבא )AC( נחשב את ציון התקן של כל סטודנט: הציון פחות הממוצע חלקי סטיית התקן )בדוגמה בתאים AB44 ו- AB45 ( =(AB3-$AB$44)/$AB$45 במקום הנוסחה הזו ניתן להשתמש כתחליף בפונקציה Standardize ולספק לה כפרמטרים את התאים המכילים את הציון של הנבדק, הממוצע הכיתתי וסטיית התקן. לא לשכוח את סימן ה-$ לפני השורה המציינת את הממוצע וסטיית-התקן וזאת על-מנת לקבע את התא כך שבעת העתקת הציון לנבדקים האחרים לאורך הטור, לא ישתנה המיקום של הממוצע וסטיית-התקן. בטור האחרון )בדוגמה AD, בשם "בונוס"( נציב את נוסחת התיקון לטרנספורמציה בהנחה של התפלגות נורמאלית )סעיף ג לעיל(. בדוגמה נדרש ממוצע 78 וסטית תקן 10. AC3*10+78 התוצאה אינה מדויקת היות והגבלנו את הציון המקסימאלי האפשרי ל- 100 כך שהוא יישאר ולא יקבל את הבונוס. הנוסחה המגבילה בדוגמה תיראה כך: =IF((AC3*10+78)<=100,AC3*10+78,100) אם יש חלק נוסף למבחן, כמו שאלות פתוחות, ניתן לתת ציון לחלק זה בטור נפרד, ולהקציב טור נוסף לחישוב ממוצע של שני החלקים בשקלול הרצוי )50% לכל חלק, או 40% ו- 60% וכדומה(. ניתן להוסיף בטור נפרד ציון על תרגילים אם היו בקורס, ולשקלל אף אותו. אם המבחן אינו בסגנון אמריקאי, ניתן פשוט לתקתק את הציון בטור הציון הגולמי, או את חלקי הנקודות של פריטי המבחן, ולסכמם לטור הציון הגולמי לכל נבדק.
אם נבחר בטרנספורמציה למצבים "קטסטרופאליים" )סעיף ה' לעיל(, ובטור AB נמצאים הציונים הגולמיים, נתקתק בטור AD בדוגמה הנ"ל: =100*AB3^.5 ונעתיק זאת לשאר השורות בטור. )הסימן ^ מציין חזקה, ולכן 0.5^ הוא למעשה הוצאת שורש. נוכל כמובן להשתמש בפונקציה.)Sqrt ניתן להשתמש בכל טרנספורמציה אחרת הנראית לנו, או בשילוב ממוצע משוקלל של כמה סוגי טרנספורמציות. המטרה הסופית היא להביא את הציונים להתפלגות נורמאלית בה מספר מסוים )נמוך( של נכשלים ומספר דומה של ציון 100 )ומעלה(. תזוזת הממוצע המבוקש למעלה או למטה תעזור לנו להפחית את מספר הנכשלים או את הציונים שמעל 100. כל טרנספורמציה המתקרבת להתפלגות נורמאלית היא לגיטימית בתנאי, כמובן, שסדר הציונים נשמר. ניתן לבדוק התפלגות סימטרית/נורמאלית של משתנה על-ידי פונקציה מתאימה )כמו )Skew או אף לשרטט גרף התפלגויות. הדבר קל מאד לביצוע בגיליונות אלקטרוניים כמו.EXCEL היתרון הגדול של שימוש בגיליון אלקטרוני ולא בתוכנה סטטיסטית הוא הדינאמיות של הפונקציות המאפשרות בדרך של ניסוי ותהייה לקבל התפלגות רצויה ומספר מסוים של ציונים חריגים )נכשלים או מאיות(. )הדוגמה בקובץ Excel בשם )Tziunim