האוניברסיטה הפתוחה המחלקה למתמטיקה ולמדעי המחשב החטיבה למדעי המחשב פרויקט מתקדם במדעי המחשב פיתוח תוכנה להגהת ספר תורה מנחה: ד"ר מיריי אביגל מגיש: מאי

גודל: px
התחל להופיע מהדף:

Download "האוניברסיטה הפתוחה המחלקה למתמטיקה ולמדעי המחשב החטיבה למדעי המחשב פרויקט מתקדם במדעי המחשב פיתוח תוכנה להגהת ספר תורה מנחה: ד"ר מיריי אביגל מגיש: מאי"

תמליל

1 האוניברסיטה הפתוחה המחלקה למתמטיקה ולמדעי המחשב החטיבה למדעי המחשב פרויקט מתקדם במדעי המחשב פיתוח תוכנה להגהת ספר תורה מנחה: ד"ר מיריי אביגל מגיש: מאיר גוטמן ת.ז פברואר 2018 ]הקלד טקסט[

2 ]טסקט דלקה[ םיניינע ןכות 1 ריצקת אובמ עקר יתואיצמ עקר יגולונכט הנבמ 5...הדובעה 3 תרימש ינותנ רפס הרותה ינותנ רפס הרות תרימש םינותנה םיצבקב תרימש םינותנה ןורכיזב 6...תינכותה 3.4 דוביע הנומת ךרוצל יוהיז םיוות תוכיא הנומתה 8... הבושח 3.5 תולועפ דוביע 8... הנומתה תאיצמ ףסה )Threshold( לש 8...עבצה רושיי הנומתה ץוליח... םיוותה םירגתא ץוליחב 12...םיוות 4.2 יבלש ץוליח 12...םיוותה תאיצמ תורושה תאיצמ םיחוורה תאיצמ 15...םיוותה 5 תדימל... םיוותה ךילהת יוהיז םיוותה רבעמ הנומתל תב האוושה תריצי תנומת ות 21...תדפורמ תריצי הנומת תיפוס תב האוושה 5.3 תלועפ תשר 23...םינוריונה 6...ההגה יוהיז םיוות םיפסונ וא םירסח יוהיז םיחוור יוהיז םיוותה ףוסיא הקיטסיטטסה תואצות תואצות תהגה הדומע תואצות תהגה הדומע ח"ודב ילולימ תואצות תהגה הדומע הנומתב חותינ ינושאר לש תואצותה 7.3 חותינ ףסונ לש תויועטה תהגה הדומע םע 2 תויועט תהגה הנומת םע תויועט ח"וד ילולימ ידדמ החלצה תהגה הדומע םע תויועט הגוצת תיפרג 32...

3 תוצאות של עמודות נוספות להמשך ומבט סיכום 8 ביבליוגרפיה א' נספח ב' נספח רשימת איורים איור 1: צילום עמודה ראשונה משני ספרי תורה... 2 איור 2: תרשים זרימה של לימוד והגהה... 4 איור 3: קטע מקובץ הטקסט עם תווים...,p,s k 6 איור 4: מבנה הנתונים של ספר התורה... 7 איור 5: אלגוריתם מציאת סף האפור... 9 איור 6: אפור מול שחור-לבן איור 7: פונקציה למציאת מפל בין השורות איור 8: אלגוריתם ליישור תמונה איור 9: תמונה לפני ואחרי יישור איור 10: אלגוריתם מציאת השורות איור 11: אלגוריתם למציאת הרווחים, ומציאת הרווח המינימאלי בין המילים איור 12: סימון שורות ורווחים איור 13: המילה הוא בGrid איור 14: פונקציית סמן את הנקודה איור 15: פונקציית סמן את כל הנקודות הקשירות איור 16: פונקציית האם החלק הקשיר החדש הוא תו חדש איור 17: אלגוריתם הוצאת תמונת התו מתמונת המילה איור 18: סימון התווים והמילים איור 19: אותיות ר ות מתוחות אופקית איור 20: תרשים זרימה המרה לתמונה בת השוואה איור 21: מבנה רשת נוירונים איור 22: תוצאה גרפית של הגהת עמודה איור 23: תוצאת הגהת עמודה 2 עם 2 טעויות שתולות איור 24: תוצאת הגהת עמודה איור 25: תוצאת הגהה לעמודה איור 26: תמונות תווים מקוריים וברי השוואה איור : 27 דוגמת פרופיל לספר תורה ]הקלד טקסט[

4 1 תקציר במסגרת פרויקט זה פותחה תוכנה שמטרתה לאפשר הגהה ממוחשבת לספר תורה. התוכנה יודעת "ללמוד" את הכתב מתוך צילומים של ספר תורה שמסופקים ע"י המשתמש, ולהגיה צילומים האחרים של אותו כתב יד. בשלב ראשון התוכנה מנתחת את צילום העמודה מפרקת את הצילום הגדול לתמונות קטנות של תווים המשויכות למילים, ולאחר מכן בונה רשת נוירונים מלאכותית learning( )machine מתוך הצילומים עבור זיהוי התווים. תפקיד רשת הנוירונים הוא לקבל כקלט תמונת תו ולהוציא כפלט את התו )טקסט(. רשת הנוירונים נשמרת כקובץ. בשלב שני מקבלת התוכנה תמונת עמודה אחרת כלשהי מספר התורה ושוב מפרקת את התמונה של העמודה לתמונות קטנות של תווים המשויכות למילים. התוכנה בודקת את העמודה ומבצעת הגהה. התוכנה בודקת את נכונות המילים התווים והרווחים בצילום העמודה, ומוציאה דו"ח על הטעויות שנמצאו בעמודה. שלב זה מורץ על כל עמודה חדשה של אותו סופר. התוכנה הצליחה להגיע להישג נאה של זיהוי תווים בשיעור של למעלה מ 99% בעמודות מסוימות, אך עוד יש כברת דרך לעבור אם ברצוננו להגיע למוצר איכותי דיו. בפרק המבוא אתאר את הרקע המציאותי של הבעיה אותה אנחנו מנסים לפתור )מהו ספר תורה וכיצד הוא נכתב(, ולאחר מכן אסביר את הרקע הטכנולוגי לבחירה שעשיתי ברשת נוירונים מלאכותית כדי לממש את זיהוי התווים. במבוא נתאר גם אילו רכיבי תוכנה הייתי חייב לפתח כדי להגיע למערכת עובדת. 2 מבוא 2.1 רקע מציאותי ספר תורה הוא החפץ המקודש ביותר ביהדות. ישנם כללים )הלכות( מאוד ברורים ונוקשים לגבי שמירתו של הספר, החומרים שמהם עשוי הספר )קלף מעור מסוים, דיו מסוג מסוים( וגם לגבי אופן כתיבתו. הכתב חייב להיות כתב יד, והסופר צריך להיות מודע למטרת הכתיבה. כל התווים ורק התווים חייבים להיות כתובים בספר כלומר אם יש אות מיותרת או חסרה הספר נפסל. אם אות 1

5 כלשהי מאבדת את צורתה הספר נפסל. לתווים ישנה צורה מוגדרת היטב, אם כי יש הבדלים בין מסורות העדות השונות לגבי צורת הכתב. התורה מחולקת לקטעים המכונים פרשיות, ובין הפרשיות יש שני סוגי רווחים: רווח עד סוף השורה )לפני פרשיה פתוחה( ורווח בן 9 תווים )לפני פרשיה סתומה(. גם התווים וגם הרווחים ממוספרים ושמורים ע"פ המסורת ואין לחרוג מהן. על מנת להמחיש על מה מדובר צירפתי תמונות של העמודה הראשונה משני ספרי תורה שונים למדיי )איור 1(. איור 1: צילום עמודה ראשונה משני ספרי תורה מטרת התוכנה היא איפה לקבל צילום של עמודה כלשהי בספר תורה ולהוציא דו"ח שמפרט טעויות שנמצאו בעמודה זו. התוכנה אמורה לשמש כלי עזר לסופר סת"ם )כך מכונה הלבלר הכותב ספרי תורה(, וגבאי בתי הכנסת הדואגים לאחזקת ושימור הספרים, שיוכלו להגיה את ספרי התורה בצורה ממוחשבת. קיימות מספר תוכנות מסחריות שמספקות פתרון של הגהה ממוחשבת, אך כולן נסחרות והקוד איננו פתוח. 2

6 2.2 רקע טכנולוגי על מנת להגיע לזיהוי הטעויות בספר התורה, צריך תוכנה לקרא ספר תורה, ויודעת למצוא את הבעיות. שיודעת מה צריך להיות כתוב, שיודעת על מנת לדעת מה צריך להיות כתוב צריך לאחסן את נתוני ספר התורה: Data(.)Tora זה הרכיב הראשון. האתגר המרכזי הוא לדעת לקרא לזהות תווים. זיהוי תווים הוא תחום רחב ומורכב במדעי המחשב הנקרא,(Optical Character Recognition) (Wikipedia, 2017) OCR ותת התחום של זיהוי תווי כתב יד recognition( (Wikipedia, 2017))handwriting. את תחום זיהוי התווים חקרתי בסמינריון שהגשתי )גוטמן, 2016(, והפרויקט מיישם חלק מהחקירה התיאורטית. כפי שמתואר בסמינריון על מנת להגיע לזיהוי התווים יש צורך )לפחות( בשלושה שלבים: א. ב. ג. עיבוד מקדים לתמונה pre-processing( )image חילוץ התווים מתוך התמונה extraction( )character סיווג התווים classification(.)feature extraction, ישנם אלגוריתמים שונים שנכתבו וממשיכים להיכתב לזיהוי תווים לכל שלביו. גם בפרויקט הזה ישנו מימוש לשלבים השונים. שלב הסיווג )הכולל את חילוץ המאפיינים( הוא השלב המעניין ביותר, ויש לו קשת רחבה של שיטות ופתרונות. ארחיב מעט בעניין הסיווג הממומש בפרויקט הזה. בשלב הסיווג השתמשתי בשיטת הזיהוי של רשת נוירונים מלאכותית ( Neural Artificial (ANN) )Network שהיא חלק מתחום הלמידה החישובית שהולך וצובר תאוצה בשנים האחרונות. בשיטה זו מלמדים את המערכת )את רשת הנוירונים( בעזרת דוגמאות רבות, ולאחר שלב הלימוד המערכת יודעת לזהות. הרעיון הוא לתת לתוכנה ללמוד מספר קטן יחסית של עמודות מוגהות ידנית לייצר רשת נוירונים )השייכת לסופר או אפילו לספר התורה הזה(, ואז לבצע זיהויים דרך רשת הנוירונים. שיטה זו )ANN( משיגה את התוצאות הטובות ביותר בזיהוי כתב יד בשנים האחרונות. ניתן לראות לדוגמה את התוצאות הטובות העדכניות ביותר art) (state of the באתר (2016 (Benenson, שמציג את הזיהויים על בסיס הנתונים.MNIST לאחר שבחרתי להשתמש בשיטת הזיהוי של רשת נוירונים החלטתי גם להפעיל את הזיהוי לפי פרופיל של סופר. עקרונית אפשר היה גם לזהות תווים כלליים כלומר לייצר פרופיל כללי לכל אות בעזרת דוגמאות רבות מספרי תורה שונים או לייצר פרופיל לפי "סוגי" הכתב לפי מנהגי העדות, פרופיל לכל סוג, אך לצורך זיהוי כללי כזה היה צורך בדוגמאות רבות מספרי תורה שונים וזה לא מעשי לפרויקט ובנוסף לכך ברוב רובם של המקרים ספר תורה נכתב בידי סופר בודד ולפיכך יעיל יותר יהיה ללמוד את הכתב שלו. השימוש בשיטת רשת נוירונים לזיהוי התווים מחייב לחלק את המשימה של הגהת ספר תורה לשני שלבים: 3

7 לימוד התווים - התוכנה מקבלת מהמשתמש מספר עמודים שהיא קוראת ולומדת את הצורה של כל תו בדיקת התווים התוכנה מקבלת מהמשתמש עמוד והיא בודקת שהעמוד תקין.1.2 שני השלבים מתוארים בתרשים הזרימה שבאיור 2. חמשת רכיבי התוכנה: יצירה ואחסון של נתוני ספר התורה Data(,)Tora עיבוד התמונה של עמודת ספר תורה Processing(,)Image חילוץ התווים מהתמונה Extraction(,)Letters לימוד התווים Learning( )Letters והגהה.)Proofreading( כפי שניתן לראות בתרשים הזרימה )איור 2( הפעלת 3 רכיבים משותפת לשני שלבים: יצירה ואחסון של נתוני ספר התורה, עיבוד התמונה וחילוץ התווים מהתמונה. הפעלת הרכיב הרביעי משתנה בהתאם לשלב: בשלב הלימוד הרכיב הרביעי שמופעל הוא לימוד התווים, לעומת זאת בשלב ההגהה במקום הלימוד מופעל רכיב ההגהה שכולל זיהוי תווים והתאמת הזיהוי לבסיס הנתונים של התורה. Start Create Tora Data From Files Insert Tora Page Images (by user) Image Processing Letters Learning Letters Extraxtion End Proofreading איור 2: תרשים זרימהשל לימוד והגהה 4

8 2.2 מבנה העבודה נקדיש פרק לכל אחד מחמשת רכיבי התוכנה: יצירה ואחסון של נתוני ספר התורה Data(,)Tora עיבוד התמונה של עמודת ספר תורה Processing(,)Image חילוץ התווים מהתמונה.)Proofreading( והגהה )Letters Learning( לימוד התווים,)Letters Extraction( בכל פרק נכתוב הסבר ותיאור מפורט של המודול במערכת. לאחר תיאור רכיבי התוכנה נמצא הפרק העוסק בתוצאות שהגענו אליהן. בסיום העבודה מופיע חלק אחרון של סיכום ומבט להמשך שבו נכתוב בראשי פרקים את מה שדרוש עוד להשלמת המלאכה. לעבודה שלשה הנספחים המכילים תמונות. בנספח הראשון תמונות של תווים בודדים שחולצו מתוך תמונת העמוד, בשני תמונת העמוד שהרצנו עליו את ההגהה לדוגמה, ובשלישי דוגמת פרופיל. 2 שמירת נתוני ספר התורה 2.1 נתוני ספר תורה נתוני ספר התורה עצמו כוללים את התווים והרווחים. מעבר לכך יש צורך לשמור כחלק מהנתונים את החומש, הפרק, הפסוק מספר המילה ומספר התו במילה, על מנת לדעת למקם את האזור עליו נעשית הבדיקה או הלימוד, וכן במקרה של דיווח על טעות לדעת לציין את המיקום המדויק של הטעות. כדי שיהיה בסיס להשוואה )כלומר שהתוכנה "תדע" איזה תו אמור להיות המקום בזה(, צריך לשמור בסיס נתונים של כתב הספר כפי שאמור להיות. ישנה בעיה להשיג את התווים והרווחים כפי שהם מצויים בספר התורה מכיוון שהנוסח שמצוי ברוב החומשים ובספרים הרגילים אינו מתאים. יש מקומות לא מעטים של הבדל בין הקרי )איך שהמילה בתורה נקראת( לכתיב, וברוב החומשים מצוי נוסח הקרי, בעוד שאותנו )את תוכנת ההגהה( מעניין נוסח הכתיב. הנוסח כולל את האותיות והמילים ע"פ נוסח המסורה המדויק של הכתב, כולל מספר תווים מיוחדים שעל פי המסורת צריך לעשותם גדולים וקטנים, כולל רווחים בין המילים בסופי פרשיות )פרשיה פתוחה וסתומה( ובסופי החומשים. 2.2 שמירת הנתונים בקבצים באתר: של מכון ממרא מוצג ספר התורה לפי כתיב המסורה כולל הפרשיות, הפרשות והתווים המיוחדים. מהאתר הורדתי 5 קבצים, קובץ לכל חומש. את הקבצים עיבדתי "ידנית" כך שהקובץ יכיל את כל הנתונים ורק את הנתונים שרציתי. קיבלתי 5 קבצי טקסט עם סימנים מיוחדים לרווחים שונים ותווים גדולים וזעירים. בקובץ יש לכל פסוק בתחילתו את שם הפרק והפסוק לאחר מכן יבואו המילים שבפסוק. מלבד תווי המילים ומקש הרווח ישנם תווים מיוחדים של,p s לציון רווח של פרשיה פתוחה או סתומה,,k g לתווים גדולים או זעירים )איור.)3 5

9 ב< ב< ב< ב< ג< ג< B< B< עשה B< לעשות p,א>/ B <ויכלו השמים והארץ וכל צבאם,ב>/ B <ויכל אלהים ביום השביעי מלאכתו אשר עשה וישבת ביום השביעי מכל מלאכתו אשר,ג>/ B <ויברך אלהים את יום השביעי ויקדש אתו כי בו שבת מכל מלאכתו אשר ברא אלהים,ד>/ B <אלה תולדות השמים והארץ בkהבראם ביום עשות יהוה אלהים ארץ ושמים,טו>/ B <ואיבה אשית בינך ובין האשה ובין זרעך ובין זרעה הוא ישופך ראש ואתה תשופנו s B<... B< עקב,טז>/ B <אל ארבה הרבה אמר האשה עצבונך אישך ואל בנים תלדי בעצב והרנך תשוקתך B< והוא ימשל בך s איור 2: קטע מקובץ הטקסט עם תווים,P,S K 2.2 שמירת הנתונים בזיכרון התוכנית ע"פ המקובל היום מבנה הטקסט המקראי הוא כדלהלן: התורה מחולקת ל 5 חומשים, החומש מתחלק לפרקים )לא מספר קבוע בכל חומש(, הפרקים לפסוקים, הפסוקים למילים והמילים לתווים. וכך בניתי את המחלקה ToraData את האובייקטים הבאים שייצגו את הכתב כמו שהוא אמור להיות: ToraData, HumashData, Perek, Pasuk, Word, ToraCharacter, ToraSpace ואת האובייקט שקורא את הקבצים: HumashMamreFileReader המבנה מתואר בתרשים שבאיור 4 השלב הראשון בהפעלת התוכנה הוא טעינת הנתונים מהקבצים המוכנים מראש לתוך מבני הנתונים, כך ש- ToraData מכיל מערך של חמישה חומשים,)HumashData( שכל אחד מהחומשים מכיל מערך של פרקים, שכל פרק מכיל מערך של פסוקים,)Pasuk( כשכל אחד מהפסוקים מכיל מערך של מילים,)Word( ולכל מילה מערך של העצמים הבסיסיים ביותר: תווים ורווחים. התווים והרווחים מממשים interface של.ToraItem בודדת )ו 15 מאיות( בלבד. קריאת כל הנתונים לזיכרון מהקבצים מתבצעת תוך שניה 6

10 1..1 -End2 ToraData -End1 1 HumashMachonMamreFileReader 1 1..* -End1 -End2 HumashData 1 -End1 1..* -End2 Perek 1 -End1 1..* Pasuk -End2 1 -End1 1..* Word -End2 1..* -End2 ToraItem 1 -End1 ToraCharacter ToraSpace איור 4: מבנה הנתונים של ספר התורה עיבוד התמונה 2.3 עיבוד תמונה לצורך זיהוי תווים כדי לזהות את התווים צריך להוציא את התווים מתמונת עמודת ספר התורה. בדרך כלל לפני חילוץ התווים נעשית עבודה מסיבית של עיבוד תמונה הבאה להוריד כמה שיותר רעשים וכתמים, ולחדד את אזורי התווים. במקרה שלנו ניקוי הרעשים נעשה בצורה מינימאלית מאוד, מכיוון שמטרת התוכנה 7

11 היא לזהות שגיאות ובעיות וגם לכלוכים )כתמי דיו או אותיות שבורות( הן בעיות שיש צורך להתריע עליהן. התוכנה עושה פעולת ניקיון של פילטור נקודות בודדות )נקודות שחורות בודדות שמוקפות בלבן( מכיוון זהו רעש שלא נחשב אפילו כלכלוך. שתי הפעולות המשמעותיות של עיבוד התמונה הן: א. ב. )במקרה של תמונה באפור( מציאת ה- Threshold והפיכת התמונה לבינארית סיבוב התמונה )אם התמונה לא ישרה זה יגרום לשיבוש בלימוד \ זיהוי התווים( שלב עיבוד התמונה כולל את קריאת הקובץ המקורי והפיכתו לתמונה בינארית המוכנה לקראת חילוץ התווים איכות התמונה חשובה כאן המקום לציין שאיכות הצילום משפיעה מאוד על התוצאות. במיוחד במקרה שלנו לדוגמה אם יש חיבור כלשהו בין שני תווים סמוכים זו בעיה חמורה הפוסלת את הספר, ואם הצילום לא חד מספיק נוצרים חיבורים בין תווים סמוכים, או מקרים הפוכים בו מזהים הפרדה בין שני חלקי תו שמחוברים בחבור דק שלפעמים מיטשטש בתמונה שאינה חדה. לצלם ספר תורה בצורה טובה ומקצועית זה לא קל בשל גודל העמודה והצורך לשמור אותה ללא קיפולים וחלקה יש לצורך זה סורקים מיוחדים. כמובן שאפשר להשתמש גם במצלמות רגילות רק שהאיכות לא תהיה גבוהה. 2.3 פעולות עיבוד התמונה מציאת הסף )Threshold( של הצבע כל פיקסל בתמונה מבחינתנו הוא או שחור או לבן, ובמקרים רבים התמונה שמוכנסת כקלט היא צבעונית או אפורה. המטרה הראשונית היא להפוך את התמונה לבינארית. להפוך תמונה צבעונית לגווני אפור אנחנו משתמשים בפונקציה סטנדרטית. הבעיה היא מציאת הסף של גוון האפור שמעליו נחשב שחור ומתחתיו אפור. הבעיה פה אינה פשוטה מכיוון שהסף תלוי באיכות הצילום ובתאורה בעת הצילום. לאחר ניסיונות רבים ולא מוצלחים למצוא את הסף הנכון לפי היסטוגרמת הגוונים )סופרים כמה נקודות יש לכל גוון ולפי ההתפלגות מנסים לאתר את הסף(, הגעתי לאלגוריתם כבד במיוחד )איור 5(. האלגוריתם מקבל תמונת עמודה ומוציא את הסף - הגוון האפור )מספר בין 0 ל 255 ( הטוב ביותר. 8

12 ניחוש ראשוני: צור היסטוגרמת גוונים 3 אינדקסים 3 אינדקסים סמוכים בהיסטוגרמה )מחברים מצא את המפל הגדול ביותר בין כל ומשווים ל- 3 שלידם וכך הלאה(. מצא את הנקודה שבה מתחילים מפסיקים לרדת ערכי ההיסטוגרמה מהשיא. חשב את ממוצע שתי הנקודות זהו הסף הנוכחי. קח את התמונה המבוקשת הפוך אותה לבינארית ע"פ הסף הנוכחי הפעל את חילוץ התווים. תחילת לולאה: מצא את סכום הטעויות של מספר תווים נמוך מדיי במילה ובנפרד את סכום הטעויות של מספר i. תווים גבוה מידיי. אם לא נמצאו טעויות הכנס את הסף הנוכחי למשתנה הסף הטוב ביותר וצא מהלולאה..ii אם מספר הטעויות הנוכחי הוא הנמוך ביותר עד עכשיו הכנס את הסף הנוכחי למשתנה הסף.iii הטוב ביותר..iv אם יש יותר טעויות של מספר תווים נמוך העלה את הסף הנוכחי, אחרת הורד את הסף הנוכחי. במידה ואין סף עליון /תחתון שמור אותם, במידה ויש העלה /הורד את הסף לערך שבין הסף הנוכחי לגבול. עדכן גבול מתאים. אם הסף הנוכחי והגבול צמודים צא מהלולאה..I.II.III.IV.V.VI חזור לתחילת הלולאה..VII החזר את הסף הטוב ביותר איור 3: אלגוריתם מציאת סף האפור מדובר אם כן בפעולה כבדה מאוד. על כל ניסיון אנחנו מעבדים מחדש את העמוד וסופרים טעויות מסוג תווים מחוברים או תווים מנותקים. אם יש תווים מחוברים רבים אנחנו מעלים את הסף אחרת אם יש תווים מנותקים אנחנו מורידים את הסף. ושוב חוזרים על הפעולה עד שנמצא הסף עם מספר הטעויות הנמוך ביותר. אם ידוע ששאר הצילומים דומים באיכותם ניתן ורצוי לשמור את הסף בפרופיל המשתמש )ראה נספח ג(. יש גם שמירה על קובץ נתונים נפרד של הסף לפי שם עמודה כדי שבריצה הבאה על העמודה הזו לא נחשב מחדש. להלן )איור 6( דוגמה של התוצאה. אפור בינארי 9

13 איור 6: אפור מול שחור-לבן יישור התמונה חשוב מאוד שהתמונה תהיה מיושרת, כדי שהזיהוי והלימוד יהיה על תווים באותה זווית. לשם כך בניתי מנגנון ליישור תמונה. הפעלת המנגנון )שהוא כבד ולוקח זמן( תלויה בפרמטר בפרופיל )נספח ג( ואפשר לנטרל את הפעלתו: המנגנון משתמש בתהליך )פונקציה( למציאת "מפל" בין שורות )איור 7(. מפל הכוונה להפרש )בערך מוחלט( בין מספר הנקודות השחורות בין שתי שורות סמוכות. ההנחה היא שבמצב אופקי ההפרשים יהיו הגדולים ביותר היות והמעבר בין שורת הפיקסלים בתחילת שורה של אותיות לשורת הפיקסלים שלפניה הוא החד ביותר. )כך גם לגבי סוף השורה רק ששם יש הרבה פחות פיקסלים בגלל מבנה האותיות.( האלגוריתם מתואר גם בעבודת הסמינריון שלי )גוטמן, 2016(. מצא את סכום הפיקסלים השחורים בכל שורת פיקסלים בתמונה. )התעלם משורות שחורות לגמרי.( והכנס למערך. חשב את ההפרש בין כל שתי שורות )בערך מוחלט(, וסכום את התוצאות הגבוהות ביותר. מספר התוצאות הגבוהות לפי מספר השורות בעמודה. )בעמודה סטנדרטית 42 שורות אז סכום 42 תוצאות.( החזר את סכום ההפרשים..i.ii.iii איור 7: פונקציה למציאת מפל בין השורות באיור 8 ניתן לראות אלגוריתם ליישור תמונה: 10

14 קרא את תמונת העמודה מצא מפל נוכחי, ושמור ערך וזווית. הכנס ערך למפל הגבוה. Java לייצור תמונה AWT של 0.25 מעלות )השתמש בספריית של סובב את התמונה בזווית של מסובבת(. מצא מפל נוכחי סמן שינוי לנגד כוון שעון השווה אם מפל נוכחי גבוה יותר שמור מפל וזווית וסמן שינוי ל בכוון השעון, הכנס ערך למפל הגבוה לולאה כל עוד לא נמצאה זווית הנכונה ביותר אם אנחנו בכוון השעון העלה את הזווית בעוד 0.25, אחרת הורד 0.25 i. סובב תמונה בזווית הנוכחית )צור תמונה מסובבת(.ii מצא מפל נוכחי.iii בדוק אם המפל הנוכחי קטן מהמפל הגדול ביותר צא מהלולאה.iv החזר תמונה מיושרת.I.II.III.IV.V.VI.VII.VIII איור 8: אלגוריתם ליישור תמונה להלן )איור 9( דוגמה של קטע עמודה לפני ואחרי יישור. תמונה מקורית )לפני יישור( תמונה מיושרת איור 9: תמונה לפני ואחרי יישור 11

15 3 חילוץ התווים 3.1 אתגרים בחילוץ תווים ישנו תחום באבטחת מידע הנקרא Completely Automated Public ( CAPTCHA,)Turing test to tell Computers and Humans Apart כלומר מבחן האם מחשב או אדם מנסים להיכנס לתוכנה. כפי שציינתי בסמינריון )גוטמן, 2016(, אחד המימושים הנפוצים לCAPTCHA הוא הצגה של מספר תווים בכתב יד ודרישת זיהוי לכתב היד. הנחת המבחן היא שיש למחשב בעיה )שטרם נפתרה( בזיהוי כתב יד. הבעיה העיקרית שיש למחשב בזיהוי כתב יד כיום היא בחילוץ התווים )בזיהוי התווים עצמם האלגוריתמים המשוכללים מגיעים לרמת דיוק גבוהה מאוד(. בעיית חילוץ התווים קשה במיוחד כשמדובר בכתב עם חפיפה או כתב מחובר, כתב עם רקע משתנה או כשיש עיוותים קלים בתווים. כלומר לעיתים מדובר במשימה קשה ביותר למחשב. למרבה המזל במקרה שלנו אין כתב מחובר )אם יש חיבור זה פוסל את הכתב( אבל ישנה חפיפה בין התווים )כלומר יש אותיות שלמלבן החוסם שלהן נכנסות אותיות אחרות(. הבעיה במקרה כזה היא האם לשייך אזור שחור לתו הקודם או לתו שבא אחריו. צריך לזכור שבאותיות כמו 'ה' ו'ק' ישנן אזורי נקודות נפרדים באותה אות, ומאידך ישנם מקרים של "חפיפה" בין אותיות כמו הרצף של 'ר' ולאחריה 'ב', 'ל' והתו שאחריה. 3.2 שלבי חילוץ התווים כדי לחלץ את התווים מתמונת העמודה יש לזהות את מבנה העמודה הכולל שורות מילים ותווים. השלבים בניתוח התמונה כדי להגיע לחילוץ התווים: לזהות את מבנה השורות של העמודה למצוא את הרווחים בין המילים למצוא את הרווחים בין התווים להפריד בין תווים חופפים ובין תווים מחולקים עתה נפרט איך מבצעים כל שלב מציאת השורות העמודה של ספר התורה בנויה משורות של מילים )לא כל השורות מלאות(. כדי למצוא את התווים ע"פ הסדר השלב הראשון הוא לזהות את השורות. בנוסף מזהה חשוב לתו הוא כמה הוא בולט מעל השורה או מתחת לשורה או בתוכה. גודל התו כדאי שיישמר ביחס לשורה. 12

16 אפשר לנצל את התכונה של ספר התורה שמספר השורות בכל עמודה ידוע מראש. מספר השורות המקובל היום הוא 42, אם כי בעבר היו גם סטנדרטים אחרים )48, 72( ואין מגבלה הלכתית לשנות, אבל מכל מקום זה נתון חשוב שניתן לדרוש מראש ומקל על ניתוח העמוד. בדוגמת הפרופיל )נספח ג( ניתן לראות גם את פרמטר מספר השורות. מכיוון שיש שורות שהן כמעט ריקות קשה מאוד לקבוע את המיקום רק לפי צפיפות הפיקסלים בכל שורה. כאשר ידוע מראש מספר השורות אפשר לחלק את העמוד לפי מספר השורות ובכל אזור שבו אמורה להיות שורה לבדוק את צפיפות הפיקסלים בשורות הפיקסלים ולזהות עליה וירידה בצפיות ולקבוע במדויק את התחלת וסיום השורה. הדבר הכי בטוח ויציב בניתוח העמוד הוא הרווחים שבין השורות המקום בו יש הכי פחות פיקסלים: אלו מרכזי הרווחים שבין השורות. אחרי מציאת הרווחים בין השורות נדע גם את מקום השורות. אלגוריתם למציאת השורות )דרך מציאת הרווחים בין השורות( יש באיור 10. האלגוריתם מקבל תמונת עמודה ומחזיר את תחומי הרווחים שבין השורות. קרא את תמונת העמודה חשב את מספר פיקסלים השחורים בכל שורת פיקסלים מצא את התחלת אזור הכתב בסריקה מלמעלה )עד לקפיצה גדולה ראשונה במספר הפיקסלים השחורים( מצא את סוף אזור הכתב )מסוף העמוד עלה ומצא חריגה ראשונה בעליית מספר פיקסלים( חשב את תחומי השורות המשוערים לפי מספר השורות הידוע לולאה )לכל תחום שורה(.I.II.III.IV.V.v מצא את מרכז הרווח בין השורות הנוכחי מצא את המקסימום המקומי הקרוב בעליה למעלה )תחילת הרווח שהיא סוף השורה שלמעלה( מצא את מקסימום הקרוב בירידה )סוף הרווח שהוא תחילת השורה הבאה( שמור את טווח הרווח.i.ii.iii.iv.VI החזר את רשימת טווחי התחומים בין השורות איור 10: אלגוריתם מציאת השורות מציאת הרווחים אחרי שמצאנו את טווחי השורות )מה שנמצא בין הרווחים(, מטרתנו הבאה היא המילים: 13

17 גם כאן אנחנו מחפשים את הרווחים, ומתוך הרווחים מוצאים את המילים שמסביב לרווחים. בשלב ראשון מוצאים את כלל הרווחים בשורה ואח"כ מוצאים מהם הרווחים בין המילים ומהם הרווחים בין התווים בתוך המילים. האתגר הוא מציאת הרווח המינימאלי בין המילים. מבחינת כללי הכתיבה הרווח אמור להיות לפחות ברוחב התו הקטן ביותר )בדרך כלל האות י(. צריך להבחין בין ריווחי התווים בתוך המילים, לבין הרווחים בין המילים. לשם כך השתמשתי באלגוריתם באיור 11. האלגוריתם מקבל תחום של שורה בתוך העמודה ומחזיר את המרחק של הרווח שממנו ומעלה מדובר ברווח בין המילים. הנחת האלגוריתם שהרווחים בין התווים מסתובבים סביב המקסימום המקומי הראשון של מספר הרווחים, מהמקסימום השני ואילך מדובר ברווחים בין המילים. מסוף השורה עד תחילת השורה בדוק את עמודות הפיקסלים: i. בדוק בתוך השורה אם יש פיקסלים שחורים בעמודת הפיקסלים הנוכחית:.ii אם אין אם אנחנו בתוך רווח הוסף לרווח נוכחי, אחרת התחל רווח.iii אחרת )אם יש פיקסלים( אם היינו ברווח הכנס רווח לרשימה,.iv אחרת אל תעשה כלום. הכנס את רוחבי הרווחים להיסטוגרמה שבה כל עמודה היא רוחב רווח. מצא את המקסימום המקומי השני מתחילת ההיסטוגרמה זהו המינימום לרווח בין המילים..I.II.III איור 11: אלגוריתם למציאת הרווחים, ומציאת הרווח המינימאלי בין המילים ערך הרווח המינימאלי בין המילים חשוב מאוד, והוא נשמר בפרופיל הספר )נספח ג(.. חשוב ביותר ולא הצלחתי למצוא שיטה מדעית טובה יותר. ניתן לערוך גודל זה גם ידנית. הזה הגודל ]אפשר היה להוסיף בדיקות מסביב לערך זה ולראות איזה ערך נותן את הקירוב הטוב ביותר למספר המילים שאמור להיות בטקסט בדומה למה שעשינו באלגוריתם למציאת הסף )איור 5(.[ דוגמה צבעונית בה אפשר לראות התחלת שורה וסוף שורה )קו רוחבי אדום וכחול( רווחים בין מילים בסגול ורווחים בין תווים בצהוב ניתן לראות באיור

18 איור 12: סימון שורות ורווחים מציאת התווים לאחר שקבענו את הרווח בין המילים ניתן לסמן את אזורי המילים בכל שורה. המשימה הבאה היא לפרק כל אזור מילה לתווים בודדים עם תמונה לכל תו. באלגוריתם למציאת התו הבודד מסתמכים הרבה על הקישוריות שיש בין הפיקסלים שבכל תו. הבעייתיות היא בתווים 'ה', 'ק' שם יש חלקי תו שאינם מקושרים. אי אפשר גם לקבוע תיבה מלבנית מסביב לתו ה"שייכת" לתו כי יש מקרים )כשרים הלכתית לגמרי( בהם יש חדירה של תווים לתוך השטח "של" התווים הסמוכים שלאחריה וכיוצא באלה. כמו 'ב' שנכנסת מתחת ל'ר' שלפניה או 'ע' שגולשת מתחת ל'י' הרעיון הוא לעבור על האזורים של תווים )המקומות שבין הרווחים שבמילים(, בכל אזור כזה יש תו אחד לפחות. לעבור על כל גופי הנקודות המקושרות, כאשר בודקים כל גוף נקודות מקושר אם הוא תו עצמאי או שייך לתו הקודם. מגדירים מערך דו ממדי של מספרים )Grid( המטרה היא לסמן במספר סידורי כל פיקסל שלמים שחור בגודל של מלבן הפיקסלים המקיף לפי המספר הסידורי של האות במילה. מילה. בסוף התהליך מוציאים את התווים מהמערך ע"פ המספר הסידורי. לדוגמה באיור 13 אפשר לראות את המילה "הוא" שבה מסומן כל פיקסל שחור ע"פ המספר הסידורי של התו. יש שלשה תווים וכל פיקסל בכל תו מסומן ע"פ המספר הסידורי של התו. האות ה מיוחדת מכיוון שיש לה שני הגופים מקושרים נפרדים ושניהם משויכים לתו הראשון. 15

19 איור 12: המילה הוא בGRID עתה נתאר את תהליך מציאת התווים )תחילה נתאר מספר פונקציות )פרוצדורות( ולבסוף נתאר את הפעלת הפונקציות בתוך האלגוריתם(: הכן מראש מערך דו-ממדי של מספרים בגודל אזור המילה בתמונה נקרא לו. Grid פונקציה: סמן את הנקודה )איור 14( )קלט לפרוצדורה: נקודת (y,p(x, מספר תו במילה; פלט בוליאני חיובי \ שלילי(: בדוק אם קואורדינטות הנקודה נמצאות בשטח התמונה, אם לא החזר שלילי, אם כן: בדוק אם הנקודה צבועה, אם לא החזר שלילי, אם כן: בדוק אם הנקודה מסומנת כבר בGrid אם כן החזר שלילי אם לא: סמן הנקודה בGrid עם מספר התו והחזר חיובי.i.ii.iii.iv איור 13: פונקציית סמן את הנקודה,p(x, y) פונקציה: סמן את כל הנקודות הקשירות )איור 15( )קלט לפרוצדורה: נקודת מספר תו במילה; פלט בוליאני חיובי/שלילי( 16

20 בצע פרוצדורה סמן את הנקודה אם לא הצלחת לסמן את הנקודה החזר שלילי, אחרת: הוסף את הנקודה לסט נקודות חדשות: לולאה כל עוד יש נקודות בסט הנקודות החדשות: i. רוקן את הסט של הנקודות החדשות, ועבור כל נקודה: 1( הפעל פרוצדורת סמן את הנקודה על כל השכנים )קשירות 8( 2( הוסף כל שכן שמצליח "להיסתמן" לסט הנקודות החדשות החזר חיובי.I.II.III.IV.V איור 13: פונקציית סמן את כל הנקודות הקשירות )16 פונקציה: בדוק האם החלק המסומן החדש הוא תו חדש )איור )קלט: מספר הסימון החדש והGrid פלט בוליאני(: אם מספר התו הוא 1 החזר חיובי, אחרת: i. לולאה עבור על עמודות הפיקסלים בתו הנוכחי: 1( ספור כמה נקודות יש בעמודה לבד של התו הקודם, כמה לבד של התו הנוכחי, וכמה משותפות. במידה ויש חפיפה של יותר משני שליש מהעמודות שבהן נמצא החלק החדש או יותר משני שליש חפיפה מהעמודות של התו הישן החזר חיובי.I.II איור 16: פונקציית האם החלק הקשיר החדש הוא תו חדש ולבסוף )איור 17( נראה את האלגוריתם שבו משובצות הפונקציות שתוארו לעיל. בסוף האלגוריתם יהיה בידינו מערך דו ממדי שבו כל הפיקסלים של כל תו מסומנים במספר סידורי לפי המספר הסידורי של התו במילה. 17

21 צור מערך דו ממדי של מספרים שלמים Grid )מאותחל לאפסים( I. חלק את שטח המילה למלבנים החשודים כתווים לפי הרווחים בין התווים:.II עבור כל מלבן החשוד כתו )לולאה(:.III העלה את מונה התווים באחד I. עבור כל נקודה משטח המלבן הנוכחי שבתוך השורה )לולאה(:.II הפעל פרוצדורת סמן את כל הנקודות הקשירות )עם מספר התו הנוכחי(.III אם שלילי המשך בלולאה אחרת: I. הפעל את פרוצדורת בדוק אם החלק המסומן הוא תו חדש,.II אם חיובי העלה את המונה והמשך, אחרת: I. החלק החדש מסופח לתו הקודם )הנקודות החדשות בGrid יורדות בערכן.II לתו הקודם(, והסימון הבא מתחיל במספר שהתחיל הסימון הקודם )אל תעלה את המונה(. איור 17: אלגוריתם הוצאת תמונת התו מתמונת המילה לאחר התהליך מפעילים תהליך שמוציא מה- Grid חפיפה( לתמונה נפרדת. את כל התווים הממוספרים כל תו )גם אם יש באיור 18 ניתן לראות את המילים והתווים מוקפים בתיבה מלבנית )התווים בכחול והמילים בירוק(. ניתן לראות במילה "וירא" שבשורה הראשונה שהתווים ''ו'' ו-"י" נפרדים, למרות שלא היה ביניהם רווח בתמונת הרווחים. 18

22 איור 18: סימון התווים והמילים 3 למידת התווים 3.1 תהליך זיהוי התווים בזיהוי תמונה recognition( )image באופן כללי צריך להחליט מהם המאפיינים המזהים שאותם צריך לשמור, ובאיזו צורה לשמור. כשמדובר על זיהוי )כתב( בעזרת רשת נוירונים מדובר עקרונית בתהליך פשוט שכולל בתוכו את מציאת המאפיינים. מעבירים את תמונת התו המקורית לגודל קבוע לא גדול מדיי, ואז ממפים כל פיקסל בתמונה כנקודת כניסה לרשת הנוירונים. התכונה של התו היא הפיקסלים שלו ורשת הנוירונים מזהה אילו קבוצות פיקסלים חשובות לזיהוי. אם לדוגמה תהיה תמונת תו ברזולוציה של 30X20, יהיו לנו 600 כניסות. הבעייתיות כאן היא איך לא לאבד מידע חשוב בהעברת התמונה לגודל קבוע. לתמונה בגודל הקבוע נקרא תמונה בת השוואה. בהמשך נפרט על תהליך זה. כל פיקסל בתמונה הוא נקודת כניסה לרשת הנוירונים )שכבת הקלט(, במקרה שלנו כל פיקסל יכול להיות 0 או 1. בשלב הלמידה המערכת משנה את הערכים בשכבות הפנימיות של רשת הנוירונים כך שהרשת תדע לזהות. )בשלב הזיהוי מכניסים כל תמונה לרשת ומקבלים זיהוי מיידי.( בכל אופן בשיטה זו צריך להגיע למצב שבו גודל התמונה שנכנסת לרשת הנוירונים ללמידה או לזיהוי יהיה אחיד. בשלב הלמידה אנחנו נותנים לתוכנה מספר עמודות של ספר תורה, כל תמונות התווים מחולצות ואנו יודעים מראש את זיהוי תמונת כל תו )בזכות נתוני הכתב השמורים(. רשת הנוירונים מכיילת את 19

23 הקשרים ולומדת לזהות את התווים )שלב האימון(. כחלק משלב הלמידה ישנו גם שלב הבדיקה )מקצים חלק מהתווים מראש כקבוצת בדיקה ללימוד( לאחר הלמידה הרשת בודקת את עצמה ומראה את אחוז הזיהוי על קבוצת הבדיקה. שלב הלמידה לוקח זמן כ 3 דקות במקרה של 5 עמודות בתמונות ברזולוציה של X הזמן משתנה בהתאם לכמות הנתונים ומבנה רשת הנוירונים. ספציפית בפרויקט הזה יש לזכור כל הזמן שהמטרה היא לזהות טעויות לכן חשוב גם לא לאבד נקודות שהן לא עוזרות לזיהוי... לכן בניגוד לפרויקטים של זיהוי כתב, אי אפשר להגזים בהדגשת השוני על חשבון העלמת בעיות. 3.2 מעבר לתמונה בת השוואה מכיוון שכל תמונת תו שחולצה מתמונה של עמודת ספר התורה יש לה גודל משלה, אנחנו צריכים לבצע תהליך שיעביר את תמונת התו המקורית לתמונה שהיא בת השוואה. התמונה החדשה צריכה לשמור ככל האפשר על המאפיינים של התמונה המקורית אבל כדאי שלא תהיה גדולה מידיי כי אז רשת הנוירונים תהיה מורכבת ותהליך הלמידה ארוך ומורכב יותר. אנחנו לא רוצים לבצע מתיחה או כיווץ פשוטים מכיוון שאז נאבד נתונים חשובים: למשל ההבדל בין התו 'י' לתו 'ו' ולתו 'ן' בא לידי ביטוי בעיקר באורך הקו המאונך ובמיקומו ביחס שורה. אם נבצע מתיחה לא נוכל לזהות את ההבדל ביניהם. אם לא מתיחה אפשר לבצע ריפוד )padding( כלומר למלא את החלל החסר בתווים הקטנים בפיקסלים לא צבועים. אבל גם כאן כדאי להיזהר לא לאבד את הנתון של גובה התו ביחס לשורה, וגם צריך להיזהר לא לאבד נתונים ע"י הוספת הרבה פיקסלים שאין להם משמעות אמתית. בנוסף יש בעיה ייחודית לכתב דווקא בספר תורה: יש מספר תווים שיכולים להתמתח אופקית, בצורה כזו הסופר יכול למלא את השורה כך שתיגמר במקום הנכון. מדובר ב- 5 תווים שבהם מותר לבצע את המתיחה ד', ה', ל', ר', ת'. ובמילה אחת )שהפכה למונח מקצועי( להדר"ת. המיוחד בתווים הללו שיש להם קו אופקי פשוט במרכז ואפשר להאריך את התו )ואת הקו האופקי( ללא פגיעה בצורה הכללית של התו. בתהליך של המרת התמונה צריך להתחשב בתווים האלו ולכווץ אותם בצורה מושכלת. באיור 19 ניתן לראות דוגמאות של ר' ות' מתוחות )מסומנות בצהוב( לעומת ר' ות' רגילות. איור 19: אותיות ר ות מתוחות אופקית בנוסף ישנו ע"פ המסורת מספר מצומצם של אותיות קטנות )"זעירות"( 6 בכל התורה, או גדולות )"רבתיות"( 10 בכל התורה לאורך ספר התורה. במקרים אלו שידועים מראש צריך להעביר את התו הגדלה/מזעור לפני התחלת הזיהוי, ואז להמשיך בתהליך כרגיל. באיור 20 מתוארים השלבים שעוברת התמונה עד שמגיעה לגודל האחיד שהוא 21X28: 20

24 תיאור שלבי המעבר: יצירת תמונת תו מרופדת מציאת הגובה המקסימאלי והמינימאלי ביחס לשורה, וכן רוחב המקסימאלי לתו רגיל: לפני ההמרה עוברים על תמונות התווים בעמודה ומוצאים בספר הזה מה הגובה הגבוה )המרחק בין תחילת גובה השורה לגובה התו הגבוה ביותר(, הגובה הנמוך )המרחק בין תחילת השורה למקום הנמוך ביותר שתו מגיע( והרוחב הרחב ביותר של תו רגיל )לא כולל את תווי להדר"ת(. גדלים אלו יכולים להישמר בפרופיל הספר ולא צריך למצוא אותם מחדש אם הם כבר שמורים. בכל תמונת תו שמור גם מה מיקומו ביחס לשורה, כך שאפשר לצייר את התו במקום האמתי בתוך התמונה המרופדת. תו רגיל לעולם לא יחרוג מהתמונה המרופדת ובאשר לתווי להדר"ת: בדיקה אם התו רחב יותר מהתמונה המרופדת )תו מקבוצת להדר"ת( כווץ את התמונה ברוחב בשתי פעימות - החלק השמאלי ואז החלק הימני. היות שהמרכז של כל התווים הוא קו אופקי הפגיעה בצורה הכללית היא מינימאלית. אם התו לא רחב מדיי העתק אותו במיקומו הנכון לתמונה המרופדת יצירת תמונה סופית בת השוואה הבעיה בריפוד היא הוספה של כמות גדולה של פיקסלים לתמונה שלא תורמים מידע. עיקר התוספת המיותרת היא בחלקים שמעל ומתחת לשורה. על מנת להקטין משמעותית את האזורים האלו ולא לאבד את המידע עבור אותם תווים אנחנו מכווצים את האזורים בממד הגובה בחצי. על מנת להימנע מאיבוד מידע במקרה של כווץ בקווים האנכיים )הקווים האופקיים עבים בכתיבת סת"ם( אנו עוברים על כל מקום שדק מדיי ומוסיפים פיקסלים להדגשה. ראה בנספח א איור 26: תמונות תווים מקוריים וברי השוואה. 21

25 מצא את הגובה המקסימאלי והמינימאלי ביחס לשורה, וכן רוחב מקסימלי לתו רגיל צור תמונה ריקה )מרופדת( בגודל התו )הרגיל( המקסימאלי )ע"פ הגדלים שנמצאו( אם התו הנוכחי רחב מרוחב התמונה המרופדת צייר את התו הנוכחי בשני חצאים וצמצם כל חצי לפי רוחב חצי התמונה המרופדת בתוך התמונה המרופדת שמור על הגובה האמתי צייר את התו הנוכחי במיקומו האמתי בתוך התמונה המרופדת כווץ את החלק שמעל השורה, ואת החלק שמתחת לשורה ב 50% הדגש את כל הנקודות האנכיות שעשויות להיעלם אחרי ביצוע ההעתקה לגודל 21X 28 העתק התו המרופד לגודל 21X28 איור 20: תרשים זרימה המרה לתמונה בת השוואה 22

26 3.2 פעולת רשת הנוירונים איור 21: מבנה רשת נוירונים באיור 21 )לקוח מ( 2015 ((Templeton, המשרטט מבנה כללי של כל רשת נוירונים, ניתן לראות שכבת הקלט layer( )Input שכבת הפלט layer) (Output )layer ואת הקשרם ביניהם. 0/1 של ואת השכבת הנסתרת ( Hidden רשת הנוירונים צריכה לקבל בשכבת הקלט את נקודות הכניסה שהם במקרה שלנו רשימה בינארית לפי הפיקסלים. לרשת יש נקודות יציאה בשכבת הפלט שבמקרה שלנו כל נקודת יציאה מייצגת את אחד התווים. בכל זיהוי נקודת היציאה המתאימה אמורה "להידלק". במקרה שלנו יש 588 נקודות כניסה )הרזולוציה של תמונת כל תו היא 21( X 28 ו 27 נקודות יציאה )22 אותיות בעברית + 5 סופיות(. אני משתמש בקוד פתוח של מימוש רשת נוירונים שכתב Johannes Amtén ב: ונמצא. זאת, לאחר שניסיתי כמה חבילות שלא היו מוצלחות. חבילות אחרות הממשות רשת נוירונים שנוסו לצורך הפרויקט הן: Encog Machine Learning Framework ( ) 23

27 Java Kohonen Neural Network Library (JKNNL) ( ) חבילות אלו, למרות שנחשבות לטובות ומומלצות, באחת )Encog( התוצאות שהגעתי אליהן היו עלובות ביותר, ואת השנייה )JKNNL( לא הצלחתי להפעיל בצורה טובה מהממשק הקיים שם. רשת הנוירונים, לאחר שקיבלה את הקלט יוצרת 2 קבוצות, קבוצת אימון, וקבוצת בדיקה שאינה חלק מהאימון. בשלב ראשון מריצים את האימון. אורך האימון תלוי בכמות הנתונים. כאשר מדובר ב- 5 עמודות האימון רץ במשך כ- 2 דקות. לאחר האימון )שבסופו מתבצעת בדיקה על חלק מקבוצת האימון בדיקה זו אמורה תמיד להיות עם 100% הצלחה( אנחנו מריצים בדיקה על קבוצת הבדיקה ומקבלים את אחוזי ההצלחה. ניתן "לשחק" עם כמות הנתונים ועם הקונפיגורציה של רשת הנוירונים. ברשת הנוירונים אפשר לקבוע את העומק שלה )מספר השכבות( ואת הרוחב שלה )מספר הנוירונים בכל שכבה(. הקונפיגורציה שנתנה לי את התוצאות הטובות ביותר היא שכבה חבויה אחת בלבד עם 100 נוירונים. יותר שכבות של נוירונים הגדילו את זמן האימון אך לא הניבו תוצאות טובות יותר. יתכן שהסיבה לכך )לירידה בתוצאות( היא כמות הדוגמאות האימון שהשתמשתי בבדיקה. יתכן שבכמות גדולה יותר רשתות עמוקות יותר יהיו טובות יותר. 6 הגהה בהגהה השלבים הראשונים של הפעולה דומים מאוד לשלבים הנעשים בפעולת הלימוד כמתואר בתרשים איור 2. בתחילה טוענים את נתוני ספר התורה, ולאחר מכן טוענים את התמונה של העמודה שקיבלנו כקלט ומריצים את עיבוד התמונה וחילוץ התווים רק שבשלב זה עושים שימוש בנתונים השמורים בפרופיל )ראה נספח ג( כבר לאותו ספר )או סופר(. כאן ניתן לראות את חשיבות הנתונים השמורים של הרוחב הצפוי של הרווחים בין המילים, רוחב התווים וכל גדלי האותיות המקסימאליים. ללא נתונים אלו על הספר אי אפשר היה לחלץ את התווים בהצלחה. כך מזהים את השורות, המילים התווים והרווחים. ברגע שיש את התווים והרווחים משווים לנתוני ספר התורה ובודקים את נכונות הזיהוי של התווים והרווחים. לאחר מכן מופק דו"ח המפרט את השגיאות החשודות. שלב ההגהה מהיר מאוד באופן יחסי כ- 10 שניות בלבד לעמודה. 6.1 זיהוי תווים נוספים או חסרים עוברים על המילים המזוהות. במקרה של חוסר התאמה במספר התווים שיש במילה מסוימת זיהינו טעות. אם מדובר בתו מיותר יש לנו "נתק" )תו אחד מזוהה כשניים(, אם מדובר בתו חסר יש לנו "דבק". כל כישלון נרשם באובייקט הנתונים. 24

28 6.2 זיהוי רווחים אחרי כל מילה שמור לנו גם סוג הרווח שבא בסיומה. אם זהו רווח מיוחד של סיום פרשיה, אנחנו בודקים אם באמת הרווח נמצא ואם זהו סוג הרווח הנכון. אם יש טעות, הטעות נרשמת באובייקט הנתונים. 6.2 זיהוי התווים במידה ומספר התווים במילה מתאים למספר המצופה, מעבירים את תמונת התו למזהה התווים ברשת הנוירונים. רשת הנוירונים מחזירה את התו המזוהה על ידה וגם את וודאות הזיהוי. במידה וודאות הזיהוי נמוכה מ- 90 אחוז, אנחנו לוקחים את 3 התוצאות הגבוהות ביותר. )רשת הנוירונים מספקת גם את הנתון הזה.( 6.3 איסוף הסטטיסטיקה על כישלון של נתק או דבק אנחנו מעלים מונה של כישלונות במילים. אם מילה זוהתה מבחינת מספר תווים, מעלים מונה של הצלחה במילה. על כישלון בזיהוי רווח מיוחד מעלים מונה של כישלונות ברווחים )אין הפרדה בין חוסר זיהוי של רווח קיים או זיהוי של רווח לא קיים(, אם הייתה הצלחה מעלים מונה של הצלחה. על כישלון בזיהוי תו מעלים מונה של כישלונות בזיהוי תו. בנוסף בודקים אם היה זיהוי וודאי או לא. וודאי לצורך העניין זה למעלה מ 90%. סופרים את הכישלונות בזיהוי וודאי, ובזיהוי מסופק. במקביל סופרים גם את ההצלחה בתו מזוהה ודאית ובתו שאינו זוהה בוודאות. במקרה של כישלון בזיהוי לא ודאי בודקים גם את שני התווים הבאים אחרי הזיהוי, אם היה זיהוי באחד מהם, אם כן זה נספר במונה נוסף. סופרים גם את הכישלונות וההצלחות לכל תו בנפרד שמועלים אם יש הצלחה או כישלון בהתאמה.( )לכל תו יש מונה של הצלחות וכישלונות התוכנה תיחשב כמוצלחת לפי אחוז זיהוי הטעויות negative( )false אבל גם לפי אחוז זיהוי הטעיות השגוי positive(.)false כלומר אם התוכנה מתריעה על טעויות אבל מתריעה על כתב תקין כטעות אז ישנה בעיה אע"פ שהתוכנה מוצאת טעויות. אם מדובר בהרבה מידיי התרעות שווא התוכנה לא מוצלחת. 25

29 7 תוצאות 7.1 תוצאות הגהת עמודה אציג כאן תוצאות מפורטות של הגהת עמודה מספר תורה )ראה איור 22(. מדובר על העמודה שניה של הספר. בהמשך אביא תוצאות של עמודות נוספות. הצילום של הספר נמצא באינטרנט באתר, לא מצאתי עוד תמונות מסודרות שלמות של עמודות ספר תורה ברשת. בכל מקרה מדובר בתמונות אותנטיות שלא "בושלו" על ידי. הספר כתוב יפה וברור באופן יחסי, אך הצילום לא נעשה בצורה מקצועית. רבים מהעמודים בספר מצולמים כאשר הקלף לא משוטח מה שיוצר גלים ואת הבעיה זו לא פותר אלגוריתם היישור, שמתייחס למצב שהקלף משוטח אך נוטה בזווית. בנוסף התאורה לא זהה בצילומים שונים וכך גווני האפור של כל צילום משתנים, ובחלק מהמקרים בתמונה עצמה גווני האפור משתנים. ללמד את התוכנה לקחתי 5 עמודים )אחרים( מהספר 1,3,4,5, תוצאות הגהת עמודה בדו"ח מילולי בטבלה 1 ניתן לראות תוצאות ההגהה: מונה תוצאה (99.36%) 1249 תווים שזוהו בהצלחה )מתוך 1257( 8 תווים שלא זוהו )סה"כ זיהויים שגויים של תווים( 0 מילים שלא זוהו )דבק או נתק( מספר תווים שגוי 338 מילים שזוהו 1230 תווים שזוהו בוודאות )מעל 90% לנכונות של זיהוי לעומת אפשרויות אחרת( בלי קשר 27 תווים שזוהו בזיהוי מסופק )זוהו בפחות מ 90% ( בלי קשר לנכונות הזיהוי 0 תווים שזוהו בוודאות ונכשלו בזיהוי )התוכנה זיהתה בוודאות אך טעתה( 26

30 19 תווים שזוהו בהצלחה אך בזיהוי מסופק )הזיהוי היה בפחות מ 90% אך נכון( 8 תווים שזוהו בזיהוי מסופק ונכשלו בזיהוי )זיהויים בפחות מ 90% שנכשלו( תווים שזוהו בזיהוי מסופק ונכשלו בזיהוי, אך הזיהוי של התו הבא היה נכון )מקרים שהאפשרות השנייה בטיבה בזיהוי מסופק שנכשל הייתה נכונה( תווים שזוהו בזיהוי מסופק ונכשלו בזיהוי, אך הזיהוי של אחד משני התווים הבאים היה נכון )מקרים שאחד משני התווים הבאים היה נכון בזיהוי מסופק שנכשל( זיהוי רווחים מוצלח )זיהוי רווחים של פרשיות פתוחות וסגורות( 0 טעויות רווחים: )זיהוי רווחים לא קיימים או אי זיהוי רווחים קיימים( טבלה 1 : מונים מדוח הגהת עמודה 2 מספר בראשית התפלגות הזיהויים הנכונים לפי תווים: א - ;118 ב - ;64 ג - ;7 ד - ;38 ה - ;152 ו - ;132 ז - ;7 ח - ;18 ט - ;10 י - ;117 ך - ;5 כ - ;44 ל - ;91 ם - ;63 מ - ;55 ן - ;15 נ - ;22 ס - ;1 ע - ;47 ף - ;2 פ - ;12 ץ - ;23 צ - ;10 ק - ;9 ר - ;76 ש - ;63 ת - ;48 התפלגות הזיהויים הלא נכונים: ף - ;1 ג - ;1 ס - ;1 ה - ;2 ן - ;1 כ - ;1 ק - ; תוצאות הגהת עמודה בתמונה התוכנה מוציאה תמונה של התוצאה. בתמונה מופיעים התווים והמילים שלא זוהו. המילים במסגרת סגולה, התווים שלא זוהו אך הזיהוי היה "מסופק" במסגרת ורודה, ותווים שלא זוהו בזיהוי "ודאי" במסגרת אדומה. באיור 22 ניתן לראות את כל התווים שלא זוהו. כל הטעויות היו בזיהוי "מסופק". 27

31 איור 22: תוצאה גרפית של הגהת עמודה 2 28

32 7.2 ניתוח ראשוני של התוצאות בעמוד זה אין טעויות אמתיות, כלומר שברמה אידיאלית היה צריך להיות 0 טעויות וזיהוי מלא של כל התווים. בכל זאת היו מספר תווים )8( שהתוכנה נכשלה בזיהויים התריעה על טעות אף שלא הייתה כזו positive(.)false אחוז הזיהוי של התווים הוא : = 99.36% זהו אחוז זיהוי מצוין לכתב יד באופן כללי. נכון שזיהוי כתב בספר תורה שונה מכיוון שכללי הכתיבה נוקשים הרבה יותר, אבל לספר תורה, כפי שציינו, קשיים משלו )תווים מאורכים לצורך התאמה לשורה ותווים דומים(. בהמשך ננסה לעמוד על הסיבות לטעות באותם התווים. כפי שהסברנו את הזיהויים אנחנו מחלקים לזיהוי ודאי )מעל 90%( וזיהוי מסופק. נתון מעניין נוסף הוא שלא הייתה שום טעות בזיהויים הוודאיים! ודאיים היו 97.85%. לגבי מדדי ההצלחה המקובלים ראה מדדי הצלחה. 8 כל הטעויות היו בזיהויים מסופקים. זיהויים נתון מעניין נוסף הוא שב- 6 מתוך 8 הטעויות התו הנכון הוא התו הבא הקרוב לזיהוי. בשני הזיהויים השגויים הבאים התו השני הוא התו הנכון. נתון זה מאפשר לבנות שיפור משמעותי בזיהוי אם נבנה מנגנון המסוגל לבחור מבין התווים המועמדים הראשונים כאשר הזיהוי לא ודאי. לגבי בעיות של הידבקויות ונתקים לא זוהו שגיאות - כמצופה. מעבר לכך אנו רואים שהרווחים זוהו בהצלחה. 7.2 ניתוח נוסף של הטעויות בטבלה 2 הבאתי פירוט של 8 הטעויות. התו שלא זוהה ף ן ס ק ה ה ג כ הזיהוי השגוי פ ג ם ח ת ת נ ב המועמדים הבאים ב, ף ז, ן ס, כ ק, כ ה, ק ה, ד ג, ב כ, ם טבלה 2: פירוט טעויות הזיהוי של עמודה 2 בספר בראשית 29

33 ה: ניתן לראות שהטעויות "הגיוניות" כלומר להחליף ס ו-ם, נ ו-ג ב ו-כ אלו שגיאות צפויות. גם להחליף ה ו-ת אפשר להבין. מזה שטעות זו קרתה פעמיים ברור שיש כאן נקודה שצריך ואפשר לשפר. אפשר לשפר בתהליך נוסף שאפשר להעביר לגבי זיהוי של תווים אלו )במיוחד זיהוי מסופק( שרק יצטרך לבדוק ולהכריע בין התווים הקרובים. אפשר גם לבדוק שיפור שאפשר לבצע ביצירת התו בר ההשוואה שיתכן שמעלים אזור משמעותי לזיהוי. מעבר לכך ניתן לראות שבמקומות של חשד לטעויות יש באמת שינוי מדרך הכתיבה הרגילה של התו בידי הסופר, וראוי להסב את תשומת ליבו לכך גם אם לא מדובר בטעות פורמאלית. לדוגמה נראה את התו 'ן' שלא זוהה בידי התוכנה. נראה בטבלה 3 את התו ולאחריו 4 תווים של 'ן' שכן זוהו. טבלה 3 -'ן' שלא זוהתה ולאחריה 3 דוגמאות שזוהו אפשר להבין מדוע רשת הנוירונים טעתה "חשבה" שמדובר פה ב-'ג' או ב-'ז'. התוצאה בתמונה המבחן הבא של התוכנה יהיה לזהות טעויות שנשתול בעמודה זו. 7.3 הגהת עמודה עם 2 טעויות באותה עמודה שתלתי שתי טעויות: 1. במילה "ורדו" חיברתי חיבור בעובי של פיקסל בין הר לד: 2. במילה והארץ הוספתי חיבור קטן באות ה כך: הגהת תמונה עם טעויות דו"ח מילולי נריץ את ההגהה על התמונה ונראה את התוצאות: מונה תוצאה 1244 תווים שזוהו בהצלחה )מתוך 1257( 9 תווים שלא זוהו )סה"כ זיהויים שגויים של תווים( 30

34 1 מילים שלא זוהו )דבק או נתק( מספר תווים שגוי 337 מילים שזוהו 1226 תווים שזוהו בוודאות )מעל 90% לנכונות של זיהוי לעומת אפשרויות אחרת( בלי קשר 27 תווים שזוהו בזיהוי מסופק )זוהו בפחות מ 90% ( בלי קשר לנכונות הזיהוי 1 תווים שזוהו בוודאות ונכשלו בזיהוי 19 תווים שזוהו בהצלחה אך בזיהוי מסופק )הזיהוי היה בפחות מ 90% אך נכון( 8 תווים שזוהו בזיהוי מסופק ונכשלו בזיהוי )זיהויים בפחות מ 90% שנכשלו( תווים שזוהו בזיהוי מסופק ונכשלו בזיהוי, אך הזיהוי של התו הבא היה נכון )מקרים שהאפשרות השנייה בטיבה בזיהוי מסופק שנכשל הייתה נכונה( תווים שזוהו בזיהוי מסופק ונכשלו בזיהוי, אך הזיהוי של אחד משני התווים הבאים היה נכון )מקרים שאחד משני התווים הבאים היה נכון בזיהוי מסופק שנכשל( זיהוי רווחים מוצלח )זיהוי רווחים של פרשיות פתוחות וסגורות( 0 טעויות רווחים: )זיהוי רווחים לא קיימים או אי זיהוי רווחים קיימים( התפלגות הזיהויים הנכונים לפי תווים: א - ;118 ב - ;64 ג - ;7 ד - ;37 ה - ;151 ו - ;130 ז - ;7 ח - ;18 ט - ;10 י - ;117 ך - ;5 כ - ;44 ל - ;91 ם - ;63 מ - ;55 ן - ;15 נ - ;22 ס - ;1 ע - ;47 ף - ;2 פ - ;12 ץ - ;23 צ - ;10 ק - ;9 ר - ;75 ש - ;63 ת - ;48 התפלגות הזיהויים הלא נכונים: ף - ;1 ג - ;1 ס - ;1 ה - ;3 ן - ;1 כ - ;1 ק - ;1 31

35 אפשר לראות שהתוכנה זיהתה את שתי הטעויות: במונה המילים הבלתי מזוהות יש עכשיו 1 ובהדפסת הlogs : text word,ורדו (perkek:,א pasuk:,(כח index: 12 has different length than letters images (3) במונה התווים שזוהו בוודאות ונכשלו בזיהוי יש עכשיו 1 בזכות הטעות ששתלנו בה של המילה 'והארץ'. אפשר לראות את הטעות באות ה בהתפלגות הזיהויים הלא נכונים והנכונים מדדי הצלחה בדרך כלל בתוכנות למידה חישובית מקובל להגדיר את המדדים של recall, precision, accuracy שהם שקלול של ההצלחה והכישלון של הזיהוי וחוסר הזיהוי. )2( בתוכנה למציאת טעויות נגדיר את הטעויות שנמצאו כpositive true האותיות שזוהו בהצלחה כnegative )1244( true הטעויות שזוהו בטעות )8( false positive טעויות שלא זוהו )0( false negative ומכאן נגזור את המדדים: Accuracy: 0.99, Recall: 1, Precision: 0.2 במקרה זה שבו מראש מדובר על מעט טעויות שאמורות להימצא המדדים קצת מטעים )לשני הכיוונים( אך המדד הנמוך של הprecision אכן מבליט את הבעיה הכללית בתוכנה שיש הרבה התראות שווא )גם אם ההתראות הן מסופקות וגם אם מדובר ביחסית מעט טעויות לעומת כמות האותיות שלא גרמו להתראת שווא( הגהת עמודה עם טעויות תצוגה גרפית באיור 23 ניתן לראות את המילה "ורדו" במסגרת סגולה ואת האות "ה" במילה והארץ במסגרת אדומה. )שאר הטעויות נשארו במקומם.( 32

36 איור - 22 תוצאת הגהת עמודה 2 עם 2 טעויות שתולות 33

37 7.3 תוצאות של עמודות נוספות עמודה 22 עמודה 30 מונה עמודה / / / 1261 תווים שזוהו בהצלחה )99.55% ( 99.70% (99.60%) תווים שלא זוהו )סה"כ זיהויים שגויים של תווים( מילים שלא זוהו )דבק או נתק( שגוי מספר תווים מילים שזוהו תווים שזוהו בוודאות )מעל 90% של זיהוי לעומת אפשרויות אחרת( בלי קשר לנכונות תווים שזוהו בזיהוי מסופק )זוהו בפחות מ 90% ( בלי קשר לנכונות הזיהוי תווים שזוהו בוודאות ונכשלו בזיהוי )התוכנה זיהתה בוודאות אך טעתה( תווים שזוהו בהצלחה אך בזיהוי מסופק )הזיהוי היה בפחות מ 90% אך נכון( תווים שזוהו בזיהוי מסופק ונכשלו בזיהוי )זיהויים בפחות מ 90% שנכשלו( תווים שזוהו בזיהוי מסופק ונכשלו בזיהוי, אך הזיהוי של התו הבא היה נכון )מקרים שהאפשרות השנייה בטיבה בזיהוי מסופק שנכשל הייתה נכונה( תווים שזוהו בזיהוי מסופק ונכשלו בזיהוי, אך הזיהוי של אחד משני התווים הבאים היה נכון )מקרים שאחד משני התווים הבאים היה נכון בזיהוי מסופק שנכשל( 34

38 0 1 1 זיהוי רווחים מוצלח )זיהוי רווחים של פרשיות פתוחות וסגורות( טעויות רווחים: )זיהוי רווחים לא קיימים או אי זיהוי רווחים קיימים( בחרתי ב 3 עמודות נוספות של צילום טוב, ושאנחנו מגיעים בהן לאחוז זיהוי גבוה במיוחד )עד 99.7%!(. התפלגות הזיהויים הלא נכונים )בכל 3 העמודות(: ל - ;1 כ - ;3 ז - ;2 ו - ;1 ס - ;2 ה - ;4 י - ;1 ג - ;5 ק - ;2 ם - ;1 ן ;1 ף 1 ניתן לראות טעויות בין התווים הדומים: קבוצת התווים הרזים ג, ו, ז, י, ן. טעויות בין ס, ם ובין ק לה. ניתן גם לראות שרובן הגדול של הטעויות הן בזיהויים מסופקים ולא זיהויים ודאיים. באיור 24 ניתן לראות שיש זיהוי ודאי של ו במילה ויהי שנכשל. התוכנה זיהתה י. במקרה הזה התוכנה זיהתה בעיה אמתית. אמנם זה מקרה גבולי שלא בטוח שפוסל את הספר, אבל מדובר בהחלט בתיקון שצריך להיעשות להאריך את הרגל של ה"ו" שלא יראה כמו י. גם האות כ במילה כדרלעמר בעייתית. היא קטנה מידיי וצריכה שיפור. האות ל לא זוהתה מכיוון שיש בה קטיעה מבחינת התוכנה. בתמונה המקורית אין קטיעה מוחלטת רק אזור דהוי של דיו שמסווג כשטח לבן. גם פה הסופר צריך להדגיש מחדש את האזור הדהוי שעשוי לדהות עוד ואז תהיה קטיעה. הטעויות ב"ז" של ובזהב ו"ס" במילה אלסר פחות ברורות אך )במיוחד ב"ז"( בהחלט ניתן לראות שינוי מהכתיבה הרגילה. באיור 25 תוצאת הגהה לעמודה 22 איור 25 הדבר בולט הוא מיעוט השגיאות שנמצאו רק 4 מהתווים לא זוהו )אחוז זיהוי של 99.7(. השגיאות שהתוכנה מצאה הן באמת זניחות כלומר שינויים קלים בלבד שלא נחשבות שגיאות אמתיות. )באות י נראה שהתוכנה רגישה לרוחב של הקו האנכי.( ב התוכנה מתריעה על האות ק' )מזוהה כ ה'(, כנראה בשל המיקום של הקו האנכי התחתון שנמצא בסוף התו. מעבר לכך התוכנה לא מצליחה לזהות את האות ג' בארבע הופעות )17 הופעות אחרות בעמודה מזוהות נכון(. בשלשה מקרים התכנה מזהה נ ובמקרה אחד )שבו הרגל של הג' בולטת במיוחד( התוכנה מזהה ב'. זו דוגמה לתו שכדאי לעשות מפת נוירונים שתבחין בין ג' לנ' ואולי גם לב'. גם לקבוצות התווים ס', ם' וו', ז', י', ה' ח' וק' ניתן להפעיל זיהוי משני שישפר עוד את התוצאות. 35

39 איור 24 תוצאת הגהת עמודה 12 36

40 איור 23 תוצאת הגהה לעמודה 22 37

41 38

42 8 סיכום ומבט להמשך הצלחנו להגיע למערכת שמחזיקה את המבנה הנתונים של ספר תורה ומצליחה לקרא צילום של עמודה של ספר תורה. המערכת כוללת פעולות של עיבוד תמונה ומאפשרת לחלץ מתוך העמוד את התווים המילים והרווחים. כאשר המערכת מקבלת עמוד להגהה המערכת יודעת לזהות את התווים הכתובים בכתב היד, ולהצביע על טעויות. למרות שפיתחנו כאן מערכת שהגיעה להישגים משמעותיים בהגהה ממוחשבת, יש עוד כברת דרך רבה כדי להגיע למוצר טוב ונוח שיוכל לעשות לספר תורה הגהה ממוחשבת ברמה טובה עוד יותר: א. ב. ג. ד. ה. ו. ז. לא בניתי ממשק למשתמש. ממשק למשתמש צריך לכלול ממשק נפרד לפעולת הלמידה )אימון( וממשק לפעולת ההגהה. הממשק לפעולת הלמידה צריך לכלול חלון של browser לבחירת קבצים כדי לממש אפשרות נוחה להוספת קבצים. הממשק צריך לכלול תצוגה של הפרופיל שאליו משויכת הלמידה. צריכה גם להיות אפשרות לראות את כל הפרמטרים שנמצאים בפרופיל )נספח ב'( לצורך אימון וגם לאפשר לפחות לחלק מהפרמטרים שינוי ידני. כחלק מביצוע הלמידה צריך להוסיף אפשרויות של יישור תמונה ומציאת סף לכל עמודה שמכניסים. בממשק ההגהה צריכה להיות תצוגה גרפית של התוצאה וגם תוצאה מילולית. כאן ישנה קשת רחבה של אפשרויות של תצוגת התוצאה. הן התוצאה בצורה גרפית: הסוגים השונים של החשדות לטעויות, ואיך להציג מידע שקשור לטעות כמו איזה תו זוהה, והן הדו"ח המילולי סטאטיסטי. כחלק מהממשק למשתמש צריך לבנות מערכת לניהול הפרופיל של הסופר. כרגע הפרופיל קיים כאובייקט אך אין ניהול של הפרופילים. סביר שיהיו לסופר כמה פרופילים אם הוא כותב ספרים בגדלים שונים או שנעשה שימוש בשיטת צילום שונה של עמודות הספר. לא עשיתי מספיק ניסויים כדי לאבחן את כמות העמודות האידיאלית הנדרשת ללמידה. עליתי בהדרגה עד שהגעתי ל 5 עמודות ששם הזיהוי החל להיות סביר, אבל לא המשכתי הלאה. די ברור לי ששימוש בעמודות נוספות ללמידה היה משפר עוד את הזיהוי במיוחד בתווים הבעייתיים. צריך לפתח עוד שכבה של זיהוי בין תווים קרובים. לאחר הזיהוי הראשוני בתווים שיש להם תווים קרובים צריכה להגיע שלב זיהוי נוסף שאמור לבדוק בתוך קבוצת התווים הזו את הזיהוי. גם כאן יש כיוונים שונים שאפשר לפתח. אפשר ליצור זיהוי משני בעזרת עוד מפות נוירונים שמקבלות כקלט רק את התווים הדומים, או להיעזר בבדיקות שונות לגמרי לצורך בדיקת תכונות כמו מציאת \ אי מציאת פיקסלים באזורים מסוימים. אפשר עוד לשפר את התמונה בת ההשוואה ע"י בדיקה עם עוד ספרי תורה שונים. יתכן מאוד שכאשר נבדוק על ספרי תורה נוספים נגלה ששם צריך להפעיל מניפולציות אחרות או נוספות על מה שעשינו כדי לייצר תמונה בת השוואה יעילה לספר הזה או לסוג הכתב )כיוון שיש מספר מנהגים לצורות הכתב(. ייתכן ששם גם נרצה רזולוציה אחרת שתשקף טוב יותר את הכתב. הנקודה הרגישה הזו של יצירת התמונה בת השוואה לא מוצתה עדיין. לא פיתחתי זיהוי לתווים המוקטנים )זעירים( והמוגדלים )אות רבתי(. התשתית מוכנה לזה, כלומר יש סימון לכל תו שכזה בבסיס הנתונים אבל צריך בדיקה שזה מוקטן \ מוגדל ואז להתאים לתו בר השוואה ומכאן להמשיך. צריך לנסות את המערכת על ספרי תורה נוספים. אני הרצתי את התוכנה על שני סוגים של כתב. אבל את שלב הניסויים המשמעותי ערכתי על סוג אחד. את הסוג השני לא בדקתי בצורה יסודית. בדיקה 39

43 ח. ראשונית שעשיתי אכן הניבה תוצאות סבירות אך פחות טובות. ברור שאפשר יהיה לשכלל עוד את המערכת כך שתתמוך בכתבי יד נוספים אך צריך זמן משמעותי נוסף לחקור את ההבדלים. אפשר יהיה לבנות רשת נוירונים מוכנה לכל נוסח מבלי להאכיל בנתונים של הסופר. לצורך זה יש להכין בסיס נתונים רחב של דוגמאות למידה מסופרים שונים. מאוד יתכן שבכמות כזו של למידה נצטרך קונפיגורציה שונה של מפת הנוירונים. 40

44 ביבליוגרפיה Benenson, R. (2016). Classification datasets results. Retrieved from Rodrigo Benenson s webpage: ts_results.html#4d4e Templeton, G. (2015, 10 12). Artificial neural networks are changing the world. What are they? Retrieved from Extreme Tech: Wikipedia. (2017, October 19). Retrieved from Optical character recognition: Wikipedia. (2017, September 12). Retrieved from Handwriting recognition: הפתוחה.זיהוי תווי כתב יד לא מקוון.זיהוי תווי כתב יד לא מקוון.(2016).מ,גוטמן 41

45 נספח א' טבלת המרת תווים מתמונת התו המקורית לתמונה ברת השוואה ]דוגמאות אותיות להדר"ת ארוכות ברקע ירוק[ איור 26: תמונות תווים מקוריים וברי השוואה תמונת תו מקורי תמונת תו מרופד )62X89( 45 X 50 תמונת תו סופית )21X28( 43 X X X X X 64 42

46 70X66 20 X X X X X X 73 43

47 36 X X X X X X X 74 44

48 36 X X X X X X X 87 45

49 42 X X X X 49 98X51 46

50 נספח ב' נתאר כאן את הפרופיל שיצרנו בעזרת טבלת שדות הפרופיל שיצרנו בספר התורה של דוגמת ההרצה, ולכל שורה ניתן הסבר לפרמטר של הפרופיל. : דוגמת פרופיל לספר תורה שם השדה ערך השדה )דוגמה( הסבר איור 27 שם הפרופיל מספר השורות בעמודה האם מדובר בתמונה שחור לבן )בינארית( סף הצבע של הפיקסל שממנה נחשב כשחור )מתוך 255 רמות אפור( שם הקובץ של רשת הנוירונים רוחב מקסימאלי של תו רגיל )בפיקסלים( גובה מעל לקו עליון של שורת התווים )בפיקסלים( גובה מתחת לקו העליון של השורה )בפיקסלים( רוחב מינימאלי בין מילים )בפיקסלים( רוחב תו מינימאלי )בפיקסלים( האם צריך לבדוק יישור תמונה לפני הרצה SaadImproved 42 false 170 saad_improved_ neural_network false name lines number isblackandwhiteimages blackthreshold neuralnetworkfilename regularlettermaxwidth maxabovelineheight maxunderlineheight minspacebetweenwords minletterwidth shouldcheckrotation 47

ייבוא וייצוא של קבצי אקסל וטקסט

ייבוא וייצוא של קבצי אקסל וטקסט ייבוא וייצוא של קבצי אקסל וטקסט (Importing & Exporting MS Excel Files and Text) ייבוא (Import) הפיכת קובץ טקסט, Excel מבסיס נתונים אחר. או סוגים אחרים, לטבלת,Access או העתקת טבלת Access בתחילת התהליך יש

קרא עוד

Microsoft Word - Ass1Bgu2019b_java docx

Microsoft Word - Ass1Bgu2019b_java docx ת ר ג י ל 1 ב ק ו ר ס מ ב ו א לתכנות 202.1.9031 JAVA סמסטר ב, ת נ א י ם ו ל ו ל א ו ת תאריך אחרון להגשה בציון מלא : 02.04.19 עד שעה : 23:55, כ ל יום איחור ל א מ א ו ש ר א ו ח ל ק ממנו מודריד 10 נקודות

קרא עוד

WinZIP תוכנה לדחיסת קבצים ספטמבר 2007

WinZIP תוכנה לדחיסת קבצים ספטמבר 2007 WinZIP תוכנה לדחיסת קבצים ספטמבר 2007 תשס"ח 2007. כל הזכויות שמורות לאוניברסיטה הפתוחה. בית ההוצאה לאור של האוניברסיטה הפתוחה, רח' רבוצקי 108 ת, "ד 808, רעננה 43107. The Open University of Israel, 108

קרא עוד

שבוע 4 סינטקס של HACK ASSEMBLY ניתן להשתמש בשלושה אוגרים בלבד:,A,D,M כולם בעלי 16 ביטים. M אינו אוגר ישיר- הוא מסמן את האוגר של ה RAM שאנחנו מצביעים ע

שבוע 4 סינטקס של HACK ASSEMBLY ניתן להשתמש בשלושה אוגרים בלבד:,A,D,M כולם בעלי 16 ביטים. M אינו אוגר ישיר- הוא מסמן את האוגר של ה RAM שאנחנו מצביעים ע שבוע 4 סינטקס של HACK ASSEMBLY ניתן להשתמש בשלושה אוגרים בלבד:,A,D,M כולם בעלי 16 ביטים. M אינו אוגר ישיר- הוא מסמן את האוגר של ה RAM שאנחנו מצביעים עליו כרגע )A מצביע עליו(. יש שני סוגי פקודות, פקודת

קרא עוד

תכנון אלגוריתמים עבודת בית 4: תכנון אלגוריתמים תאריך הגשה: 02: , בצהריים,תא מספר 66 בקומת כניסה של בניין 003 מתרגל אחראי: אורי 0

תכנון אלגוריתמים עבודת בית 4: תכנון אלגוריתמים תאריך הגשה: 02: , בצהריים,תא מספר 66 בקומת כניסה של בניין 003 מתרגל אחראי: אורי 0 22 עבודת בית 4: תכנון אלגוריתמים תאריך הגשה: 2: 622, בצהריים,תא מספר 66 בקומת כניסה של בניין 3 מתרגל אחראי: אורי הוראות כלליות: כל עוד לא נאמר אחרת, כאשר הנכם מתבקשים לתאר אלגוריתם יש לספק את הבאות: תיאור

קרא עוד

הטכניון מכון טכנולוגי לישראל אלגוריתמים 1 )443432( סמסטר חורף הפקולטה למדעי המחשב תרגול 9 מסלולים קלים ביותר תרגיל APSP - 1 עד כה דנו באלגור

הטכניון מכון טכנולוגי לישראל אלגוריתמים 1 )443432( סמסטר חורף הפקולטה למדעי המחשב תרגול 9 מסלולים קלים ביותר תרגיל APSP - 1 עד כה דנו באלגור תרגול 9 מסלולים קלים ביותר תרגיל APSP - 1 עד כה דנו באלגוריתמים לפתרון בעית מסלולים קלים מציאת מסלולים קלים ביותר מצומת ביותר ממקור יחיד. כלומר, V לכל צמתי הגרף. בעיה אחרת הקשורה לבעיה זו היא בעית ה-(

קרא עוד

מבוא לתכנות ב- JAVA תרגול 7

מבוא לתכנות ב- JAVA  תרגול 7 מבוא לתכנות ב- JAVA תרגול 8 תזכורת - מבנה של פונקציה רקורסיבית.2 פונקציה רקורסיבית מורכבת משני חלקים עיקריים 1. תנאי עצירה: מקרה/מקרים פשוטים בהם התוצאה לא מצריכה קריאה רקורסיבית לחישוב צעד רקורסיבי: קריאה

קרא עוד

מבחן 7002 פרטים כלליים מועד הבחינה: בכל זמן מספר השאלון: 1 משך הבחינה: 3 שעות חומר עזר בשימוש: הכל )ספרים ומחברות( המלצות: קרא המלצות לפני הבחינה ובדי

מבחן 7002 פרטים כלליים מועד הבחינה: בכל זמן מספר השאלון: 1 משך הבחינה: 3 שעות חומר עזר בשימוש: הכל )ספרים ומחברות( המלצות: קרא המלצות לפני הבחינה ובדי מבחן 7002 פרטים כלליים מועד הבחינה: בכל זמן מספר השאלון: 1 משך הבחינה: 3 שעות חומר עזר בשימוש: הכל )ספרים ומחברות( המלצות: קרא המלצות לפני הבחינה ובדיקות אחרונות לפני מסירה )עמודים 8-11( מבנה השאלון 5

קרא עוד

תוכן העניינים: פרק צמצומים ומימושים של פונקציות בוליאניות... 2 צמצומים של פונקציות באמצעות מפת קרנו:...2 שאלות:... 2 תשובות סופיות:... 4 צמצום

תוכן העניינים: פרק צמצומים ומימושים של פונקציות בוליאניות... 2 צמצומים של פונקציות באמצעות מפת קרנו:...2 שאלות:... 2 תשובות סופיות:... 4 צמצום תוכן העניינים: פרק 2 3 צמצומים ומימושים של פונקציות בוליאניות 2 צמצומים של פונקציות באמצעות מפת קרנו: 2 שאלות: 2 תשובות סופיות: 4 צמצום באמצעות שיטת 6:QM שאלות: 6 תשובות סופיות: 7 מימושים בעזרת פונקציות

קרא עוד

מצגת של PowerPoint

מצגת של PowerPoint מהי סביבת איקס לימוד? סביבת איקס לימוד היא סביבה גמישה לתרגול היכולת לזכור ולהיזכר במושגים ועובדות מתחומי תוכן שונים על ידי התאמה. הסביבה מבוססת על המשחק 'איקס עיגול' והתוכן אותו מתרגלים יכול מסוג טקסט

קרא עוד

<4D F736F F D20FAE5F1F4FA20ECE7E5E5FA20E3F2FA20ECE2E1E920E3E9F1F720FAEEE5F0E5FA20E6E9F8FA20E4F8F6E72E646F63>

<4D F736F F D20FAE5F1F4FA20ECE7E5E5FA20E3F2FA20ECE2E1E920E3E9F1F720FAEEE5F0E5FA20E6E9F8FA20E4F8F6E72E646F63> טי.וי.קליפ אולפן עריכה והקלטה לוידאו וסאונד שירותים מיוחדים לתחום החקירות והמשפט ניתוח וידאו וסאונד חוות דעת מקצועית טלפון : 09-7663465, פקס': 054-4212424, 077-4213465 נייד : רחוב הכיכר 4 (קניון הכיכר)

קרא עוד

פקולטה: מחלקה: שם הקורס: קוד הקורס: מדעי הטבע מדעי המחשב ומתמטיקה מתמטיקה בדידה תאריך בחינה: _ 07/07/2015 משך הבחינה: 3 שעות סמ' _ב' מועד

פקולטה: מחלקה: שם הקורס: קוד הקורס: מדעי הטבע מדעי המחשב ומתמטיקה מתמטיקה בדידה תאריך בחינה: _ 07/07/2015 משך הבחינה: 3 שעות סמ' _ב' מועד פקולטה: מחלקה: שם הקורס: קוד הקורס: מדעי הטבע מדעי המחשב ומתמטיקה מתמטיקה בדידה 2-7012610-3 תאריך בחינה: _ 07/07/2015 משך הבחינה: 3 שעות סמ' _ב' מועד ב' שם המרצה: ערן עמרי, ענת פסקין-צ'רניאבסקי חומר עזר:

קרא עוד

תוכן העניינים

תוכן העניינים הוצאת חושבים קדימה הילה קדמן חלק ב יעוץ מקצועי: חיים אברבוך מותאם לתכנית הלימודים החדשה בבתי הספר התיכוניים מהדורה חמישית הוצאת חושבים קדימה ת.ד. 1293 רעות 71908 www.kadman.net הילה קדמן 0522 525527 kadman11@gmail.com

קרא עוד

Microsoft Word - tik latalmid-final

Microsoft Word - tik latalmid-final רשימת המשימות במבדק טבלת מעקב מס ' המשימה שם המשימה עמוד העברה ראשונה תאריך עבר/לא עבר העברה שנייה תאריך עבר/לא עבר 3 1 קריאת שמות אותיות 7 2 קריאת צלילי אותיות 10 קריאת צירופים של עיצורים ותנועות 3 4

קרא עוד

Microsoft Word - ExamA_Final_Solution.docx

Microsoft Word - ExamA_Final_Solution.docx סמסטר חורף תשע"א 18 בפבואר 011 הטכניון מכון טכנולוגי לישראל הפקולטה למדעי המחשב מרצה: מתרגלים: רן אל-יניב נועה אלגרבלי, גיא חפץ, נטליה זילברשטיין, דודו ינאי (אחראי) סמסטר חורף תשע" מבחן סופי פתרון (מועד

קרא עוד

מספר זהות: סמסטר ב' מועד א' תאריך: 11102/4// שעה: 9:22 משך הבחינה: 3 שעות חומר עזר: אין מותר השימוש במחשבון פשוט בחינה בקורס: מבני נתונים מרצה: הדר בי

מספר זהות: סמסטר ב' מועד א' תאריך: 11102/4// שעה: 9:22 משך הבחינה: 3 שעות חומר עזר: אין מותר השימוש במחשבון פשוט בחינה בקורס: מבני נתונים מרצה: הדר בי מספר זהות: סמסטר ב' מועד א' תאריך: 11102/4// שעה: 9:22 משך הבחינה: 3 שעות חומר עזר: אין מותר השימוש במחשבון פשוט בחינה בקורס: מבני נתונים מרצה: הדר בינסקי הנחיות: יש לענות על כל השאלות. יש לענות על כל

קרא עוד

עמוד 1 מתוך 5 יוחאי אלדור, סטטיסטיקאי סטטיסטיקה תיאורית + לוחות שכיחות בדידים/רציפים בגדול מקצוע הסטטיסטיקה נחלק ל- 2 תחומים עיקריים- סטט

עמוד 1 מתוך 5 יוחאי אלדור, סטטיסטיקאי סטטיסטיקה תיאורית + לוחות שכיחות בדידים/רציפים בגדול מקצוע הסטטיסטיקה נחלק ל- 2 תחומים עיקריים- סטט עמוד מתוך + לוחות שכיחות בדידים/רציפים בגדול מקצוע הסטטיסטיקה נחלק ל- תחומים עיקריים- וסטטיסטיקה היסקית; בסטטיסטיקה היסקית משערים השערות, משווים בין קבוצות באוכלוסיה ועוד, אך גם מ ניתן ללמוד הרבה על האוכלוסיה-

קרא עוד

PowerPoint Presentation

PowerPoint Presentation תוכנה 1 תרגול 1: סביבת העבודה ומבוא ל- Java אלכסיי זגלסקי ויעל אמסטרדמר 1 בירוקרטיה אלכסיי זגלסקי שעת קבלה: שני 13:00-14:00, בתיאום מראש משרד: בניין הנדסת תוכנה, חדר 209 יעל אמסטרדמר שעת קבלה: חמישי 15:00-16:00,

קרא עוד

מהוא לתכנות ב- JAVA מעבדה 3

מהוא לתכנות ב- JAVA מעבדה 3 מבוא לתכנות ב- JAVA מעבדה 3 נושאי התרגול לולאות ניפוי שגיאות לולאות - הקדמה כיצד הייתם כותבים תוכנית שתדפיס את המספרים השלמים בין 1 ל- 100 בעזרת הכלים שלמדתם עד עתה? חייבת להיות דרך אחרת מאשר לכתוב 100

קרא עוד

תשובות מלאות לבחינת הבגרות במתמטיקה מועד ג' תשע"ד, מיום 0/8/0610 שאלונים: 313, מוצע על ידי בית הספר לבגרות ולפסיכומטרי של אבירם פלדמן שאלה מספר

תשובות מלאות לבחינת הבגרות במתמטיקה מועד ג' תשעד, מיום 0/8/0610 שאלונים: 313, מוצע על ידי בית הספר לבגרות ולפסיכומטרי של אבירם פלדמן שאלה מספר תשובות מלאות לבחינת הבגרות במתמטיקה מועד ג' תשע"ד, מיום 0/8/0610 שאלונים: 313, 635863 מוצע על ידי בית הספר לבגרות ולפסיכומטרי של אבירם פלדמן שאלה מספר 1 נתון: 1 תלמיד קנה 11 מחברות דקות ו- 4 מחברות עבות,

קרא עוד

תאריך פרסום: תאריך הגשה: מבנה נתונים תרגיל 5 )תיאורטי( מרצה ומתרגל אחראים: צחי רוזן, דינה סבטליצקי נהלי הגשת עבודה: -את העבודה יש לה

תאריך פרסום: תאריך הגשה: מבנה נתונים תרגיל 5 )תיאורטי( מרצה ומתרגל אחראים: צחי רוזן, דינה סבטליצקי נהלי הגשת עבודה: -את העבודה יש לה תאריך פרסום: 01.01.15 תאריך הגשה: 15.01.15 מבנה נתונים תרגיל 5 )תיאורטי( מרצה ומתרגל אחראים: צחי רוזן, דינה סבטליצקי נהלי הגשת עבודה: -את העבודה יש להגיש בזוגות. -העבודה חייבת להיות מוקלדת. -הקובץ חייב

קרא עוד

מיכפל

מיכפל מיכפל 0222 הוראות התקנה למהדורה 9.78 במהדורה 78.9 בוצעו מספר שינויים טכנולוגיים: שדרוג התוכנה ליצירת דוחות בפורמט PDF שינויים בטכנולוגיית השידור של טופס 102 לביטוח הלאומי במהלך עדכון גרסה זו תתקבלנה מספר

קרא עוד

פרויקט שורשים דמות

פרויקט שורשים דמות פרויקט שורשים דמות בחייכם אודות דמות פרק זה בעבודת השורשים יכלול מידע אודות הדמות שנבחרה מצד ההורים. הפרק יכיל תקציר רגיל ]רשות[ או מעוצב ]רשות[, טקסט ]חובה[, תמונות ]רשות אבל ]רשות [. רצוי מאוד[, אלבום-מצגת

קרא עוד

Microsoft Word - tips and tricks - wave 5.doc

Microsoft Word - tips and tricks - wave 5.doc - טיפים וטריקים Samsung S8500 Wave שקע אוזניות רמקול שקע כניסת USB חיישן תאורה מצלמה קדמית מקש נעילה לחצני הגברת / הנמכת השמע מקש המצלמה מקש SEND מקש,END כיבוי / הדלקה מקש התפריט 1 תפעול כללי < הקש את

קרא עוד

<4D F736F F D20F4E9E6E9F7E420FAF8E2E5ED20ECF2E1F8E9FA20E4E2E4E420F1E5F4E9FA20496C616E2E646F63>

<4D F736F F D20F4E9E6E9F7E420FAF8E2E5ED20ECF2E1F8E9FA20E4E2E4E420F1E5F4E9FA20496C616E2E646F63> מתקף ותנע מבוא תרשים 1 כשמפעילים מתקף על גוף כלשהו, התנע שלו משתנה. שינוי התנע שווה למתקף, שהוא השטח מתחת לגרף הכוח כתלות בזמן: Δp = F dt 51 m v m v1 = dt 2 F כאשר F הוא הכוח המופעל על הגוף, p הוא השינוי

קרא עוד

שאלה 2. תכנות ב - CShell

שאלה 2. תכנות ב - CShell ביה"ס למדעי המחשב 4.2.2018 האקדמית נתניה מבחן מועד א' יסודות מערכות פתוחות סמסטר חורף, תשע"ח משך המבחן: שלוש וחצי שעות. יש לענות על כל השאלות. מותר השימוש בחומר עזר כלשהו, פרט למחשבים, (מחשבונים מותר).

קרא עוד

מקביליות

מקביליות תכונות בטיחות Safety Properties גרא וייס המחלקה למדעי המחשב אוניברסיטת בן-גוריון 2 תזכורת: תכונות זמן ליניארי Linear Time Properties תכונות זמן-ליניארי מתארות קבוצת עקבות שהמערכת צריכה לייצר מכוונים ללוגיקה

קרא עוד

Microsoft Word - hedva 806-pitronot-2011.doc

Microsoft Word - hedva 806-pitronot-2011.doc ו- ( ( השייכים לתחום ההגדרה שאלה פתרון: א. לפי ההגדרה, f היא פונקציה זוגית, אם לכל ( ) שלה, מתקיים. f f נציב את במקום בפונקציה הנתונה ונקבל: ( ) ( ) ( ) + + + + ( ) f f f כלומר, הפונקציה היא זוגית. על

קרא עוד

בארץ אחרת

בארץ אחרת בארץ אחרת כתבה טל ניצן איירה כנרת גילדר הוצאת עם עובד בע"מ 3112 על הספר זהו סיפור על ילדה שמגיעה יחד עם הוריה לעיר גדולה בארץ ארץ חדשה. הסיפור כתוב בגוף ראשון ומתאר חוויות ראשונות מן העיר הגדולה: גודלה

קרא עוד

משימה תכנית המתרגמת קטעי טקסט לשפה אחרת הקלט: קובץ המכיל את קטעי הטקסט וכן את השפה אליה רוצים לתרגם תרגול מס' 4: המתרגם שימוש במחלקות קיימות תכנות מתק

משימה תכנית המתרגמת קטעי טקסט לשפה אחרת הקלט: קובץ המכיל את קטעי הטקסט וכן את השפה אליה רוצים לתרגם תרגול מס' 4: המתרגם שימוש במחלקות קיימות תכנות מתק משימה תכנית המתרגמת קטעי טקסט לשפה אחרת הקלט: קובץ המכיל את קטעי הטקסט וכן את השפה אליה רוצים לתרגם תרגול מס' 4: המתרגם שימוש במחלקות קיימות 2 הפשטה שאלות כצעד ראשון נפתור בעיה הרבה יותר פשוטה האם כבר

קרא עוד

תוכן העניינים

תוכן העניינים הוצאת חושבים קדימה הילה קדמן # חלק ב יעוץ מקצועי: חיים אברבוך מותאם לתכנית הלימודים החדשה בבתי הספר התיכוניים מהדורה חמישית הוצאת חושבים קדימה ת.ד. 1293 רעות 71908 www.kadman.net הילה קדמן 0522 525527

קרא עוד

מבוא למדעי המחשב

מבוא למדעי המחשב מבוא כללי לתכנות ולמדעי המחשב 1843-0310 מרצה: אמיר רובינשטיין מתרגל: דין שמואל אוניברסיטת תל אביב סמסטר חורף 2017-8 חלק ב - מבוא לקריפטוגרפיה שיעור 5 (offset מונחים בסיסיים צופן קיסר (היסט,.1.2 1 Today

קרא עוד

PowerPoint Presentation

PowerPoint Presentation פרוטאוס הדרכה לפיתוח פרויקט מבוסס ארדואינו 1 הוראות הפעלה תוכנת פרוטאוס מכילה כמות גדולה מאוד של כלי עזר להבנת דרך ההפעלה של התוכנה. שני מקורות מידע עיקריים עומדים לרשות המשתמש מחוץ לתוכנה: o באתר האינטרנט

קרא עוד

שיעור מס' 6 – סבולות ואפיצויות

שיעור מס' 6 – סבולות ואפיצויות שיעור מס' 6 סבולות ואפיצויות Tolerances & Fits Tolerances חלק א' - סבולות: כידוע, אין מידות בדיוק מוחלט. כאשר אנו נותנים ליצרן חלק לייצר ונותנים לו מידה כלשהי עלינו להוסיף את תחום הטעות המותרת לכל מידה

קרא עוד

Microsoft Word ACDC à'.doc

Microsoft Word ACDC à'.doc דו"ח מסכם בניסוי: AC/DC חלק: א' סמסטר ב' תשס"א שם הבודק : תאריך הבדיקה: I שם מדריך הניסוי (שם מלא): סרגיי ציון הדו"ח: II תאריך ביצוע הניסוי: 14/05/001 תאריך הגשת הדו"ח: 1/05/001 הדו"ח מוגש על ידי: II I

קרא עוד

Disclaimer מסמך זה הינו סיכום און-ליין של השיעור ולא עבר עריכה כלל. מצאת טעות? שלח/י לי מייל ואתקן: 07/05/2009 קורס: מערכות ה

Disclaimer מסמך זה הינו סיכום און-ליין של השיעור ולא עבר עריכה כלל. מצאת טעות? שלח/י לי מייל ואתקן: 07/05/2009 קורס: מערכות ה הרעיון: דפדוף paging וזכרון וירטואלי.1.2.3 לחלק את מרחב הכתובות לדפים בגודל קבוע )למשל )4KB את הדפים ממפים לזכרון פיסי a. לא רציף b. לא כולם העברה מזכרון לדיסק לפי הצורך מספר הדף: page = addr 4K המיקום

קרא עוד

Microsoft Word - solutions.doc

Microsoft Word - solutions.doc תחרות גיליס 009-00 הרי פוטר הגיע לחנות הדובשנרייה בהוגסמיד. הוא מגלה, שהכסף שלו מספיק בדיוק ל- סוכריות קוסמים ול- 5 קרפדות שוקולד, או בדיוק ל- 0 קרפדות שוקולד ול- 0 נשיקות מנטה, או בדיוק ל- 45 נשיקות מנטה

קרא עוד

תכנון אלגוריתמים, אביב 1021, תרגול מס' 4 תכנון דינאמי תכנון דינאמי בתרגול זה נדון בבעיית הכפלת סדרת מטריצות (16.1.(CLR ראשית נראה דוגמא: דוגמא: תהינה

תכנון אלגוריתמים, אביב 1021, תרגול מס' 4 תכנון דינאמי תכנון דינאמי בתרגול זה נדון בבעיית הכפלת סדרת מטריצות (16.1.(CLR ראשית נראה דוגמא: דוגמא: תהינה תכנון דינאמי בתרגול זה נדון בבעיית הכפלת סדרת מטריצות (6..(CLR ראשית נראה דוגמא: דוגמא: תהינה ארבע מטריצות:. A, A, A, A נסמן את גודל המטריצות בסדרה ע"י סדרת גדלים כאשר, p 5 5 p היא בגודל A {,,,5,}, P כלומר

קרא עוד

DCA & A/B Testing

DCA & A/B Testing כלים מתקדמים לבדיקת קריאייטיב בפייסבוק Yan (Yanko) Kotliarsky Digital Marketing Strategist www.yanyanko.com @social.yanko Split Test (A/B Testing) Split Test (A/B Testing) עד לא מזמן, כדי לענות על השאלות

קרא עוד

(Microsoft Word - SQL\353\351\345\345\365 \341\361\351\361 \360\372\345\360\351\355 \ doc)

(Microsoft Word - SQL\353\351\345\345\365 \341\361\351\361 \360\372\345\360\351\355 \ doc) 01/07/08 כיווץ בסיס נתונים ב MS SQL 2005 מסמך זה סוקר תהליך כיווץ בסיס נתונים ב-.Microsoft SQL Server 2005 תהליך הכיווץ (Shrink), מכווץ את חלקו הלא פעיל (קובץ ה- Log ) של בסיס הנתונים ואינו נוגע בחלקו

קרא עוד

תרגיל בית מספר 1#

תרגיל בית מספר 1# ב 4 תרגיל בית מספר - 1 להגשה עד 72 באוקטובר בשעה ::725 קיראו בעיון את הנחיות העבודה וההגשה המופיעות באתר הקורס, תחת התיקייה.assignments חריגה מההנחיות תגרור ירידת ציון / פסילת התרגיל. הנחיות והערות ספציפיות

קרא עוד

עבודה במתמטיקה לכיתה י' 5 יח"ל פסח תשע"ה אפריל 5105 קשה בלימודים, קל במבחנים, קל בחיים עבודה במתמטיקה לכיתה י' 5 יח"ל פסח תשע"ה יש לפתור את כל השאלות

עבודה במתמטיקה לכיתה י' 5 יחל פסח תשעה אפריל 5105 קשה בלימודים, קל במבחנים, קל בחיים עבודה במתמטיקה לכיתה י' 5 יחל פסח תשעה יש לפתור את כל השאלות עבודה במתמטיקה לכיתה י' 5 יח"ל פסח תשע"ה יש לפתור את כל השאלות על דפים משובצים. רשמו את שמכם על כל אחד מהדפים הפתרונות יוגשו אחרי חופשת הפסח. מומלץ לכתוב דואר אלקטרוני, Whatspp כאשר נתקלים בקושי. מישהו

קרא עוד

2013/14 אוניברסיטת חיפה מבוא למדעי מחשב, מעבדה מטרת המעבדה: לתרגל את המעבר מאלגוריתם לקוד C כמה שיותר. הוראות:.1.2 ניתן לעבוד ביחידים או בזוגות. (יש מ

2013/14 אוניברסיטת חיפה מבוא למדעי מחשב, מעבדה מטרת המעבדה: לתרגל את המעבר מאלגוריתם לקוד C כמה שיותר. הוראות:.1.2 ניתן לעבוד ביחידים או בזוגות. (יש מ מטרת המעבדה: לתרגל את המעבר מאלגוריתם לקוד C כמה שיותר. הוראות:.1.2 ניתן לעבוד ביחידים או בזוגות. (יש מספיק עמדות לכולם ולכן מומלץ לעבוד ביחידים). במהלך המעבדה יהיה עליכם לבצע משימות. אם תצטרכו עזרה בשלב

קרא עוד

" תלמידים מלמדים תלמידים."

 תלמידים מלמדים תלמידים. " תלמידים מלמדים תלמידים." פרוייקט של צוות מתמטיקה, בית ספר כפר-הירוק איך הכל התחיל... הנהלת בית הספר העל-יסודי הכפר הירוק יזמה פרויקט בית ספרי: "למידה ללא מבחנים- הוראה משמעותית", צוות המתמטיקה החליט

קרא עוד

מדריך להתחלה מהירה Microsoft Project 2013 נראה שונה מגירסאות קודמות, ולכן יצרנו מדריך זה כדי לעזור לך ללמוד להכיר אותו. סרגל הכלים לגישה מהירה התאם אי

מדריך להתחלה מהירה Microsoft Project 2013 נראה שונה מגירסאות קודמות, ולכן יצרנו מדריך זה כדי לעזור לך ללמוד להכיר אותו. סרגל הכלים לגישה מהירה התאם אי מדריך להתחלה מהירה Microsoft Project 2013 נראה שונה מגירסאות קודמות, ולכן יצרנו מדריך זה כדי לעזור לך ללמוד להכיר אותו. סרגל הכלים לגישה מהירה התאם אישית את האזור הזה כדי שהפקודות המועדפות עליך יהיו תמיד

קרא עוד

תורת החישוביות תרגול הכנה לוגיקה ותורת הקבוצות מה יש כאן? בקורס תורת החישוביות נניח ידע בסיסי בתורת הקבוצות ובלוגיקה, והכרות עם מושגים בסיסיים כמו א"ב

תורת החישוביות תרגול הכנה לוגיקה ותורת הקבוצות מה יש כאן? בקורס תורת החישוביות נניח ידע בסיסי בתורת הקבוצות ובלוגיקה, והכרות עם מושגים בסיסיים כמו אב תורת החישוביות תרגול הכנה לוגיקה ותורת הקבוצות מה יש כאן? בקורס תורת החישוביות נניח ידע בסיסי בתורת הקבוצות ובלוגיקה, והכרות עם מושגים בסיסיים כמו א"ב, מילה ושפה לטובת מי ששכח חומר זה, או שלא למדו מעולם,

קרא עוד

פרויקט "רמזור" של קרן אביטל בס "ד מערך שיעור בנושא: "פונקציה" טליה קיפניס והדסה ערמי, מאולפנת צביה פרטים מקדימים על מערך השיעור: השיעור מהווה מבוא לנו

פרויקט רמזור של קרן אביטל בס ד מערך שיעור בנושא: פונקציה טליה קיפניס והדסה ערמי, מאולפנת צביה פרטים מקדימים על מערך השיעור: השיעור מהווה מבוא לנו בס "ד מערך שיעור בנושא: "פונקציה" טליה קיפניס והדסה ערמי, מאולפנת צביה פרטים מקדימים על מערך השיעור: השיעור מהווה מבוא לנושא הפונקציות הנלמד בכתה ט' בכל הרמות. עזרי ההוראה בהם נשתמש: מחשב, ברקו, דפי עבודה

קרא עוד

אוניברסיטת בן גוריון בנגב תאריך המבחן: שם המרצה: מר אלכסנדר שקולניק, בשפת JAVA מבחן ב: מבוא לתכנות מס' הקורס : מיועד לתלמידי : הנד

אוניברסיטת בן גוריון בנגב תאריך המבחן: שם המרצה: מר אלכסנדר שקולניק, בשפת JAVA מבחן ב: מבוא לתכנות מס' הקורס : מיועד לתלמידי : הנד אוניברסיטת בן גוריון בנגב תאריך המבחן: 29.01.19 שם המרצה: מר אלכסנדר שקולניק, בשפת JAVA מבחן ב: מבוא לתכנות 202.1.9031 מס' הקורס : מיועד לתלמידי : הנדסת תעשיה וניהול שנה תשע"ט א' סמ' א' מועד 3 שעות משך

קרא עוד

מבחן סוף סמסטר מועד א 15/02/08 מרצה אחראית: דר שירלי הלוי גינסברג מתרגלים: גלעד קותיאל, דניאל גנקין הוראות: א. בטופס המבחן 7 עמודים ו 4 דפי נוסחאות. ב

מבחן סוף סמסטר מועד א 15/02/08 מרצה אחראית: דר שירלי הלוי גינסברג מתרגלים: גלעד קותיאל, דניאל גנקין הוראות: א. בטופס המבחן 7 עמודים ו 4 דפי נוסחאות. ב מבחן סוף סמסטר מועד א 15/02/08 מרצה אחראית: דר שירלי הלוי גינסברג מתרגלים: גלעד קותיאל, דניאל גנקין הוראות: א. בטופס המבחן 7 עמודים ו 4 דפי נוסחאות. בדקו שכל העמודים ברשותכם. ב. משך המבחן שלוש שעות (180

קרא עוד

rizufim answers

rizufim answers ÌÈÙÂˆÈ מדריך למורה פעילות זו היא פעילות חקר לבדיקת כל אפשרויות הריצוף שבהן סידור מצולעים סביב קודקוד הוא זהה. המצולעים שבהם ישתמשו התלמידים הם: משולש שווה צלעות, משושה משוכלל וריבוע - כולם בעלי צלע באותו

קרא עוד

תשע"דד אביב תוכנה 1 תרגיל מספר 4 עיבוד מחרוזות וקריאה מקבצים הנחיות כלליות: קראו בעיון את קובץ נהלי הגשת התרגילים אשר נמצא באתר הקורס..(

תשעדד אביב תוכנה 1 תרגיל מספר 4 עיבוד מחרוזות וקריאה מקבצים הנחיות כלליות: קראו בעיון את קובץ נהלי הגשת התרגילים אשר נמצא באתר הקורס..( תשע"דד אביב תוכנה 1 תרגיל מספר 4 עיבוד מחרוזות וקריאה מקבצים הנחיות כלליות: קראו בעיון את קובץ נהלי הגשת התרגילים אשר נמצא באתר הקורס..(http://mdle.tau.ac.il/) בלבד הגשת התרגיל תעשה במערכת ה- mdle aviv

קרא עוד

Microsoft Word - I900-Tips_and_Tricks

Microsoft Word - I900-Tips_and_Tricks טיפים וטריקים Samsung I900 Omnia מקש כיבוי / הדלקה שקע ריסט מצלמה קדמית מקש מיוחד מקש הגברת / הנמכת השמע שקע הטענה / אוזניות מקש סיבוב מסך מקש ניתוק שיחה מקש מענה שיחה מקש ניווט 1 תפעול כללי מעבר בין פרופילים

קרא עוד

פייתון

פייתון שיעור 12: מילונים ברק גונן 1 או מילון, :hash table או,dictionary זוגות של מפתחות keys וערכים values מילון מוגדר על ידי סוגריים מסולסלים { } לדוגמה: מילון שמכיל ציונים, המפתח הוא מספר ת.ז ערך מפתח הגדרה

קרא עוד

אוניברסיטת בן גוריון בנגב תאריך המבחן: שקולניק אלכסנדר שם המרצה: מר בשפת JAVA מבוא לתכנות מבחן ב: מס' הקורס : הנדסת תעשיה וניהול מ

אוניברסיטת בן גוריון בנגב תאריך המבחן: שקולניק אלכסנדר שם המרצה: מר בשפת JAVA מבוא לתכנות מבחן ב: מס' הקורס : הנדסת תעשיה וניהול מ אוניברסיטת בן גוריון בנגב תאריך המבחן: 12.02.17 שקולניק אלכסנדר שם המרצה: מר בשפת JAVA מבוא לתכנות מבחן ב: 202.1.9031 מס' הקורס : הנדסת תעשיה וניהול מיועד לתלמידי : א' מועד א' סמ' שנה תשע"ד 3 שעות משך

קרא עוד

טיפים להצלחה במהלך הבחינה 1. בתחילת הבחינה קראו היטב את כל השאלות וסמנו לעצמכם את השאלות המועדפות על ידכם. קראו כל שאלה לפחות פעמיים, כדי שלא תחמיצו נ

טיפים להצלחה במהלך הבחינה 1. בתחילת הבחינה קראו היטב את כל השאלות וסמנו לעצמכם את השאלות המועדפות על ידכם. קראו כל שאלה לפחות פעמיים, כדי שלא תחמיצו נ טיפים להצלחה במהלך הבחינה 1. בתחילת הבחינה קראו היטב את כל השאלות וסמנו לעצמכם את השאלות המועדפות על ידכם. קראו כל שאלה לפחות פעמיים, כדי שלא תחמיצו נתון כלשהו.. אין צורך לענות על השאלות לפי סדר הופעתן.

קרא עוד

מדריך למרצים ומתרגלים 1

מדריך למרצים ומתרגלים 1 מדריך למרצים ומתרגלים 1 תוכן עניינים מדריך למרצים ומתרגלים...1 קבלת סיסמה לתחנת מידע למרצה...3 הוספת חומרי למידה...6 הוספת מורשה גישה לאתר הוספת מטלה קורס...9 לאתר הקורס...11 בחירת בודקים למטלה...17 מערכת

קרא עוד

שאלהIgal : מערכים דו מימדיים רקורסיה:

שאלהIgal : מערכים דו מימדיים רקורסיה: אוניברסיטת בן גוריון בנגב מספר נבחן : תאריך המבחן: כ"ח תשרי תשע"ז 30.10.16 שמות המורים: ציון סיקסיק א' תכנות ב- C מבחן ב: 202-1-9011 מס' הקורס : הנדסה מיועד לתלמידי : ב' מועד סמ' קיץ שנה תשע"ו 3 שעות משך

קרא עוד

בגרות עז יולי 17 מועד קיץ ב שאלון ,000 א. ניתוח הנתונים מחירה של ספה הוא שקלים, והיא התייקרה ב-. 25% כאשר המחיר מתייקר ב- המחיר החדש הוא פי,

בגרות עז יולי 17 מועד קיץ ב שאלון ,000 א. ניתוח הנתונים מחירה של ספה הוא שקלים, והיא התייקרה ב-. 25% כאשר המחיר מתייקר ב- המחיר החדש הוא פי, ,000 א ניתוח הנתונים מחירה של ספה הוא שקלים, והיא התייקרה ב- 5% כאשר המחיר מתייקר ב- המחיר החדש הוא פי, 5% לכן, המחיר החדש הוא: 5,000 00 5 5 00 שקלים ממחירו הקודם 0005 תשובה: מחיר הספה לאחר ההתייקרות הוא

קרא עוד

ex1-bash

ex1-bash ביה"ס למדעי המחשב סמסטר חורף תשע"ח 13.12.2017 יסודות מערכות פתוחות פתרון תרגיל מס' 7 המכללה האקדמית נתניה שימו לב: כל ההערות שבתחילת תרגילים 1-6 תקפות גם לתרגיל זה. הערה 1: החל מתרגיל זה והלאה, בכל פעם

קרא עוד

Microsoft Word - 01 difernziali razionalit

Microsoft Word - 01 difernziali razionalit פונקציות רציונליות 5 יחידות מתוך הספר 806 כרך ד' 0, כל הזכויות שמורות ל ואריק דז'לדטי חל איסור מוחלט לתרגם, להעתיק או לשכפל חוברת זו או קטעים ממנה, בשום צורה ובשום אמצעי אלקטרוני, אופטי או מכני (לרבות

קרא עוד

תרגול מס' 4: המתרגם שימוש במחלקות קיימות מחרוזות, קבצים, וקבלת קלט מהמשתמש

תרגול מס' 4: המתרגם שימוש במחלקות קיימות מחרוזות, קבצים, וקבלת קלט מהמשתמש תרגול מס' 4: המתרגם שימוש במחלקות קיימות מחרוזות, קבצים, וקבלת קלט מהמשתמש המתרגם משימה: תכנית המתרגמת קטעי טקסט לשפה אחרת הקלט: קובץ המכיל את קטעי הטקסט וכן את השפה אליה רוצים לתרגם 2 שאלות האם כבר יש

קרא עוד

פתרון מוצע לבחינת מה"ט ב_שפת c מועד ב אביב תשע"ט, אפריל 2019 מחברת: גב' זהבה לביא, מכללת אורט רחובות שאלה מספר 1 מוגדרת מחרוזת המורכבת מהספרות 0 עד 9.

פתרון מוצע לבחינת מהט ב_שפת c מועד ב אביב תשעט, אפריל 2019 מחברת: גב' זהבה לביא, מכללת אורט רחובות שאלה מספר 1 מוגדרת מחרוזת המורכבת מהספרות 0 עד 9. פתרון מוצע לבחינת מה"ט ב_שפת c מועד ב אביב תשע"ט, אפריל 2019 מחברת: גב' זהבה לביא, מכללת אורט רחובות שאלה מספר 1 מוגדרת מחרוזת המורכבת מהספרות 0 עד 9. הדפסה ראשונה: מתבצעת לולאה שרצה מאפס עד אורך המחרוזת.

קרא עוד

מקביליות

מקביליות תכונות שמורה Invariant Properties גרא וייס המחלקה למדעי המחשב אוניברסיטת בן-גוריון 2 בדיקות מודל Checking( )Model מערכת דרישות מידול פירמול בדיקות מודל )Model Checking( מודל של המערכת תכונות פורמליות סימולציה

קרא עוד

Microsoft Word - 28

Microsoft Word - 28 8-6-7-8 - פתרון מבחן מס' 8 (ספר לימוד שאלון 87) y M (, ) y מרכז המעגל החוסם את המשולש נמצא בנקודת חיתוך האנכים האמצעיים y y לצלעות המשולש: y M _, y y R M ( M) ( M) () R M y m 9 9 69 9 9 9 9 (ב) משוואת

קרא עוד

PowerPoint Presentation

PowerPoint Presentation תוכנה 1 תרגול 1: סביבת העבודה ומבוא ל- Java 1 מנהלות אתר הקורס: http://courses.cs.tau.ac.il/software1/1516b/ מתרגלים: ברית יונגמן )שעת קבלה: שלישי ב- 8:00 בתיאום מראש( לנה דנקין )שעת קבלה: שלישי ב- 17:00,

קרא עוד

<4D F736F F D20F4F2E5ECE5FA20EEE5EEF6E0E5FA20312E646F63>

<4D F736F F D20F4F2E5ECE5FA20EEE5EEF6E0E5FA20312E646F63> 1 תרגול פעולות מומצאות ( ( $ מה מהתשובות לא יכולה להיות תוצאה של הפעולה ) ( $ 1 הוגדרה פעולה חדשה $ + 1 1 + 10 + () () מה תוצאת הפעולה ) ( @ @ 10 = הוגדרה הפעולה החדשה 10 1 () 10 () 10 $ 19 $ 17 a) ( $

קרא עוד

Microsoft Word - tutorial Dynamic Programming _Jun_-05.doc

Microsoft Word - tutorial Dynamic Programming _Jun_-05.doc הטכניון מכון טכנולוגי לישראל אלגוריתמים (3447) סמסטר חורף 006/007 הפקולטה למדעי המחשב תכנון דינאמי תרגיל תת מחרוזת משותפת ארוכה ביותר תת-מחרוזת z k שקיימת סדרה עולה ממש,... z = z של מחרוזת נתונה x m,...,,

קרא עוד

שאלהIgal : מערכים דו מימדיים רקורסיה:

שאלהIgal : מערכים דו מימדיים רקורסיה: אוניברסיטת בן גוריון בנגב מספר נבחן : תאריך המבחן: כ"ג מנ' אב תשע"ז 15.08.17 שמות המורים: ציון סיקסיק א' ב- C תכנות מבחן ב: 202-1-9011 מס' הקורס : הנדסה מיועד לתלמידי : ב' מועד סמ' ב' שנה תשע"ז 3 שעות

קרא עוד

<4D F736F F D20FAF8E2E5EC20E0ECE2E1F8E420EEF2E5F8E D F9E0ECE5FA2E646F63>

<4D F736F F D20FAF8E2E5EC20E0ECE2E1F8E420EEF2E5F8E D F9E0ECE5FA2E646F63> < 0 a b b a > 0 נתון: מכאן ניתן לומר בוודאות כי -. a < b ab < 0 a 0 b > לא ניתן לקבוע בוודאות.. ( 0)?. לא ניתן לדעת. + ( + ) ( ) + + נתון: כמה ערכי שונים מקיימים את המשוואה?. אינסוף 0 +. תשובות ו נכונות

קרא עוד

מרצים יקרים, אתר המכללה מאפשר למרצי המכללה להזין את פרטיהם וקורות חייהם. זאת בדומה לאתרים מקבילים של מוסדות אקדמיים בארץ ובעולם. עמודי המרצים נועדו לא

מרצים יקרים, אתר המכללה מאפשר למרצי המכללה להזין את פרטיהם וקורות חייהם. זאת בדומה לאתרים מקבילים של מוסדות אקדמיים בארץ ובעולם. עמודי המרצים נועדו לא מרצים יקרים, אתר המכללה מאפשר למרצי המכללה להזין את פרטיהם וקורות חייהם. זאת בדומה לאתרים מקבילים של מוסדות אקדמיים בארץ ובעולם. עמודי המרצים נועדו לאפשר למרצי המכללה לפרסם באתר המכללה פרטים אודותיהם )תחומי

קרא עוד

מועד: א בחינה סופית במתמטיקה דיסקרטית משך הבחינה: 2 1 שעות מרצה: פרופ' תאופיק מנסור תאריך: סמסטר: א תשע"ח m 2 הוראות לנבחן: )1( הבחינה מו

מועד: א בחינה סופית במתמטיקה דיסקרטית משך הבחינה: 2 1 שעות מרצה: פרופ' תאופיק מנסור תאריך: סמסטר: א תשעח m 2 הוראות לנבחן: )1( הבחינה מו מועד: א בחינה סופית במתמטיקה דיסקרטית משך הבחינה: 2 1 שעות מרצה: פרופ' תאופיק מנסור תאריך: 26.01.2018 2 סמסטר: א תשע"ח m 2 הוראות לנבחן: )1( הבחינה מורכבת מ- 6 שאלות. כל שאלה מזכה ב- 20 נקודות כך הנקודות

קרא עוד

ForMenahelHeshbonot

ForMenahelHeshbonot מנה"ח לכל מומלץ הנהלת החשבונות של בינה מודול הנחיות עבור ריכוז מודול הנהלת החשבונות של בינה שונה בתפיסת עולמו ממודולים דומים בתוכנות הנהלת חשבונות. בתפיסת עולם זו, הנהלת החשבונות היא פועל יוצא של הפעילות

קרא עוד

תכנות דינמי פרק 6, סעיפים 1-6, ב- Kleinberg/Tardos סכום חלקי מרחק עריכה הרעיון: במקום להרחיב פתרון חלקי יחיד בכל צעד, נרחיב כמה פתרונות אפשריים וניקח

תכנות דינמי פרק 6, סעיפים 1-6, ב- Kleinberg/Tardos סכום חלקי מרחק עריכה הרעיון: במקום להרחיב פתרון חלקי יחיד בכל צעד, נרחיב כמה פתרונות אפשריים וניקח תכנות דינמי פרק 6, סעיפים -6, ב- Kleinberg/Tardos סכום חלקי מרחק עריכה הרעיון: במקום להרחיב פתרון חלקי יחיד בכל צעד, נרחיב כמה פתרונות אפשריים וניקח בסוף את הטוב ביותר. סכום חלקי sum) (subset הקלט: סדרה

קרא עוד

Microsoft Word B

Microsoft Word B מרצה: שולי וינטנר. מתרגל: שלמה יונה מבוא למדעי המחשב מועד ב', סמסטר א' תשס"ג, 17/2/03 משך המבחן: שעתיים וחצי. חומר עזר: מותר כל חומר עזר, מלבד מחשב. הנחיות: 1. ודאו כי בטופס שבידיכם 8 עמודים. יש לכתוב

קרא עוד

מדריך להתקנת Code Blocks מדריך זה נועד לתאר את תהליך התקנת התוכנה של הקורס "מבוא למחשב שפת C". בקורס נשתמש בתוכנת Code::Blocks עם תוספת )אשף( המתאימה

מדריך להתקנת Code Blocks מדריך זה נועד לתאר את תהליך התקנת התוכנה של הקורס מבוא למחשב שפת C. בקורס נשתמש בתוכנת Code::Blocks עם תוספת )אשף( המתאימה מדריך להתקנת Code Blocks מדריך זה נועד לתאר את תהליך התקנת התוכנה של הקורס "מבוא למחשב שפת C". בקורס נשתמש בתוכנת Code::Blocks עם תוספת )אשף( המתאימה לקורס. האשף קובע את סביבת הפיתוח כך שתתאים לצורכי הקורס.

קרא עוד

מספר נבחן / תשס"ג סמסטר א' מועד א' תאריך: שעה: 13:00 משך הבחינה: 2.5 שעות בחינה בקורס: מבחנים והערכה א' מרצה: ד"ר אבי אללוף חומר עזר

מספר נבחן / תשסג סמסטר א' מועד א' תאריך: שעה: 13:00 משך הבחינה: 2.5 שעות בחינה בקורס: מבחנים והערכה א' מרצה: דר אבי אללוף חומר עזר מספר נבחן 2002 2003 / תשס"ג סמסטר א' מועד א' תאריך: 29.1.03 שעה: 13:00 משך הבחינה: 2.5 שעות בחינה בקורס: מבחנים והערכה א' מרצה: ד"ר אבי אללוף חומר עזר: אין שימוש במחשבון: מותר בבחינה 10 עמודים כולל עמוד

קרא עוד

חינוך לשוני הוראת קריאה: נקודת מבט של הערכה: מהן הסוגיות שבהן ידע מחקרי עשוי לסייע בעיצוב מדיניות ועשייה?

חינוך לשוני הוראת קריאה:  נקודת מבט של הערכה: מהן הסוגיות שבהן ידע מחקרי עשוי לסייע בעיצוב מדיניות ועשייה? חינוך לשוני שפה ערבית סוגיות שבהן ידע מחקרי עשוי לסייע בעיצוב מדיניות ועשייה - נקודת מבט של הערכה מפגש לימודי 7.7.2011 אימאן עואדיה מנהלת תחום מבחנים בערבית - הרשות הארצית 2011# 1 מהי? היא הגוף המוביל

קרא עוד

תוכנה 1 1 אביב תשע"ג תרגיל מספר 5 מערכים, מחרוזות, עיבוד טקסט ומבני בקרה הנחיות כלליות: קראו בעיון את קובץ נהלי הגשת התרגילים אשר נמצא באתר הקורס. הגש

תוכנה 1 1 אביב תשעג תרגיל מספר 5 מערכים, מחרוזות, עיבוד טקסט ומבני בקרה הנחיות כלליות: קראו בעיון את קובץ נהלי הגשת התרגילים אשר נמצא באתר הקורס. הגש תוכנה 1 1 אביב תשע"ג תרגיל מספר 5 מערכים, מחרוזות, עיבוד טקסט ומבני בקרה הנחיות כלליות: קראו בעיון את קובץ נהלי הגשת התרגילים אשר נמצא באתר הקורס. הגשת התרגיל תיעשה במערכת ה- mdle בלבד.(http://mdle.tau.ac.il/)

קרא עוד

דף נגזרות ואינטגרלים לשאלון 608 כללים למציאת נגזרת של פונקציה: n 1. y' n x n, y הנגזרת x.1 נכפול בחזקה )נרשום אותה משמאל ל- (. x א. נחסר אחד מהחזקה. ב

דף נגזרות ואינטגרלים לשאלון 608 כללים למציאת נגזרת של פונקציה: n 1. y' n x n, y הנגזרת x.1 נכפול בחזקה )נרשום אותה משמאל ל- (. x א. נחסר אחד מהחזקה. ב דף נגזרות ואינטגרלים לשאלון 608 כללים למציאת נגזרת של פונקציה: n n n, y הנגזרת נכפול בחזקה )נרשום אותה משמאל ל- ( א נחסר אחד מהחזקה ב 7 y כאשר גוזרים כופלים בחזקה, 7 כלומר נרשום אותה משמאל ל-, ובחזקה של

קרא עוד

סדרה חשבונית והנדסית

סדרה חשבונית והנדסית .2 סדרות חשבוניות וסדרות הנדסיות n = 5 טבעי על-ידי כלל הנסיגה: + = an + 3. סדרה מוגדרת לכל n רשמו את ארבעת האיברים הראשונים בסדרה. הסבירו מדוע הסדרה הנתונה היא סדרה חשבונית עולה. מצאו את האיבר ה- 57 בסדרה.

קרא עוד

יצוא לחשבשבת תוכן עיניינים הגדרות - חשבונות בנק...2 הגדרות - הגדרות חשבשבת... 3 הגדרות - כרטיסי אשראי... 4 הגדרות - סוגי הכנסה... 5 יצוא לחשבשבת...6 י

יצוא לחשבשבת תוכן עיניינים הגדרות - חשבונות בנק...2 הגדרות - הגדרות חשבשבת... 3 הגדרות - כרטיסי אשראי... 4 הגדרות - סוגי הכנסה... 5 יצוא לחשבשבת...6 י יצוא לחשבשבת תוכן עיניינים הגדרות - חשבונות בנק...2 הגדרות - הגדרות חשבשבת... 3 הגדרות - כרטיסי אשראי... 4 הגדרות - סוגי הכנסה... 5 יצוא לחשבשבת...6 יצוא קופה לחשבשבת חלונות...01 כללי מדריך זה מסביר את

קרא עוד

2019 שאלות מומלצות לתרגול מס' דיפרנציאביליות של פונקציה סקלרית )המשך(. כלל השרשרת. S = ( x, y, z) z = x + 3y על המשטח מצאו נקודה בה מישור משיק

2019 שאלות מומלצות לתרגול מס' דיפרנציאביליות של פונקציה סקלרית )המשך(. כלל השרשרת. S = ( x, y, z) z = x + 3y על המשטח מצאו נקודה בה מישור משיק דיפרנציאביליות של פונקציה סקלרית )המשך( כלל השרשרת S ( z) z + על המשטח מצאו נקודה בה מישור משיק מקביל : f ( ) + הפונקציה מוגדרת וגזירה ברציפות בכל M( ) שאלה נתון פרבולואיד אליפטי P ( z) + 6 + z + 8 למישור

קרא עוד

תרגול 1

תרגול 1 תרגול rcsin d rcsin t d שאלה חשב את האינטגרלים המסוימים הבאים: sin cos d rcsin d sin cos d א ב ג פתרון שאלה סעיף א נציב dt sin d t cos עבור נקבל t cos cos עבור נקבל sin cos d tdt סעיף ב נפתור תחילה בעזרת

קרא עוד

SF4604MCNR Dolce Stil Novo תנור קומפקטי משולב מיקרוגל זכוכית שחורה EAN13: רכיבים בגימור נחושת פונקציות בישול 13 פונקציית ניקוי פירוליטי

SF4604MCNR Dolce Stil Novo תנור קומפקטי משולב מיקרוגל זכוכית שחורה EAN13: רכיבים בגימור נחושת פונקציות בישול 13 פונקציית ניקוי פירוליטי תנור קומפקטי משולב מיקרוגל EAN13: 8017709217853 רכיבים בגימור נחושת פונקציות בישול 13 פונקציית ניקוי פירוליטי באדים מתכונים ניתנים לתכנות 10 תוכניות אפיה אוטומטיות 50 פונקציית הפשרה, התפחה, הפעלת שבת בקרת

קרא עוד

שאלהIgal : מערכים דו מימדיים רקורסיה:

שאלהIgal : מערכים דו מימדיים רקורסיה: אוניברסיטת בן גוריון בנגב מספר נבחן : תאריך המבחן: כ"ג חשון תשע"ח 12/11/17 שמות המורים: ציון סיקסיק א' ב- C תכנות מבחן ב: 202-1-9011 מס' הקורס : הנדסה מיועד לתלמידי : ב' מועד קיץ סמ' שנה תשע"ז 3 שעות משך

קרא עוד

Microsoft Word - ניספח_8.doc

Microsoft Word - ניספח_8.doc ניסוי 8: מעגלי ישור וסינון איור 3.1: מעגל יישור חד-דרכי איור 3.: מעגל יישור דו-דרכי איור 3.3: מעגל יישור חד-דרכי עם מסנן קיבולי איור 3.4: מעגל יישור דו-דרכי עם מסנן קיבולי 1 התקנים חשמליים רבים זקוקים

קרא עוד

Limit

Limit פרק אינטגרל כפול לכן לפי משפט 55 )ראו גם את ההערה( שאלות :5 d cos( ) d [ ] [] שאלות עם פתרון שאלה 5 חשבו: פתרון 8 הפונקציה ) f ( ) cos( מתקיים: רציפה במלבן d cos( ) d d cos( ) d עדיף לחשב את האינטגרל השני:

קרא עוד

גילוי דעת 74.doc

גילוי דעת 74.doc גילוי דעת 74 תכנון הביקורת תוכן העניינים סעיפים 4-8 - 10-1 5 9 מבוא תכנון העבודה התכנון הכולל של הביקורת 12-11 13 14 15 תוכנית הביקורת שינויים בתכנון הכולל של הביקורת ובתוכנית הביקורת מונחים תחילה אושר

קרא עוד

PowerPoint Presentation

PowerPoint Presentation מבוא למדעי המחשב תירגול 6: כתובות ומצביעים 1 תוכנייה מצביעים מצביעים ומערכים, אריתמטיקה של מצביעים 2 3 מצביעים תזכורת- כתובות זיכרון הזיכרון כתובת התא #1000 #1004 #1008 ערך השמור בתא תא 10-4 לא מאותחל

קרא עוד

שיעור 1

שיעור 1 שיעור קצב גדילת פונקציות אנחנו בודקים את היעילות האסימפטותית של האלגוריתם, כיצד גדל זמן הריצה כאשר גודל הקלט גדל ללא גבול. בדר"כ אלגוריתמים עם "סיבוכיות" ריצה טובה יותר יהיו יעילים יותר מלבד לקלטים קצרים

קרא עוד

<4D F736F F D20EEF9E5E5E0E5FA20E3E9F4F8F0F6E9E0ECE9E5FA2E646F63>

<4D F736F F D20EEF9E5E5E0E5FA20E3E9F4F8F0F6E9E0ECE9E5FA2E646F63> משוואות דיפרנציאליות מושגי ייסוד: משוואה המקשרת את גורם הפונקציה עם הפונקציה והנגזרות שלה או הדיפרנציאלים שלה, נקראת "משוואה דיפרנציאלית רגילה" לפתור משוואה דיפרנציאלית פירושו, למצוא את הפונקציה המקיימת

קרא עוד

Microsoft PowerPoint - Lecture1

Microsoft PowerPoint - Lecture1 Computer Organization and Programming ארגון ותכנו ת המחשב - את"מ הרצאה מבוא 2 שפה עילית מול שפ ת מ כונה שפה עילית language) (High level שפת מכונה Language) (Machine תכנית בשפ ה עיל ית (C, Pascal, ) תכנית

קרא עוד

HaredimZ2.indb

HaredimZ2.indb יחידה :31חופפים משולשים נחפוף משולשים ונוכיח תכונות של אלכסוני משולשים שווה שוקיים ואלכסוני המלבן. שיעור.1חופפים במשולש שווה שוקיים נחקור ונוכיח תכונות של משולש שווה שוקיים נתון משולש שווה שוקיים שבו.

קרא עוד

1 תבניות טקסט מהי תבנית טקסט? שימוש ב- Characters Meta שימוש ב- Expression Grouping שימוש ב- Quantifiers תת תבניות הפונקציה preg_match הפונקציה preg_m

1 תבניות טקסט מהי תבנית טקסט? שימוש ב- Characters Meta שימוש ב- Expression Grouping שימוש ב- Quantifiers תת תבניות הפונקציה preg_match הפונקציה preg_m 1 תבניות טקסט מהי תבנית טקסט? שימוש ב- Characters Meta שימוש ב- Expression Grouping שימוש ב- Quantifiers תת תבניות הפונקציה preg_ הפונקציה preg all הפונקציה str_replace הפונקציה preg_replace 2 מהי תבנית

קרא עוד

א) ב) תאור המאפיינים העיקריים של מכשירי הון פיקוחיים שהונפקו ליום הישות המשפטית של המנפיק מאפיין ייחודי המסגרת / המסגרות החוקיות החלות על המ

א) ב) תאור המאפיינים העיקריים של מכשירי הון פיקוחיים שהונפקו ליום הישות המשפטית של המנפיק מאפיין ייחודי המסגרת / המסגרות החוקיות החלות על המ א) ב) 0 הון עצמי רובד הון עצמי רובד הון מניות רגילות,.,.0 הון עצמי הבנק נוסד בשנת 0 )ראה גם פרק ב' לדוח הדירקטוריון(. הבנק התאגד ונרשם ב ביום בספטמבר 0. הבנק הנפיק את מניותיו במועדים שונים החל מיום ההתאגדות.

קרא עוד

Slide 1

Slide 1 מבוא למדעי המחשב תירגול 4: משתנים בוליאניים ופונקציות מבוא למדעי המחשב מ' - תירגול 4 1 משתנים בוליאניים מבוא למדעי המחשב מ' - תירגול 4 2 ערכי אמת מבחינים בין שני ערכי אמת: true ו- false לכל מספר שלם ניתן

קרא עוד

Microsoft Word IG Lab - Configure Wireless Router in Windows Vista.docx

Microsoft Word IG Lab - Configure Wireless Router in Windows Vista.docx עיקרי טכנולוגיות המידע 5.0 6.8.3.9 מעבדה תצורת ראוטר ללא כבלים Router) (Wireless בחלונות ויסטה (Windows Vista) מבוא הדפס והשלם מעבדה זו. במעבדה זו, יהיה עליך להגדיר ולבחון את ההגדרות האלחוטיות על ה.Linksys

קרא עוד