תונשלב תיבושיח :תירבע רבע דיתעו ילוש רנטניו 1 תונשלב תיבושיח דוביעו תופש תויעבט תונשלב תיבושיח )computational linguistics( איה םוחת רקחמ רשקמה ןיב תונ

מסמכים קשורים
הצצה להליך התאמה של מבחן כושר קוגניטיבי מארהב לישראל – מבחן וודקוק-גונסון 3

eriktology The Prophets Book of Isaiah [1]

PowerPoint Presentation

ביה"ס היסודי ע"ש יצחק רבין, נשר

eriktology The Writings Book of Proverbs [1]

מצגת של PowerPoint

eriktology The Writings Book of Psalms [1]

Homework-L9-Skills-1.pub

HUJI Syllabus

eriktology The Prophets Book of 1 st Kings [1]

1 תבניות טקסט מהי תבנית טקסט? שימוש ב- Characters Meta שימוש ב- Expression Grouping שימוש ב- Quantifiers תת תבניות הפונקציה preg_match הפונקציה preg_m

Microsoft PowerPoint - l08rvlprf.ppt

פ רק כה ) פ ס וק ים ז-יא( ז ו א ל ה י מ י ש נ י ח י י א ב ר ה ם א ש ר ח י: מ א ת ש נ ה ו ש ב ע ים ש נ ה ו ח מ ש ש נ ים. ח ו י ג ו ע ו י מ ת א ב ר ה ם

ה ש ל מ ת מ ש פ ט ים ש א ל ה מ ס פ ר 1: ע ד ן ש ל מ כ ב י ת ל אב יב ב כ ד ור ס ל, ו ל כ ן מ ק פ יד ל ל כ ת ה ק ב וצ ה כ ש מ ת אפ ש ר ל ו. ל מ ש ח ק י

(Microsoft Word - \371\340\354\345\357 \340 \347\345\370\ doc)

משימה תכנית המתרגמת קטעי טקסט לשפה אחרת הקלט: קובץ המכיל את קטעי הטקסט וכן את השפה אליה רוצים לתרגם תרגול מס' 4: המתרגם שימוש במחלקות קיימות תכנות מתק

Microsoft PowerPoint - Lecture1

תהליך הגשה והנחיות כתיבה לעבודת גמר / תזה פרקים הקדמה תהליך הגשת עבודת המחקר ואישורה הנחיות תוכן לעבודת המחקר הנחיות כתיבה לעבודת המחקר הקדמה במסגרת ל

No Slide Title

מבחן סוף סמסטר מועד ב 28/10/08 מרצה אחראית: דר שירלי הלוי גינסברג מתרגלים: גלעד קותיאל, גדי אלכסנדרוביץ הוראות: א. בטופס המבחן 6 עמודים (כולל דף זה) ו

BIG DATA תיאור הקורס המונח Big Data הולך וצובר תאוצה בשנים האחרונות, הוא הופך למגמה רווחת בתעשייה. המשמעות הפרקטית של המונח Big Data הינה טכנולוגיות נ

Microsoft Word - tik latalmid-final

חינוך לשוני הוראת קריאה: נקודת מבט של הערכה: מהן הסוגיות שבהן ידע מחקרי עשוי לסייע בעיצוב מדיניות ועשייה?

ISI

תוכן העניינים

אוניברסיטת בן-גוריון בנגב NEGEV THE BEN-GURION UNIVERSITY OF

תוכנה חופשית מאחורי הקלעים? על סדר היום: קצת על עצמי מה זאת תוכנה חופשית? ההיסטוריה של תוכנה חופשית כיצד תוכנה חופשית משתלבת בשוק התוכנה היתרונות של ת

תרגול מס' 4: המתרגם שימוש במחלקות קיימות מחרוזות, קבצים, וקבלת קלט מהמשתמש

מבחן סוף סמסטר מועד א 15/02/08 מרצה אחראית: דר שירלי הלוי גינסברג מתרגלים: גלעד קותיאל, דניאל גנקין הוראות: א. בטופס המבחן 7 עמודים ו 4 דפי נוסחאות. ב

תוכן הגדרת שאלת רב-ברירה ]אמריקאית[...2 הגדרת שאלת נכון\לא נכון...8 שאלות אמריקאיות 1

מטלת סיום שם הקורס: מורי מורים "עברית על הרצף" מוגשת ל- ד"ר האני מוסא תאריך הגשה: מגישה: זייד עביר יסודי ספר בית קחאוש אלפחם אום 1

Slide 1

קובץ הבהרות מס' 1 21/07/2019 מכרז פומבי מספר 5/19 למתן שירותי ביקורת פנים לחברת פארק אריאל שרון בע"מ

הצעת פתרון בחינת הבגרות בעברית )שאלון א'( חורף 1023 שאלון 120, הצעת הפתרון הבחינה בעברית )שאלון א( נכתבה על-ידי דפנה עמית, סהר שוקר ועופר סלמן ש

I PRO Skills כישורים לעולם העבודה I CAN I AM I GROW I BUILD I NET I MIX כל הזכויות שמורות לג'וינט ישראל- תבת 2017

1 בחירת מנועי חיפוש באינטרנט תוצאות החיפושים באינטרנט, תלויות בבחירת מנוע חיפוש מתאים. אמנם גוגל הוא המנוע המוכר ביותר, ובכ"ז, לעתים השימוש במנוע אחר,

תוכן העניינים

PowerPoint Presentation

התגוננות בפני כוחות האופל

שלחן ערוך או"ח ח"ד

תהליך קבלת החלטות בניהול

אוניברסיטת בן גוריון בנגב תאריך המבחן: שם המרצה: מר אלכסנדר שקולניק, בשפת JAVA מבחן ב: מבוא לתכנות מס' הקורס : מיועד לתלמידי : הנד

Microsoft PowerPoint - lec2.ppt

תרגול 1

מטרות הקורס סמינר מחקר רגשות בשירות סמסטר א' תשע"ט דר' אריק חשין הקורס מיועד להקנות מיומנות בחשיבה מחקרית וביצוע מחקר באמצעו

Microsoft PowerPoint - CE_Candidates_2011.ppt [Compatibility Mode]

מבוא למדעי המחשב

TEL- AVIV UNIVERSITY SACKLER FACULTY OF MEDICINE THE STANLEY STEYER SCHOOL OF HEALTH PROFESSIONS DEPARTMENT OF NURSING אוניברסיטת תל-אביב הפקולטה לרפו

מצגת של PowerPoint

מקביליות

הכרת משאבי הספרייה קורס מקוון חיפוש במאגרי המידע ו- PubMed Biosis Previews, Zoological Record )לתלמידי החוג למדעי החיים( (Biosis Previews:

أكاديمية القاسمي- كلية أكاديمية للتربية מכללת אלקאסמי- מכללה אקדמית לחינוך مركز األبحاث מרכז המחקר שאלון דימוי עצמי חברתי אוניברסיטת בר- אילן הקשר בין

מקביליות

מצגת של PowerPoint

Overview of new Office 365 plans for SMBs

Microsoft PowerPoint - PDA trial-MELI ppt

<4D F736F F D20E1E9F7E5F8FA20E1F1E1E9E1FA20EEF2F8EBE5FA20EEE9E3F22DF2E1F820E4E5E5E420F2FAE9E32E646F63>

ההיבטים הסוציולוגיים של העדפה מתקנת

מצגת של PowerPoint

Microsoft PowerPoint - lecture02a-ling-general

מבחן בפיתוח מערכות תוכנה בשפת Java ( )

Counting the Omer Leviticus 23:15-16 And from the day on which you bring the sheaf of elevation offering the day after the Sabbath you shall count off

PowerPoint Presentation

Microsoft PowerPoint - Chap07cs.ppt

Office 365 ProPlus בחינם לסטודנטים באוניברסיטת בן גוריון בנגב הוראות סטודנטים באוניברסיטת בן גוריון בנגב יכולים להוריד ולהתקין את חבילת התוכנה Office

Microsoft PowerPoint - מפגש דבורה הרפז

א"ודח ב2 גרבימ הרש 1 רפסמ האצרה סקוטס טפשמו בחרמב םיווק םילרגטניא 13 בחרמב ינש גוסמ יוק לרגטניא L יהי :ידי לע ירטמרפ ןפואב ראותמה בחרמב קלח םוקע (x(t)

Microsoft PowerPoint - TeacherShortcoming_Goldstein

מסמך1

מרצים יקרים, אתר המכללה מאפשר למרצי המכללה להזין את פרטיהם וקורות חייהם. זאת בדומה לאתרים מקבילים של מוסדות אקדמיים בארץ ובעולם. עמודי המרצים נועדו לא

סרגל כלים ל-Outlook או לExplorer- מדריך למשתמש

תכנון אלגוריתמים עבודת בית 4: תכנון אלגוריתמים תאריך הגשה: 02: , בצהריים,תא מספר 66 בקומת כניסה של בניין 003 מתרגל אחראי: אורי 0

מספר נבחן / תשס"ג סמסטר א' מועד א' תאריך: שעה: 13:00 משך הבחינה: 2.5 שעות בחינה בקורס: מבחנים והערכה א' מרצה: ד"ר אבי אללוף חומר עזר

שידורי נשים - תחנת הרדיו "קול ברמה" שימוע בפני הרשות השנייה

Microsoft PowerPoint - L01-n.ppt

מבוא למדעי המחשב

עמק יזרעאל נתוני המיצ"ב של הרשות המקומית בטווח השנים תשס"ח - תשע"ב דיווח תוצאות מבחני ההישגים בסולם רב-שנתי עמק יזרעאל, דוח מיצ"ב רשותי רב-שנתי תשס"ח-

סכום במטבע מקומי ) ( , , , , ,

HUJI Syllabus

כתיבת דו"ח אבחון ארגוני

sfarad

Engage חשיפה ראשונית לפרויקט אירופאי ייחודי הקניית כלים למעורבות פעילה בנושאי מדע-חברה לכלל אזרחי העתיד חזית המדע והטכנולוגיה אוריינות מדעית לחיים שית

WinZIP תוכנה לדחיסת קבצים ספטמבר 2007

פרופיל ארגוני - תדריך להכרת שירות - מסלול מלא ציין כאן את מירב הפרטים המזהים: שם השירות, כתובת, שם מנהל השירות, שמות עובדים בכירים, שעות קבלת קהל, שעו

Cloud Governance הכלי למזעור סיכונים ומקסום התועלת העסקית

תאריך פרסום: תאריך הגשה: מבנה נתונים תרגיל 5 )תיאורטי( מרצה ומתרגל אחראים: צחי רוזן, דינה סבטליצקי נהלי הגשת עבודה: -את העבודה יש לה

וועדת הלסינקי מרכזית - מטרות ואמצעים

אוניברסיטת בן גוריון בנגב תאריך המבחן: שקולניק אלכסנדר שם המרצה: מר בשפת JAVA מבוא לתכנות מבחן ב: מס' הקורס : הנדסת תעשיה וניהול מ

תאריך עדכון:

אחריות קבוצתית

Westminster Leningrad Codex [4.20]

Riverwalk Plaza, West Virginia, USA Century Shopping Center, Chicago, USA Aviv Park in Pancevo, Serbia מצגת לשוק ההון ספטמבר 2016

התפתחות תקינה ופתולוגית

תמליל:

תיבושיח :תירבע רבע דיתעו ילוש רנטניו 1 תיבושיח דוביעו תופש תויעבט תיבושיח )computational linguistics( םוחת רקחמ רשקמה ןיב ןיבו יעדמ.בשחמה ןנשי יתש םיכרד תונוש ןנובתהל ב :תיבושיח תיווזמ הייאר,תחא והז םוחת םשיימה תוטיש תצותו יעדמ בשחמה,ב תנמ רוקחל תולאש דוסי,ה ןוגכ המ ונא םיעדוי רשאכ ונא םיעדוי הפש,יהש ךיא יתמו ונא םישמתשמ עדיב,הזה דציכ ונא םישכור ות.רכו תדוקנמ תרה,היינשה תיבושיח תמשיימ עדי תוטישו ה יעדמב,בשחמה תנמ רצייל תוינכות בשחמ תוניבמה רוביד,ישונא תומגרתמ הפשמ תיעבט תחא,תרח ו יל תורשקתמ ילולימ םע ינב שונא םיכרדב תומאתומה םישנ ו.םיבשחמל םיתעל םישמתשמ חנומב דוביע תופש תויעבט natural language( )processing סחיב תדוקנל טבמה.היינשה רמאמ דקמתמ הז,תויעבט תופש דוביעב םימושייב רמו בשחמה יעדמ םיכירצמה עדי םימדמ,ינושל תולועפ.תוינושל ןנשי תומגוד תובר םימושייל,הלאכ ןהו תחא הפשמ יטמוט םוגרת תוללוכ הרמה ;תרח רוביד בתכל ;ךפיהלו םיקשמימ הפשב תיעבט תוכרעמל ;תובשחוממ תוצמת יטמוט ;םיכמסמ תקידב תויא ;ןונגסו דועו הנהכ.הנהכו תובישחה םוחתה :המוצע תרושקת םע תוכרעמ תובשחוממ הפשב תיעבט ךופהת תוכרעמ ולאכ תושיגנל,רתוי רשפאתו רתויל,םישמתשמ ללוכ םישמתשמ םניאש,םיחמומ תונהיל תוריפמ תכרעמה ;תבשחוממה הנבה הריציו רוביד וביני תוכרעמ הנעמל ילוק יטמוט ורשפאיו הפה םירישכמ ל ;עגמ תרמה רוביד בתכל רשפאת םישריחל עומשל תוחיש ;ןופלט תרמה בתכ רובידל רשפאת םירוויעל םוגרת ;םה ינורטקלאה ראודה אורקל יטמוט ימוכס ךוסחי

עתק אם ניתן יהיה תוב עותק אחד של מדריך השימוש במכשיר כהו, ולהפיק באופן אוטומטי תרגומים פות כל המדינות בהן נמכר המכשיר. האפשרויות בתחום אינן מוגבלות, אך מצב המחקר הנוכחי ה כזה שרק מעט מהיישומים האפשריים אכן קיימים, יכות הקיימים אינה מספקת. האתגר 2 כדי לבחון את מצב המחקר הנוכחי בעיבוד שפות טבעיות, כדאי לבחור בשפה שזכתה להתעניינות מרבית: השפה האנגלית. בעידן האינטרנט קל למצ יישומים המשלבים בתוכם טכניקות של עיבוד שפות טבעיות, שכל החפץ בכך יכול להפעילם. שני יישומים נפוצים במיוחד ושימושיים במיוחד הם הבנת שות ותרגום אוטומטי. מנועי חיפוש באינטרנט הם יישומי מחשב המאפשרים למשתמש לפרט מספר מילות מפתח, ותים צירופים שלמים, ומספקים הפניות לאתרים שבהם מסמכים המכילים את מילות המפתח הללו. התועלת שמנועי חיפוש יכולים להפיק מטכנולוגיה של עיבוד שפות טבעיות היא ברורה: במקרים רבים ניתץ למצ פי, ף רבבות, מסמכים העונים לדרישות המשתמש, וכדי לברור את הנכונים והרלוונטיים מביניהם, על המערכת להבין את כוונת המשתמש באופן מדויק. לדוגמה, אם ברצוני לחפש מידע על ספרי תורה, אפשר שאספק למנוע החיפוש שתי מילות מפתח: ספרים + תורה. במקרה כזה, איני מעוניין לקבל כתשובה הפניה לאתר שבו מידע על תורת המספרים. כדי להתמודד עם הבעיה, קיימים אתרים באינטרנט בהם ניתן אול את המערכת שה בשפה טבעית, ולא רק לספק לה מילות מפתח. אתר אחד כזה ה,http://www.ask.com והדוגמות הבאות נלקחו ממנו. האתר מספק הפניות למסמכים בהם טמונה התשובה, וההפניות מוצגות כשות דומות ה המקורית? כל הפניה היא קישור למסמך שבו נמצאת התשובה ה. כשמפנים למנוע החיפוש את השה הבאה: Who was the second president of the United States? התשובות המתקבלות, כצפוי, הן נכונות ומדויקות )כלומר, ההפניות שמספק המנוע עונות על שות דומות מאוד ה המקורית(: Where can I find information about U.S. President John Adams? Where can I find encyclopedic biographical resources on John Adams?

ועוד הפניות דומות. ומת זאת, כשמפנים למנוע החיפוש את השה: Who was the United States president following Washington? מתקבלות ההפניות הבאות: Where can I learn about the historical political figure George Washington? Where can I find information about U.S. President George Washington? במילים אחרות, נראה שהתוכנה אותה מפעיל מנוע החיפוש אינה מבינה את משמעות השה! במקום להבין, נראה שהתוכנה מסתמכת על המה במילות מפתח, ומכיוון שהמונח Washington George מופיע בשה, ה מופיע גם בתשובות שהמערכת מספקת. ניסוי אחר ניתן רוך על שימוש בתוכנת תרגום אוטומטי של חברת,Systran הפתוחה ימוש באתר.http://babelfish.altavista.com/ התוכנית מאפשרת תרגום של מסמכים מאנגלית מונה שפות אחרות, ומהן לאנגלית. כדי לבחון את ביצועי התוכנה, השתמשנו בה כדי לתרגם את הפסקה הראשונה מתוך ים בארץ הפלאות לליס קרול מאנגלית לאיטלקית. המקור ה: Alice was beginning to get very tired of sitting by her sister on the bank, and of having nothing to do: once or twice she had peeped into the book her sister was reading, but it had no pictures or conversations in it, and what is the use of a book, thought Alice without pictures or conversation? התרגום לאיטלקית שהציעה התוכנה ה: Alice stava cominciando ad ottenere molto tired di seduta dalla sua sorella sulla banca e di non avere niente fare: una volta che o avesse pigolato due volte nel libro che la sua sorella stava leggendo, ma non avesse immagini o conversazioni in esso, e che cosa l uso d un libro, pensiero Alice senza immagini o conversazione? כדי לבחון את איכות התרגום, תרגמנו את הפסקה באמצעות אותה תוכנה. התוצאה שהתקבלה היא: שיל האיטלקית לאנגלית

Alice was beginning to very obtain tired of sitting from its sister on the bank and not to have nothing to make: once that or he had pigolato two times in the book that its sister was reading, but did not have images or conversations in it, and that what is the use of a book, thought Alice without images or conversation? מהי הסיבה לאיכות הירודה של ביצועי שתי המערכות הללו, הן הבנת השות והן התרגום האוטומטי? מהם הקשיים הטמונים ב הבנה של שות בשפה טבעית, או בתרגום משפה אחת לאחרת? התשובה ות ו היא ששפות טבעיות הן קשות מטבען. התהליכים הקוגניטיביים הכרוכים בהבנה וביצירה של מבעים בשפה טבעית הם כנראה מורכבים מאין כמותם, ובכל אופן אין בנו כלים להבינם כיום. כתוצאה מכך, הניסיונות לחקות באמצעות מחשב חלק מהתהליכים הללו נתקלים בקשיים מובנים. כדי להמחיש את העומק והמורכבות של שפה טבעית, נסקור להלן מספר שלבים נחוצים בדרך למימוש יישום מורכב, למשל תרגום אוטומטי, באמצעות מחשב. הסקירה שאינה תלוית שפה מאורגנת לפי רבדים שונים של עיבוד וני, המקבילים לרבדים שונים של מידע בני, והיא מתמקדת בתופעה אחת המקשה על עיבוד ממוחשב בכל אחד מהרבדים: בעיית ריבוי המשמעות. להלן נשתמש במונח ריבוי משמעות )ambiguity( כדי לציין תופעות בהן צורה אחת)למשל, מילה או משפט( ניתנת לניתוח במספר אופנים שונים, כך שניתן לייחס לה יותר מייצוג אחד. כדאי להעיר כאן כי הסקירה שלהלן מתייחסת ליישומים מורכבים; בשנים האחרונות מופעלת טכנולוגיה של עיבוד שפות טבעיות בהצלחה מרובה ביישומים המצריכים הבנה של שפה ברמה נמוכה יותר. דוגמות ליישומים כה כוללות סיווג של מסמכים לקטגוריות על פי נושם; תמצות אוטומטי של מסמכים ;)summarization( הפניה אוטומטית של דר קטרוני שאדם הצריך לטפל בו על פי תוכן המסר; ועוד כהנה וכהנה. תורת ההגה תורת ההגה היא תחום המחקר הבני העוסק בהיגוי, הן בפונטיקה העוסקת בצלילים המופקים על איברי הדיבור שלנו כשאנו מדברים, תכונותיהם הפיסיות, תפיסתם באיברי השמיעה והן בפונולוגיה, החוקרת את הצלילים הה ברמה מופשטת, מגדירה אותם ת צירופיהם ובוחנת את תפקודם במערכת הונית. מערכת ממוחשבת שהקלט או הפלט שלה הם שפה מדוברת חייבת לול ידע פתולוגי כדי לטפל נכונה בהגאים. ריבוי משמעות ברמה הפונולוגית

אטבתמ םינפב :םינוש המגודה הצופנה,םינופומוה םילימ תונוש תוגהנה,ההז ומכ םילימה מל weakn week תילגנאב ה הלקו. היעבה תניינעמ דוע,רתוי ןכש םימעפל הלימ תחא תיגהנ ההז ףוריצל בכרומה רתוימ הליממ,תחא ןוגכ הלקה םש( הלועפ ופה )לקה תמועל תרוצ(הלקה הבקנ תעדוימ ראותה )לק יוניכ(ו ןיינקה תייטנב ףוג ישי )דיחי תמועל תלימ(א שומישה ש תלימ ינפל הליה.) תויעב תורחא תורושקה תרותב הגהה תוללוכ םינופולא םיאגה( םיהז םיעצבתמה הנוש תולתכ,םתביבסב ומכ תומנופה מל תוגהנה /p,k,b/ f,x,v ןעיפוהב ירחא,)העונת םיאגה םיעצבתמה הנוש תולתכ רבודב,מל( םילדבהה עוציבב םירוציעה םיינורגה ןיב םירבוד םילארשי )םינוש.דועו היגולופרומ היגולופרומה תרקוח הנבמ.םילימה טעמכ ןתינ תוהל תעדה םושיי בשחוממ תופש דוביע א תויעבט ךירצי עדי :יגולופרומ טעמכ םושיי ךירצי ל תוחפה,ןולימ תכרעמו תדעוימה עצבל שופיח יטנגילטניא,טנרטניאב,מל קקדזת חתנמל יגולופרומ )morphological analyzer( תנמ תוצמל תרוצ סיסבה ךותמ תורוצ תויוטנ,םילימ תועיפומה םיכמסמב.תשרב ןאכ טלוב דחוימב יוביר,תועמשמה ו עבונ ןה יכילהתמ הריזג )derivation( ןהו יכילהתמ הייטנ.)inflection(,מל ןרוצ םויסה י- שמשמ ינשב :םינפ ןה ןויצל,תוכייש ףוג ןושאר,דיחי ןהו תכיפהל םש םצע.ראות םשל,ךכיפל השגדה י תיבה :תויועמשמ יתש יתיב הלימל.תיב תחא תומגודה תוחלצומה רתויב יובירל תועמשמ יגולופרומ תינבתה,הנמש ה רסירת תוחפל תויועמשמ,מל(תונוש תרוצ הבקנ םש ראותה,ןמש םש םצעה ןמש ףוריצב יוניכ ןיינק,רובח תלימ דובעשה ש הירחאו ופה,הנמ תועמשמב,דפס ףא תלימ דובעשה, ש הירחא םש םצעה ןמ ו ףרוצמ יוניכ ןיינק.)רובח ריבחת דחא ימוחתמ רקחמה םיירקיעה ב ריבחתה,)syntax( קסועה תולאשב תופרטצה םילימה םיפוריצל תופרטצהו םיפוריצה.םיזנפשמל ריבחתה םחיימ הנבמ ל עבמ,הפשב ו דימעמ תולאש תודבכ

יוביר.תועמשמ,המגודל טפשמב יתלביק הבינע יתשאמ שמשמ ףוריצ סחיה יתשאמ ריתכ ופה,יתלביק דועב טפשמבש יתלביק הבינע ישממ שמשמ ףוריצ סחיה ישממ יאוו םש םצעה.הבינע הנבמה יריבחתה ינש םיטפשמ םימוד הלא ריבס היהיש,הנוש ןכש םילדבהה ןיב םיטפשמה םיכירצ,ויהי בורק,יאדוול ףקתשהל.תועמשמב ךכיפל ןויסינ חתנמ יריבחת חתנל טפשמה יתלביק הבינע הילטיאמ שרדיי דדומתהל םע ינש םינבמה םיירשפאה :טפשמה הילטיאמ לוכי שרפתהל יאוו הבינע ריתכ.יתלביק תועפות תובר ריבחתב תופש תויעבט תומרוג םיישקל דוביעב.בשחוממ ןייצנ ןאכ דוע םייתש :דבלב יפוריצ יוחיא םימרוג םיתעל תובורק יובירל.תועמשמ,מל טפשמב רמאמ הז ראתמ רקחמ רושקה הנבהל הריציו הפש,תיעבט היושע תלימ רוביחה ו שרפתהל,ןוכנ תרבחמכ תומש הלועפה הנבה ;הריציו ךא הלוכי שרפתהל,יוגש תרבחמכ םש הלועפה הנבה םע ףוריצה הריצי הפש.תיעבט,ןבומכ לדבהה ןיב םיינשה יושע אטבתהל םוגרתב ןוכנ הפשל,תרחא תריציב תועמשמ.היוגש הרושק תרחא העפות םיפוריצל םייופ,םידבעושמ ןוגכ םייושעש ולא םיהל טפשמה רתועה שקיב תיבמ...טפשמה םא ךשמהה ףוריצה יופה ררחתשהל,תוברעב ידה אשונהש עלבומה ףוריצ הז ;רתועה םל םא ךשמהה קוספל,ותבוטל אשונה עמתשמה ףוריצה יופה דבעושמה תיב.טפשמה,ןאכ תכרעמ תבשחוממ דוביעל תופש עירכהל ןיב םינבמה.םינושה הקיטנמס הקיטנמסה תקסוע תועמשמב,םילימ םיפוריצ םיטפשמו.הפשב יוביר תועמשמה ליחתמ רבכ :ןולימב תובר ןה םילימה ןה רפסמ תויועמשמ,תונוש םיתעל תולדבנ ןוגכ(ירמגל הלימה,לבח תועמשמב טוח הבע רוזא,)יפרגיג םיתעלו תולדבנ,תוקדב ןוגכ הלימה השיגפ היושעש רתיהל תילגנ,meeting, appointment, date^ םאתהב,rendez-vous ךא.רשקהל ןיינעמ דוע רתוי יוביר תועמשמה,קומעה מל הז ץוענה תויורשפאב תונוש בושיחל חווטה םיתמכ.הפשב,מל הלאשה ימ ירבחמ ןוירוטקרידה ץילמה דחא לב?םידמעומהמ היושע יתש לבקל תובושת םש :תונוש,דחא דחא ירבחמ,ןוירוטקרידה רשא ץילמה ;םידמעומה טוריפ ירבח ןוירוטקרידה דילו,דחא תומש םידמעומה םהי.ץילמה

בעיות אחרות בעיבוד סמנטי קשורות בפתרון של התייחסויות פרונומינליות, או אנאפורות. למשל, במשפט התחביר מייחס מבנה לבל מבע בשפה, וגם ה מעמיד שות כבדות של ריבוי משמעות, רומז הכינוי ה צירוף שמני, זכר יחיד, שהופיע קודם לבן במשפט. הצירוף ה התחביר, אך אין מניעה ברורה לפרש את ההתייחסות כאילו היא רומזת הצירוף מבנה או אף הצירוף מבע. כמובן, מערכת ממוחשבת שלא תדע לפתור אנאפורות מסוג זה תיק לקשיים חמורים. פרגמטיקה גם כאשר למשפט משמעות ברורה, תים יש לו משמעויות משניות, התלויות בהקשר שבו המשפט מבוטא; הפרגמטיקה חוקרת תופעות ו. למשל, המשפט אני אפגוש אותך מחד עשוי להתפרש כמשפט חיווי, המציין עובדה; אך בהקשר המים, ה עשוי להתפרש כהבטחה: ובהקשר אחר ה עשוי אף להוות איום. תופעה מעניינת נוספת כרוכה בהנחות יסוד.)presupposition( מהמשפט מלך צרפת ה קירח משתמעת ההנחה שלצרפת יש מלך: מהמשפט אני מתחרט שהחלטתי לנסוע לצרפת משתמעת ההנחה שהחלטתי לנסוע לצרפת. מערכת ממוחשבת שאמורה להסיק מסקנות על סמך קלט בשפה טבעית תיץ לחשב הנחות יסוד ו כדי להגיע למסקנות הנכונות. תופעות אחרות שעוסקת בהן הפרגמטיקה כוללות שימושים לא מילוליים בשפה, כגון אירוניה, מטאפורה וכר. תופעות כו הן קשות ביותר יבוד ממוחשב. סקרנו יל את היישומים העיקריים של עיבוד שפות טבעיות ת הקשיים הכרוכים בהם. אין תימה, איפ, שמצב המחקר הנוכחי אינו מספיק כדי לתת מענה הולם ל הבעיות המתעוררות. למרות זאת, בעיות רבות הכרוכות בעיבוד ממוחשב של שפות טבעיות נפתרו לחלוטין, חרות נפתרו באופן חלקי, עבור שפות בהן הושקע מאמץ רב. לפיכך, שפות כמו אנגלית, גרמנית, או יפנית, אך במידה רבה גם שפות בעלות חוג משתמשים מצומצם יותר, כגון הולנדית, נהנות מיישומים רבים הכוללים טכנולוגיה עדכנית של בנות חישובית. השפה העברית, ומת זאת, אינה נכללת ברשימה זו. כמובן, העובדה שבעברית משתמש רק מספר קטן יחסית של דוברים הופכת אותה לאטרקטיבית פחות עבור מפתחי טכנולוגיות חדשות. כפי שהראינו יל, יישומים רבים בבנות חישובית מצריכים ידע מעמיק של השפה, ולפיכך הסבה של טכנולוגיה קיימת משפה אחת לרעותה דורשת משאבים מרובים. הוסף על

ךכ הדבועה תויעבש תובר ןה תוידוחיי תירבעל תופשלו( תוימש,תורחא לכש ורקחנ,)תוחפ האצותהו בצמש ה תיבושיחה,תירבעל דוחייבו םימושייה םיישעמה,ה יכב.ער רוקסנ ןלהל םיישקה םידחוימה הביצמש תירבעה ינפב יחתפמ םימושיי ב.תיבושיח ףסונ םיישקה םייטנרהניאה םיעבונה תובכרוממ רשוכה ינושלה,ישונאה תירבעה הפיסומ ינש םיכבדנ םיפסונ :םיישקל בתכה.היגולופרומהו ירבעה בתכה ינש םיישק ביצמ בתכה ירבעה ינפב יחתפמ תוינכות דוביעל בשחוממ :הפש,תישאר הנוש ןמ בתכה,יניטלה ורובעש וחתופ בור תויגולונכטה בורו םיה םייבושיחה ;םימייקה,תינש בתכנ ןימימ,לאמשל ךכבו ענומ הבסה הטושפ םימושיי םימייק וחתופש רובע םיבתכ םיבתכנה לאמשמ.ןימיל תיבפלאה הנושה ךירצמ תוסחייתה תדחוימ וליפא םימושייב םיטושפ,תיסחי ןוגכ יעונמ שופיח טנרטניאב תונכות ההגה.תיטמוט,ןבומכ תופשל תויפוריא תובר תיבפלא הנוש הזמ שמשמה םא,תילגנאה תפסותב רפסמ ןטק םינמיס םייטירקאיד ןוגכ( תויתה תונייצמה תועונת טלמה,)תינמרגב םאו ןיטולחל,מל( תיסור.)תינווי,ךכיפל הנכות תננכותמה דובעל תיבפלאב דחא תשרוד הבסה המאתהו תיבפל.רחא םל תייעב בתכה ירבעה הרומח,רתוי רקיעב םושמ בתכהש הכ.רסח תונורסח בתכה ירבעה דמוע ןנר ;1( ;3!5 ;76 1)78 ירקיעהו םהבש קלחש לודג ןמ היצמרופניאה הנומטה םילימב וניא עבומ :בתכב,ונייה בתכה ש,דוקינה רסח ירבעה בתכב תוגצוימ ןניא תועונתה בור.חפנה,ךדיאמ קלח םינמיסהמ םישמשמ םיכרצל,םינוש מל תועונתכ.םירוציעכו היעב תפסונ תומפרומש תטובמה םילימכ תויאמצע תופשב,תובר ןוגכ תולימ,םחי תולימ רוביח,רושיקו תולימ דובעש,תויוותו תטבתמ םינרוצכ םירובחה םילימל. ופכ אצוי,הלא מ תגרד יוביר תועמשמה תיגולופרומה ההובג.דחוימב יפ ןנר 1( ) תונוכת בתכה ירבעה תיבמ ל ךכ םישימחבש םיזוחא תוינבתמ םילימה תוירבעה ןה,םיפרגומוה רמו םיכייתשמ רתויל ךרעמ ינולימ,דחא עצוממבו תולבקתמ עברא רתויו תויורשפא האירק ל 1 םירפסמה םינמסמ םיטירפ :םייפרגוילביב ר המישרה ףוסב.רמאמה

.הלימ,ותמועל תונעוט,רוטנב ל גנא בגשו 10( ) יכ בורק םישישל םיזוחא םילימהמ תולבקמ מ רתוי,דחא ןהמ שיו,םיינשמ רתוי דועב שו תמ םילימ תוצופנ הפשב לבקתה עצוממ 2.7 םי.הלימל הניחבב םיטסקט,םילודג ורחבנש ךותמ תונותיעה וליכהו 40,000 תוינמת,םילימ אצמנ יכ רפסמ םיה עצוממה הלימל,2.1 םישימחו השימחו םיזוחא ןמ םילימה ולביק רתוי מ דדוב ;66(.)90 יעצמאכ רבגתהל,תועמשמה יוביר םרגנה בקע,בתכה תויעב ןנר עיצה בתכ,ימנופ שמתשמה תויתב תיבפלאה יניטלה רפסמבו םינמיס םיפסונ םיאצמנה תדלקמ בשחמה! 75(.)76 בתכה לבקתה,ןקתכ ןה ילארשי ןהו,ימלניב ןכו וחתופ תוינכות בשחמ תוריממה בתכה ימנופה בתכל ירבע ךפיהלו םא( יכ ןוויכה ךופהה,לקתנ,ןבומכ תייעבב יוביר תועמשמה.)תיטנרהניאה היגולופרומ תירבע םרוג ףסונ םיישקל םידחוימה דוביעב בשחוממ תירבע היגולופרומה.הפשה יכילהת הייטנה םיססובמ םרקיעב רושרש,םינרוצ ומכ תופשב תויפוריא.תובר א ש ינרוצ אשיר ינרוצו,אפיס םיתעלו םיפרטצמ יגוס ינש םינרוצה סיסבל ןוגכ(דחא תייטנב ופה.)ו+רמש+ת רתי,ןכ הנתשמ תרוצ סיסבה תויטנב.תונושה,ךכ,מל חונ תרל תרוצ רבעה ופה סיסבכ,הייטנה ךא ןמזב דיתע הנתשמ סיסבה הזה,מל( רמש ךפוה,רומשל ןוגכ,רומשא רומשת.) וכו םל תויעב הייטנה תודמגתמ לא לומ תויעבה םיביצמש יכילהת הריזגה, רקיעבו ןונגנמ תריצי םילימה ססובמה בוליש שרוש.לקשמו ןאכ םניא םיכילהתה םינתינ ריתל תועצמאב רושרש,דבלב םישרדנו םינונגנמ םיבכרומ רתוי תנמ ןייפ.םת,טרפב דועב יכילהתש רושרש םינתינ שומימלו(ריתל )יבושיח םייוטיב תועצמאב םיירלוגר תויפוס םיבצמ תונוכמו האר(,ןלהל קרפ,)4 ךכבו חטבומ שומימ ליעי,םיכילהתה השק םא(רתוי יכ יתלב )ירשפא ראתל םיעצמאב הלאכ יבוליש.לקשמ שרוש 3 רבע קרפב הז תורקסנ תוכרעמ תובשחוממ תומייק דוביעל ינושל. תורמל,םיישקה תורמלו ןיינעה ירחסמה טעומה תיסחי הפשב,תירבעה שדקוה ץמאמ

בר חותיפל םימושיי,תירבעל רקיעב הימדקאב ךא.היישעתב בקע םיישקה םיבורמה ביצמש דוביע יטנמס,יטמגרפו תודקמתמ תוכרעמ תומייק םידברב םייגולונופה םייגולופרומהו,הפשה םיתעלו.ריבחתב ןוויכמ א המקוה םויה דע תיתשת תמלוה תיבושיח ןורתפל תויעב דוסי ירגאמ,ןושל תגפהל תונכות,םייגולופרומ םיחתנמ,םיבשחוממ םינולימ,תיגולופרומ תומימע תעיבקל קלח רביד תעיבקלו תועמשמ תינולימ דומעתש תושרל םירקוחה,ישפוח השק תונבל תוכרעמ תובכרומ,רתוי ןוגכ תכרעמ םוגרתל,יטמוט ןכש ולא תוחינמ ךרדב ל המויק תיתשת.וזכ תובר ןמ תודובעה תוקסועה ומסרפתה תעה בתכב תירבע,ת ישפח אציש רל צוהב הדעוה ל תיבושיח תטיסרבינ רב ןליא לחה ירשתמ,ל שת ךישמהו םסרפתהל דע תנש,1989 זאש ףלחוה תעה בתכב םסרפתמה תירבע דע.םויה הברמל,רעצה םע םינשה ןטק םקלח יסחיה םירמאמה םינדה ב תיבושיח הו רועיש םירמאמה םינדה ב תילמרופ.תישומישו רבכ ןויליגב ןושארה עיפוה רמאמ ןדש םתירוגלאב תריציל םילימ.)81( םתירוגלא ליבקמ ל יגולופרומ םסרופ Price םייתנש רחמ רתוי.)83( ןויליגב ינשה עיפוה ריצקת תדובע,טרוטקוד יפכ הארנה הדובעה הנושארה הנדש םוגרתב יטמוט תירבעמ תילגנ,)82( ןכו ראות םתירוגלא יוהיזל שרושה םילימ.)65( וליפא הטיש תיטמוט יוהיזל בתכ די הראות דחאב תונויליגה,םינושארה םא יכ ראות םש שומימ ה.)96( רוקמ ףסונ תודובעל רקחמ ץבוקה תיבושיח תירבע,)7( וב וצבוק םירמאמ וגצוהש ימיב ןויע םינשב וכרענש 1988 1990 עדמה דרשמ.היגולונכטהו תרעהכ בגא ןייצנ םיסנכש הלא ושדחתה הנורח תוגצומו םהב תודובע תוכרענה,לארשיב םע שגד תודובע תוקסועה תיברעבו.)101( הריקסה ןלה תרדוסמ יפ,םיאשונ בו אשונ ןוימה.יגולונורכ בטימל,ונתע הריקסה תללוכ תודובעה תונדה דוביעב בשחוממ תירבע ומסרפתהש דע.םויה היגולופרומ ןנר 1( ) ראתמ פמ ןולימה ירוטסיהה הימדקאה ןושלל תירבעה לחה(,)1964 מ טקייורפכ בשחוממה יניצרה ןושארה דוביעל.תירבעה םל הארנ טקייורפש הז ןתינ ןויפ שומישכ בשחמב יכרוצל םושיי תנכה(ינושל,)ןולימ ל דוביע ינושל בשחוממ.יתועמשמ תרגסמב המוד ןתינ לול

תודובע ןתרטמש שומיש בשחמב ףוסי היצמרופניא תיטסיטטס םיפ ;71( ;72.)73 ןמ רבעה רחאה תבצינ ותדובע רזא,)38( ראתמה םתירוגלא מ הל הלימ העיפומה,ארקמב א הסונ.בשחמ תכרעמה תבשחוממה הנושארה דוביעל תירבע,התנבנ,הארנכ הקיוש תישארב תונש.םישישה תכרעמה )35( הבתכנ תפשב רלבמסא בשחמ, וקליפ דמעש תושרל.ל הצ ב,הנמז וז תכרעמ תיסיסב,רתויב םל היגשיה :םימישרמ רמאמה ראתמ ןה יגולופרומ מ תכרעמ םשה ןולימ( םיפה םוה הסריגב )המסרופש ןהו םושיי ה ךרוצל תנכה היצנדרוקנוק תמישרו.תבומ רמאמב ףסונ )29( ראתמ הקיוש קלחה לפטמה םילימב.תויופ הדובע וז השמיש אובמ טקייורפל ףקיה בחר קסעש םיטביהב םינוש,תיבושיח דוביע תופש תויעבט רוזחאו :עדימ טקייורפ תולאש(ת ושה,)תובושתו לחהש,1967 ב ירזעיבא תושארב לקנרפ רחאו ךכ הקיוש בקעי!30(.)4 4 ;52 ססבתה טקייורפה דסמ םינותנ 102 םיכרכ םע תולאש תובושתו תויתכלה ופסאנש ךלהמב ףלאכ עבראו תמ.םינש תרטמ טקייורפה התייה,עדימ רוזחא תויצנדרוקנוק תיינב אתליאש יתוריש ןתמו.םינותנה דסמב ושמשיש ךרוצל ךכ היה חרכה חתפל םי דוביעל,ינושל טרפבו םימתירוגלא ל יגולופרומ.)37( וחתופ םימתירוגלא הריציל תיטמוט תורוצה תויוטנה תוירשפאה תלימ סיסב, ללוכ ולא תולבקתמה האצותכ תפסותמ תולימ,םחי,רוביח דובעש.רכו סיסב םתירוגלא הריציה הנבנ ץבוק ובו םילימה תוירבעה,תוירשפאה ;תוינבת 2,500,000 כ ןמזב תינכות תפומ טלקה תליממ תוירשפאה תוילימה הריסמה הרתונש הרוצה םא תקדובו צמנ.תויוטנה תורוצה ץבוקב םיבלושמ ךכ םייגולופרומ הריציו המ תכרעמב דוביעל בשחוממ םילימ םא( יכ.)תינרדומ תירבע רחמ רתוי חתיפ הקיוש תישיב תכרעמ ל יגולופרומ,תירבע םשב,םילמ תרגסמב טקייורפ םילמ בר זכרמה היגולונכטל תיכוניח.)31( תכרעמ וז המאתוה תירבעל,תינרדומ השמישו םיסב ינשל םימושיי :םיירקיע תנכות דוקינ ןולימו ישומיש ליכמה.יגולופרומ םימושיי הלא וכפה םיחותיפל םיירחסמ ךכיפלו הדמעוה,תכרעמה התייהש הארנכ הפיקמה רתויב החתופש,תירבעל תושרל םירקוחה ב.תיבושיח הריקסל הרצק שו תודובעה,וללה האר הקיוש.)32( השיג הנוש היגולופרומל תירבעה חתיפ.ןנר ךמתסהב ויתונחבא תועגונה תולבגמל םיישקלו ביצמש בתכה ירבעה דוביע בשחוממ האר(

,)ליעל עיצה ןנר בתכה ימנופה ו סיסב בתכ הז חתיפ ןנר ןווגמ בחר,בשחמ תוינכות תינכות ןהבו דוקינל בשחמ תויצנדרוקנוק תנכה,)4( תוחתפמו,)3( החתופש דחוימב רובע דסמ םינותנ יקספ ןיד,)5( תוינכות ל הריציו םייגולופרומ ;6( ;12 ;33 )34 ןכו תוינכות תוריממה בתכ ירבע ליגר בתכל ימנופ.)78( הנורח ובלוש םימתירוגלאה םיינושלה חתיפש ןנר ךלהמב םינשה רפסמב םירצומ,םיירחסמ םהבו תונכות רזע רקהל םירוויעל(טסקט ידבכו,הייאר םיטקלסידל,)םינזכרמלו עונמ שופיח ינושל בר תכרעמו רוזחא.עדימ ןאכ יר ןייצל יתש תוכרעמ ל יגולופרומ,תירבע ובלושש תוכרעמב תובכרומ,רתוי תועצבמה.יריבחת תחאה קלח תדובעמ טרוטקודה ןהכ ;18(,)19 הו יגולופרומה הב השענ ינשב םיב בב ןושארה צומ תינכותה םיניערגה םיירשפאה,הלימ בבו ינשה תורצוימ ךותמ ןוקיסקלה תויטנה תוירשפאה,ןיערג תוושומו תלימל.טלקה ןבומב,עודי יהוז הטיש המודה ךילהתל ראותש ליעל.)37( תכרעמה תרחוב ה ריבס ה רתויב,הלימ יפ ילוקיש רשקה םיראותמה ילכ.הפדעה רועיש החלצהה חוודמה םישימחכ,םיזוחא ךא ןיא הכרעה תטרופמ.תצותה תכרעמה,תרחאה,h u h u החתופ הטיסרבינב תירבעה םיוריב הבו ביכר ה םידקהל ותרטמש יגולופרומ יריבחתה תססבתמ ה תטיש.)74( ןולימ,ובו ל,ךרע עדימ יקודקד ;ויתויטנ הצובקו םיקוח םיראתמה םינרוצה הפשב ינפו םתופרטצה םיסיסבל.םינושה ףסונ ךכ תולפוטמ תוילימה תויושעה ףרטצהל אשירכ םילימל.דרפנ יגולופרומ ןפ דחא תכרעמ תבשחוממ,תירחסמ,Context התרטמש רוזחא עדימ ךותמ םיכמסמ.)25( תרטמ תכרעמה ףול םיכמסמ ( )תילגנאבו ךותמ דסמ םינותנ רדגומ,שארמ יפל השירד הנותנ.שמתשמה ךרוצל ךכ הרדגוה הברק תיטנמס םילימ תרשקמה םילימ תונוש תורושקה,תיגולופרומ תיטנופ.תיטנמס תכרעמה הניא תשמתשמ,ןולימב ןיאו רמאמב ןויד הפקיהב תוכיאב.היתצות תכרעמ תירחסמ,תרחא,דגבא החתופ זכרמב יעדמה תרבח מבי ;10( תססבתמ.)11 ןולימ ןב 25,000 ונממ,םיכרע ןתינ תוהזל יפלא תמ םילימ תוירבע (.)ןהיתויטנ םילימה ןוקיסקלב ורחבנ ךותמ םילימה תוישומישה. תינרדומה תכרעמה הבלוש רפסמב ידבעמ,םילילמת השומיששכ ירקיעה ןוקית תויועט.ביתכ לגס )87( רזענ תכרעמב וז ידכ

תונבל חתנמ יגולופרומ ישפוח :שומישל חתנמה הנבנ ךות תריצי םיסיסב םיירשפא,יטמוט םתייטה ב םינפה םיירשפאה םתקידבו לומ חתנמה.םייקה תגפה תיגולופרומ תומימע )disambiguation( בורב תוכרעמה וראותש ףיעסב םדוקה הצמתמ תלועפ חתנמה יגולופרומה תקפהב םיה םיירשפאה.הלימה,,רומאכ םיה רפסמ םיירשפאה הלימל תעצוממ הובג האוושהב(דחוימב תופשל.)תויפוריא ךכיפל שי,ךרוצ םימושייב,םיבר גיפהל תומימעה :תיגולופרומה,עובקל ךות שומיש ילוקישב רשקה רצק יקוחו,הפדעה הזיא ןמ םיה םיירשפאה הלימ תמיוסמ ריבסה.רתויב םנשי השו םינפ םיירקיע שומישל רשקהב ךרוצל תגפה.תומימע,ןושארה ש חוטבה,רתויב ףוסיא המישר הצממ תורדס,םילימ בש תחא ןהמ הלימ תבורמ,תועמשמ ךות 'ןויצ ינדי תועמשמה המיאתמה הלימה רשקהב וב.הנותנ ןורתפ גוסמ,הז ובש תורדס םילימה ןה ךרב,םייתש עצוה רבעב ;)45( רורב יכ הפשל ומכ תירבע ךורכ תעקשהב םיבאשמ,םימוצע הארנכו וניא.םישי ןורתפ המוד עצומ ןהכ 18( ) ו רגניול.)22( קודקד ךותמ םילימ רצקה רשקהה תוד עדימ ץוליח רחא ןפ.ןותנ ןויערה דמועה דוסיב הטישה וליאש היה ונתורשפאב חתנל טפשמ ןותנ,יריבחת ירה הש היה גיפמ קלח לודג ןמ תומימעה.תיגולופרומה םנמא יריבחת רקי הניחבמ,תיבושיח ךא םא ןותנ קודקד ראתמה ריבחת,הפשה ןתינ רצייל ונממ יטמוט,עדימ ש וסיסב רשפא היהי גיפהל תומימעה תוריהמב.תוליעיבו הטיש,וזכ םע םושיי ןוקיתל תיגש, העצוה ץרה ןומירו ;55(.)14 השיגה תישיה העיצמ שומיש םא.תויטסיטטס תוטישב ןותנ רגאמ ןושל )סופרוק( ובו םיניוצמ הלימ ל םיירשפאה הי םדצבו ןוכנה ה סופרוק( הזכ בייח תויהל השעמ,)םדא ןתינ שמתשהל תויטסיטטס תוטישב תנמ דומלל םינותנ ךותמ רגאמה םכיהלו תומגוד,תושדח ןיידעש.ונמוס ןויער הז שמומ,רגניול ןנר יתיאו :)66( רקיע הדובעה םתירוגלא בשחמה יטמוט בוריק בוט תורבתסהל תילקיסקל ופרומה הלימ טסקטב.ןותנ תורבתסהה תילקיסקל ופרומה םיוסמ הלימ תורבתסהה הש ןכא ה ןוכנה הלימה

)במונחים סטטיסטיים, זוהי ההסתברות המותנית של הניתוח בהינתן המילה(. בעבודה מתרת דרך שיטתית לחישוב הסתברויות ו מתוך מאגר לא מתויג, כלומר קורפוס גדול של משפטים לא מעובדים. בהתבסס על ההסתברויות המורפו לקסיקליות, מציע המאמר לבחור ל מילה רב משמעית בטקסט את הניתוח שהסתברותו גבוהה ביותר. העבודה מומשה בעזרת המנתח המורפולוגי של יבמ )10(, תוצאותיה הוערכו בפירוט ושיעור ההצלחה המדווח גבוה. פתרון דומה מציע גם סגל )24(: ה מנתח טקסטים תוך שימוש במנתח המורפולוגי שלו שהוזכר יל; לאחר מכן נבחר ל מילה בטקסט ניתוחה הסביר ביותר, על פי הסתברויות שחושבו מתוך קורפוס מנותח לא גדול. בשלב הבא מתקנת המערכת את החלטותיה תוך הסתמכות על הקשר קצר)מילה אחת מכל צד(. גם פקודות התיקון הללו נלמדות באופן אוטומטי מתוך הקורפוס המנותח. בשלב האחרון מתוקן הניתוח על פי ניתוח תחבירי של כל המשפט. התוצאות המדווחות הן מצוינות, א שזמני הביצוע של התוכנית אינם קבילים )זמן הריצה המדווח על שני מאמרים ה שלושים דקות(. ללא הניתוח התחבירי, התוצאות הן טובות וזמן הביצוע סביר. גישה שונה, אף היא מבוססת על שיטות סטטיסטיות, הציעו דגן יתי )46(. השיטה מתבססת על הבדלים בין מיפוי של מילים למשמעויות בשפות שונות, ומניחה שבשפה אחרת למשל, אנגלית קיימים כבר נתונים סטטיסטיים המאפשרים לבחור את הקריאה הנכונה של מילים רב משמעיות. אם נתון מנתח תחבירי המזהה קשרי תפקם)כגון נושא פועל, או פועל מושא וכדומה( בשפת המקור)כאן, בעברית(, ניתן למפות את הקריאות השונות של המילים בכל מופע של קשר כזה פה האחרת ולהשתמש בנתונים של השפה האחרת כדי לבחור את הקריאה הנכונה בשפת המקור. השיטה נוסתה על עברית ועל גרמנית, תוך שימוש באנגלית כשפה השנייה, והניבה תוצאות טובות. הבעיה העיקרית בשיטה זו היא התבססותה על מנתח תחבירי, ולו חלקי, ברית. תחביר עד היום טרם נכתב מנתח תחבירי מקיף, המבוסס על מודל תיאורטי מקובל, עבור השפה העברית. הבעיה העיקרית בדרך מנתח כזה היא שטרם נכתב דקדוק חישובי מקיף וממצה עבור העברית. ספרי הדקדוק המקובלים, ף ו המכוונים לתיאור פורמלי של השפה )2; 16; 26; 27; 28; 53(, אינם מספקים לצורך עיבוד ממוחשב.

ןויסינ ןיינעמ חסנל קודקד יבושיח רובע הפשה תירבעה השענ Price ףוסב תונש םישישה.)84( הדובעב וז ראתמ רבחמה קודקד הנבמ םיפוריצ ריבחת תירבעה :תינרדומה חסנמ 179,םיקוח םהמ וקדבנ קר.111 םיראותמ 26 םיטפשמ קודקדהש חילצה,חתנל םלוכ םיטושפ םירצקו ל( רתויה 10 )םילימ םבורו םימוד דמ הז.הזל הדובעה התייה םנמא,תיצולח ךא היגשיה ויה.םימועז יריבחת ( ינכמ )בשחוממ טסקט עצוב רזא.)8( הדובעה תראתמ םתירוגלא ל יריבחת תטרפמו םיעבראכ.םיקוח קודקדה הקול :רתי תריציב םיקוחה םניא םינדועמ קיפסמ ורשפאיו תריצי םינבמ םיבר םניאש םייקוח.הפשב םל הערגמה תירקיעה הדובעב וז םתירוגלאהש שמומ םלועמ ו ןכ קדבנ.ישעמ חתנמה יריבחתה ןושארה תירבעל יפכ,HUHU הארנה חתופש גרובנרינ רשאךבו הטיסרבינב תירבעה םיוריב.)74( תכרעמה תססובמ תותשר רבעמ תובחרומ )ATN( ו תלבקמ טלקכ םיטפשמ איק,תדקונמ תחתנמ םילימה יגולופרומ זאו תחתנמ הנבמ.טפשמה השק תעדל קוידב המ היה ףקיה קודקדה בתכנש,תכרעמל םל יפ טוריפ יקלח רבידה ונייצש,םירבחמה יפלו רית רפסמ,םיקוח הארנ ףקיההש היה.בחר חתנמה פ,רמו(יטסינימרטד יא לוכי עירכהל ןיב תויורשפא תונוש תומדקתהל ךלהמב )ה קיפהו םיה םיירשפאה ל.טפשמ הדובע תמדקומ תרחא תדובע טרוטקודה ןהכ.)18( ןהכ ףקת היעבה יריבחת בלושמב םע,יגולופרומ ו שמתשה בתכב ירבע דקונמ.טלקכ חוודמ יזוחא החלצה,םיהובג א חתנמהש ו הסונ םישימח םיטפשמ.דבלב רפסמ םיקוחה םייריבחתה קודקדב.םישיש בתכש תחא תויעבה תוירקיעה תכרעמב וז קודקדהש בלושמ קלחכ ילרגטניא תינכותב,ה ךכיפלו יוניש ןוכדע דחא יקוחמ קודקדה ךירצמ ןוכדע תינכותה.הלוכ קבלא )9( העיצמ תטיש יריבחת תינשדח.תירבעל ידכ רבגתהל יוביר תועמשמה יגולופרומה םילימה רדס ו ישפוחה תיסחי, ךותמו תוננובתה ךילהתב ישונאה תנבה הפש,הבותכ טרפבו תגפה,תומימעה העיצמ םתירוגלא, ובש תלבקמ הלימה תועמשמ הדיחי דימ הירק םע ל הצצה המידק לו ןוקית תויועט,רוח ךות תורזעיה ןווגימב,םיקוח םהמ םייחרכה םהמו יקוח םינכדעמ,םירציימה,הפדעה םילטבמו תויפיצ עגונב

דיקפתל הלימה תמיוסמה.טפשמב תכרעמה תראותמה תללוכ 192 םיקוח,םייריבחת םיקיפסמה ידכ קיפהל האירקה הנוכנה 98 כל םיזוחא םילימהמ טסקטב ןב האמ.םיטפשמ רמאמה גוס שארמ ליבגמ יטפשמ טלקה הלאכל טהבש רדס םילימה, לבוקמ הנבמ טפשמה רדוסמ עובקו םיטפשמהו םימ."םירורבו ומכ,ץכ ןיא רמאמה טרפמ םיגדמ ה יריבחתה קנעומה,םיטפשמל א קר תגפה תומימעה.תיגולופרומה םינותנ םיעוציבה םייבושיחה םניא תכרעמה.םינודינ,ןבומכ יריבחת יולת קודה היריתב תינושל.יהש םירושעה ינשב תוירית רפסמ תונמתסמ םינורחאה תוחסונמה תוינושל ילמרופ תיסחי תומיאתמו רתוי תורחאמ םישומימל.םייבושיח תויריתה וללה ןייפאמ חוכ רית )תויביסרפסקא(יבושיח הובג,תיסחי בו ןפ הובג הזמ רתוי םיקודקד ירסח.רשקה ןבור תושוע שומיש הזכ רחא תלועפב הדחאהה,)unification( ןבורו תוגציימ עדימה ינושלה,ןוקיסקלה,קודקדה םיגוצייה םיעבמ ףאו צות ה הלוכ םינבמב םיבכרומ םייורקה ינבמ תוינוכת )88(.)feature structures( ןיב תויריתה :וללה l fg Head-Driven Phrase - HPSG;(51; 58) Lexical Functional Grammar - CG; (57) Tree-adjoining Grammar - TAG; (80-79) Structure Grammar 93 )54;.)Categorial Grammar תוירית ולא ומודו םירקחמל םייטרית,ב םהיתצותש םיקודקד םייבושיח םיראתמה תועפות תונוש ןווגימב בחר תופש.תויעבט בשחתהב תוילמרופב תוירית,ולא ןתינ סחייתהל ןהילא לאכ תופש בשחמ,תויליע לאו םיקודקדה םיראותמה תויריתב ולא לאכ תוינכות.בשחמ םיקודקד ולא םינתינ הקידבל הצרהלו תועצמאב.בשחמ הנכמכ ףתושמ יל רתויב תוברל תויריתהמ תוינושלה וללה ןתינ רוחבל םזילמרופב ארקנה,patr םנמאש וניא הירית,תינושל ךא רשפאמ חוסינ םיקודקד םיססובמה ינבמ תוינוכת הדחאהו הלועש הנקב דחא םע תויריתה תונושה! 89(.)88 קודקד יבושיח הפשל תירבעה דמועה ינפב ומצע,רמו( וניא בלושמ תנכותב ) בתכנ הנושארל רנטניו.)98( הדובעה הל הריקס רפסמ םימזילמרופ םיינושל םתמאתהו תירבעל,)102( קודקד ןטק patr^ 15( ) קודקדו ףיקמ,רתוי ססובמה תונורקע היריתה תינושלה,lfg םא יכ וניא דומצ הילא ב היטרפ ;98( ;103.)104 קודקדה קיפמ רית :לופכ ןה הנבמה ילמרופה יטפשמ טלקה םיחנומב( םיקודקד )םייביטרנג ןהו הנבמה ילנויצקנופה.םה קדבנ רגאמ ןטק םיטפשמ

,הלק ךותמ וחקלנש ןותיעה,רעש החלצהה רועישו סופרוק הז םיעבש השימחו.םיזוחא תרגסמב המוד הדבע,רהצי הדקמתהש םיפוריצב םיינמש.)17( הדובעה תקפסמ רית טרופמ ףיקמו םיפוריצ,הלאכ השיגב תעפשומה מ,LFG קודקדהו שמומ.קדבנו תודובע תורחא תוקסועה ריבחתב תירבעה השדחה השיגב,תיבושיח יפל תטיש היריתה תינושלה,HPSG תוללוכ ןוקיסקל יבושיח תכרעמ ופה ירבעה ;)91( קודקד יבושיח ןטק תירבעל )99( ותבחרהו ריתל םיפוריצ םיינמש ;)100( ריתו הנבמ יפוריצ הקיז.)95( םיקודקד םייבושיח םיבתכנה תוביבסב תוססובמ הדחאה םינתינ,שומישל,יטרית ןה ל ןהו,הריציל ךא תויעבה תוכורכה תריציב םיטפשמ ןה תושק,תוכובסו ו ישעמ םיקודקד םיננכותמה ךרוצל ווי םיטפשמ תריציב תוכורכה תויעבה.הריציל שמשל םיפקות רצנ ןהד דדחלאו הרדסב.תודובע רצנ ןהד הבסה תכרעמה החתופש דדחלא תריציל םיפוריצ םיינמש.)47( תודובעב תורחא םה םיקסוע תויעבב תוכורכה תויפיצפסה תריציב תוכימס יפוריצ,)49( םיתמכ )48( יפוריצו סחי.)50( תודובע תודחא תינכות הנושאר תריציל רוביד תראותמ בשחמ לצא רפל.)20( רבודמ תרצויה תכרעמב ןותנה טלקמ יתוכמ רוביד בתכב םוקמ ללוכ(יטנופ,)םעטה ךות תפה יקוח רבעמ םישמממה( ירשק ןילמוג ןיב םיאגה )םיכומס יקוחו.הנגנה ןיינעמ ןייצל יכ םימיב הלא שממ תחתופמ זכרמב רקחמה תרבח מבי הפיחב תכרעמ יוהיזל רוביד.,ןבומכ תייעב יוהיזה השק הברהב תייעבמ.הריציה תוטעמ תודובעה תוקסועה רישי הקיטנמסב.תירבע ףרודסלאומס )86( ראתמ יטנמס ךרוצל םוגרת,בשחוממ ךא הדובעה הניא תססובמ הירית ש ןיאו הב רית םיעוציב רבעמ תמרל הלימה.תדדובה תמרב,הלימה עיצמ ןסינ )23( תכרעמ תריציל םיחנומ,םיירבע ךא התובישח תישעמה.הרורב יקסנקשב ןנרו םיעיצמ תכרעמ םי עויסל םוגרתב,יטמוט םע םושיי םוגרתל תירבעמ תיסורל.)39( תכרעמ םוגרתל יטמוט ךות שומיש,תויטנמס תונוכתב תמגדומה םוגרתב תירבעמ תילגנ,תידרפסלו תראותמ ןנר רטוגו.)77(

4 דיתע יפכ וניארהש קרפב,םדוקה ןווגימ תוכרעמה תובשחוממה דוביעל תירבע,םחר ךא ןיידע הרסח תיתשת,הבחר תססובמ,השיגנו רשפאתש חותיפ הנכות תינרדומ סוסיבו רקחמ םדקתמ ב תיבושיח.תירבע קרפב הז תורקסנ תושירדה תיתשתמ תיבושיח.וזכ ןיוצש יפכ,ליעל טעמכ ךירצמה םושיי עדי ינושל קקזנ מ םילימ רצל.הפשה תופש תויעבט ןה :תוימניד ןתינ עובקל עגרב ןותנ והמ רצ םילימה הפש.יהש הביסה תירקיעה ךכל תופרטצהה תדמתמה םילימ,תורז רקיעבו תומש,םייטרפ,הפשל ןתוחיכשו ההובגה םילימ ולא םיטסקטב םיצופנ ןוגכ( ירמאמ ןותיע יכמסמ.)טנרטניא הרתי,וזמ םילימ תורז ףאו( )תומש תובלתשמ םיתעל תובורק םקרמב,הפשה ףאו תותייצמ הדימב תמיוסמ יקוחל היגולופרומה.ה,ךכ,מל ףסונ הפשל םש תירבעה םצעה,םזירתנ רזגנה םשהמ יטרפה ;רתנ םשו םצעה ןופלט שמשמ סיסב ופל ןפלט.ויתויטנ םינוקיסקל םיבשחוממ םיבייח תויהל םישיגר תוימנידל,הפשה ךכיפלו ןמ ירה עיקשהל ץמאמ חותיפב היגולונכט רישעתש םינוקיסקל םימייק םילימב,תושדח ךות שומיש עדיב שכרנה הקירס תדמתמ םיכמסמ,מל( ןתינ חתפל הנכות קורסתש עובק יכמסמ טנרטניא קיפתו המישר םילימ.)תורכומ םל ןוקיסקלה קר בה ןושארה דוביעב בשחוממ ;םילימ הפשב ומכ,תירבע תב היגולופרומ הרישע,תיסחי היהת וז תועט רומשל ןוקיסקל תורוצה תויוטנה.םיסיסבה יקוח היגולופרומה תירבעה םה םיטושפ,תיסחי ןמו ירה צייל קיודמ ילמרופו ידכ רשפ היינב םיחתנמ םייגולופרומ,םיינרדומ ןתינש,ביחרהל רפשל קזחתלו םת םע תובחרתה ןוקיסקלה ראותמכ.ליעל בור תודובעה וראותש קרפב םדוקה תוסחייתמ תייעבל היגולופרומה תירבעה לאכ היעב הנוש התוהמב היגולופרומהמ תופש.תורחא ךשמב םינש תוכורא חנזוה םוחת היגולופרומה תיבושיחה,םלועב בקע קוסיעה רבגומה הפשב,תילגנאה ה היגולופרומ א.תנוונמ םינומשה תונשמש לחה חתפתהל רקחמ םוחת םלועב קסועש ידוחיי תויבושיח תושיגב )היגולותפו(היגולופרומל תופש,תויעבט תוססבתמה תושיג םיבצמ תונוכמ תויפוס 5 9 ( ; )92 ;finite-state machines(.)85 ץולח חתיפש,ימיינקסוק היה זה השיגה לדומ יבושיח םיכילהת ריתל םייגולופרומ םייגולונופו םיעצמאב,הלאכ עדונש םשב תומרה יתש לדומ.)62(

הניסיון הראשון לבדוק את המת המודל הזה ברית נערך על לביא, ובמהו מומש מחדש המודל בשפת פרולוג )63; 64; 21(. מסקנות הניסוי הן כי בעוד שהמודל מים לתיאור תהליכי הנטייה של הפועל, הרי שתהליכי גזירה מסוימים, כגון יצירת בסיסי משנה מהבסיס הראשוני, קשים מאוד להבעה במודל זה. אולם בשנים האחרונות חלו התפתחויות חשובות בתחום זה, והוצעו הרחבות של מודלים המבוססים על טכנולוגיה של מכונות מצבים סופיות המאפשרות עושר ביטוי רב יותר )60; 69; 42; 97; 70(. הרחבות ו מאפשרות לנסח את התהליכים המורפולוגיים בשפת תיאור נוחה, ולהפיק באופן אוטומטי מנתחים מורפולוגיים, ובדרך כלל גם תוכניות יצירה מורפולוגיות. שפות תיאור כה מבוססות על ביטויים רגולריים expressions( )regular והן מאפשרות לבן לאפיין את המבנה המורפו פונולוגי של מילים בשפה תוך שימוש בשני סוגי סימנים: הפבית של השפה וקבוצה של סימנים מיוחדים, המציינים פעולות על סדרות של סימני פבית)מחרוזות(. פעולות כו כוללות, למשל, שרשור: צירוף סדרתי של שתי מחרוזות למחרוזת אחת; אך במודלים המורחבים ניתן להשתמש בפעולות מורכבות יותר, ובהן גם קבוצה גדולה של פעולות החלפה על מחרוזות, בדומה לחוקי ההחלפה המוכרים מהגישה הגנרטיבית לפונולוגיה. למשל, ניתן לבטא בשפות ו בקלות מרובה את החוק המחייב חילוף של ה ת של בניין התפעל בעיצור הראשון של השורש, כאשר עיצור זה ה שורק. מאפיין חשוב של מודלים ה ה שניתן לממשם במחשב ביעילות מרבית. מנם, המערכות שצוינו יל כוללות תוכנה המתרגמת את הביטויים הרגולריים המורחבים לתוכניות מחשב יעילות ביותר. כן, המודלים המורחבים שימשו ליצירת מנתחים מורפולוגיים מודרניים למספר שפות שמיות, ובהן ערבית )40; 41; 61(. מן הראוי להשתמש בטכנולוגיה מודרנית זו על מנת לפתח מנתחים מורפולוגיים ברית )על כל משלביה( שיהיו פתוחים ימוש ל צורך ויתוחזקו באופן שוטף כך שיישארו מעודכנים תמיד. השיטות להפגת עמימות מורפולוגית, תוך שימוש בהקשר קצר, שתרו בפרק הקודם הן מבטיחות, ומן הראוי להמשיך ולפתחן כחלק ממנתח מורפולוגי מודרני. על בסים תוצאות ו ניתן יהיה לפתח מנתחים תחביריים שטחיים parsers(,)shallow אשר מפיקים שלד של המבנה התחבירי של כל משפט בזמן קצר בהרבה מהזמן הנדרש לניתוח תחבירי מלא. גם לצורך יישומים כה ניתן להשתמש בטכנולוגיה של מכונות מצבים סופיות. עבודות כו נערכות'עתה

תטיסרבינב ןב,ןוירוג ןתרטמו בסהל תוטיש תומייק גוית רביד יקלח )part-of-speech tagging( תירבעל.)36(,גוית ותועמשמ ןומיס קלח רבידה ןוכנה ל הלימ העיפומה,סופרוקב םיתעלו ןתינ ןמסל עדימ ףסונ קלח,רבידה ןוגכ תונוכת תויגולופרומ תויריבחתו תועמשמ תינולימ word(.)sense ןורתי לודג תודובע ולאכ ןתמאתהב תופשל תוימש.תורחא היגולופרומה תירבעה הבורק דמ וזל תופש תוימש,תורחא ןהיניבו הבושח דחוימב.תיברעה,ךכיפל םי תוטישו וחתופיש רובע,תירבעה ריבס דמ וויש שמשל ךרוצל רקחמ ינושל חותיפו תוכרעמ דוביעל.תיברעה,םנמא תומייק תוכרעמ תובר תוקסועה הפשב,תיברעה רצקיו ןאכ עצמה טרפלמ ;ןלוכ בו,ז הארנ יכ שי םעט דקמתהל חותיפב תוטיש ורשפאיש םימושיי יתשב.תופשה,מל טקייורפב לחהש הנורח תטיסרבינב,הפיח םיסנמ חתפל היגולונכט רשפאתש דומיל יטמוט ןוקיסקל חתנמו יגולופרומ תיברע תילארשי תרבודמ ךותמ סופרוק ןותנ.)94( שי דוסי תווקל היגולונכטש ז רשפאת דומיל ןוקיסקל םיקוחו םייגולופרומ.תירבעל ףסונב םימושייל םיינושל םיקהבומ ומכ ןוקיסקל חתנמו,יגולופרומ ןויסינה דמלמ יכ שי ךרוצ עיקשהל חותיפב םי םינוש ועייסיש תיינבל תוכרעמ תובשחוממ דוביעל.הפש יבגל ןווגימ בחר,םימושיי רבתסמ יכ תושיג ןניאש תובמ עדי ינושל,קימעמ א תושמתשמ יטסיטטס עדיב,הפשה תועיגמ םיעוציבל יקיחרמ.תכל םימושייב,םימיוסמ ןוגכ יוהיז רוביד speech(,)recognition תוחילצמ תושיג ולאכ תוכהל תוטיש תוססובמה עדי ינושל קוש.ךרי א ךרוצ ףוסיא עדימה,יטסיטטסה רקיעבו םשל ןומיא,תכרעמה שי ךרוצ ירגאמב עדימ.םילודג םירגאמ,הלאכ םיסופרוק םיבימ םינוש ןה(הפש הבותכ ןהו םה,)תרבודמ םייחרכה ךרוצל דוביע.יטסיטטס הרתי,וזמ ןומיא ךרוצל תוכרעמ ולאכ גוהנ םימעפ תובר גייתל קלח רכינ.רגאמהמ הפשב ומכ,תירבע יוביר תועמשמה יגולופרומה הובגה,ךירצי יפכ,הארנה ןומיס ה יגולופרומה ןוכנה הלימ קלחב סופרוקה.גיותמה הרתי,וזמ תופשל ורקחנש,בטיה ןוגכ תילגנא,תינמרג םימייק םיסופרוק םיקלחש םימ םהמ וחתונ,יריבחת לו טפשמ דמצוה ץע הריזג ראתמה סופרוק.והנבמ הזכ הנוכמ קנב םיצע )tree bank( ותובישחו חותיפל םימושיי םיססובמה עדי ינושל יחטש וסת.זפב א הנכהש םיסופרוק םיגיותמ ךילהת,ךורא השק,עגיימו ךירצמה רקיעב תדובע

םילמנ םינשלב,םייבושיח םה עדי קיפסמ הפשב עדיו יחטש תוחפל ישומישב.בשחמ ןיא קפס שיש ךרוצ עיקשהל םיבאשמ חותיפב םיסופרוק הלאכ.תירבעל יתש תודובע תויחכונ תוקסוע ןוניכב םירגאמ םיינושל הפשה.תירבעה ןוויכמ ןהיתשש םרט,ומוה ןתינ ךירעהל ןאכ,ןהיתצות ךא בושח ראתל ןהיתורטמ.תורהצומה הדובעה הנושארה תקסוע תמקהב קנב םיצע תירבעל.)90( בב,ןושארה הרחבנ הצובק 500,םיטפשמ וחתונש תיגולופרומ יטמוט רחו ןכמ ונקות תצות ה.ינדי ףסונ ךכ וחתונ םיטפשמה,)תינדי(יריבחת םאתוה םהמ דחא לו ץע הריזג ראתמה.והנבמ תרטמ הדובעה חתפל הרודצורפ תיטמוט הצחמל רשפאתש הבחרה קנב םיצעה.דיתעב סופרוק רחא קסוע תרבודמ ;56( :)13 תרטמ הדובעה ןנוכל רגאמ תוטלקה גציימ תירבעה תרבודמה לארשיב,םויכ שמשיש יכרוצל רקחמ םימוחתב םינווגמ םירושקה הפשל.תירבעה סופרוקה הוולי םיקיתעתב,תוטלקהה םיבו ורשפאיש,םישופיח תוושה םיו ןה רובידה טלקומה ןהו.םיקיתעתה,רומאכ טקייורפ הז אצמנ ןיידע יבב ןונכת.םיינושאר םימושייל םיבר,בוט ןוקיסקל וקיפסי,ףקיה בחר הוולמה חתנמב יגולופרומ ליעי שמתשמו ילוקישב רצק רשקה ךרוצל תגפה תומימע.תיגולופרומ,מל תוטישה תוחלצומה רתויב םויכ םיכמסמ תוצמתל ;68( )67 תוססבתמ עדי ינושל יחטש,דבלב ןניאו תוכירצמ קימעמ.רתוי ךכ םימושייב שופיח יטנגילטניא ירגאמב,עדימ יוצימ עדימ.המודכו,םל ךרוצל םימושיי םיקימעמ,רתוי ןוגכ הנעמ תולאש,ב ויכו שי ךרוצ תנבהב הנבמה םיעבמ םילימב,תורחא ןכו שי ךרוצ ב.יריבחת.תירבעל וחתופש םייבושיחה םיקודקדה םיטעמ,רומאכ חתפל תנמ ימושיי הפש תיעבט וליש הנבה הקימעמ תועמשמ םיעבמה, שי ךרוצ דקמתהל חותיפב ץאומ ףקיה בחרו םיקודקד.הלאכ חכוה רבעב ךרוצ םימושיי,םיבכרומ ןוגכ םוגרת,יטמוט ןהיעוציב תוכרעמ תובמה עדי ינושל קימעמ םילוע ןי רועיש תוכרעמ תוססבתמה עדימ יטסיטטס.דבלב הדובע ץמאמ הכירצמ וזכ בר ףותישו הלועפ רפסמ ןיב לודג,םירקוח,םייטרית םינשלב םינשלב םייבושיח ינעדמו ךא,בשחמ הרכש.הדצב רשאכ היהי ונתושרב קודקד יבושיח ףקיה בחר,תינרדומ תירבע ססובמ חתנמ יגולופרומ גיפמ תומימע לגוסמו דדומתהל םע םיטלק,םיבכרומ ןה

חוקיים והן לא חוקיים, נוכל להתמודד עם האתגר הגדול ביותר של עיבוד שפות טבעיות: הבנת המשמעות של מבעים, החל מצירופים פשוטים, עבור דרך משפטים וכלה במבני שיח )discourse( מורכבים. אולם אתגר זה יהיה קל יותר מהקודמים לו. סביר להניח שההתמודדות עם הסמנטיקה של העברית לא תצריך כלים, טכנולוגיה ופיתוחים שונים מה שכבר קיימים עבור שפות אחרות. זאת משום שהעברית שונה מונות המערב בעיקר במורפולוגיה ובתחביר, אולם נדמה שהסמנטיקה הלקסיקלית מציבה פחות שונות בין הונות הללו. ביום שבו נוכל להציג מערכת יבוד שפה בעברית שתכיל את כל המרכיבים המתרים יל, תיפתח בפנינו הדרך למיגוון רחב של יישומים כמו גם לפתרון בעיות מחקר מרתקות שכיום נבצר מאיתנו להתמודד איתן. אז תהיה העברית לחברה שוות זכויות במשפחת השפות הניתנות יבוד חישובי. אין צורך לומר שפיתוחים כה לא יוכלו ולם להיות מונעים על צורכי תעשיית התוכנה, שכן שוק התוכנות יבוד עברית יישאר ולם מוגבל ביותר. פיתוחים כה, הן במסגרת של מחקר בסיסי והן במסגרת של מחקר יישומי, חייבים להיות מונעים על מי שעתיד השפה העברית, בעידן של גלובליזציה מצת, קרוב ללבו. תודות תודתי נתונה למורי רימון, וזי אורנן ולון איתי שקראו גרסאות קודמות של מאמר זה והעירו עליהן. תודה מיוחדת למה יזרע על העידוד ועל הערות רבות ומועילות. טעויות, אי דיוקים ותפיסות שגויות הם, כמובן, על אחריותי הבדית. ביבליוגרפיה אורנן, עוזי. תשל ז. דיווח על מחקר וני במחשב המבוצע בישר. בנות עברית חפ שית. 127-121:11 אורנן, עוזי. תשל ט. המשפט הפשוט. ירושלים: אקדמון. אורנן, עוזי. הקונגרס תשמ ה. מפתחות וקונקורדנציות ה 9 למדעי היהדות, ירושלים. בכתב עברי פונמי. ימי דברי אורנן, עוזי. תשמ ה. ניקוד ע י מחשב: לקח בני. בתוך: ב צ לוריא)עורך(. ספד אברהם אבן שושן. ירושלים: קרית ספר. אורנן, עתי. תשמ ח. עיבוד טקסטים עבריים במחשב על יסוד כתב חד משמעי. משפטים י ז: 24-15. ) 1( )2( )3( )4( )5(

)6(,ןנר יזוע םידוו.יקצזק 1986. יכילהת הריציו היגולופרומב.תירבעה סנכה יצראה 21 ה דוביעל,םינותנ.א ליא 164-153. )7(,ןנר,יזוע ןועדג ילאירא תעו ןורוד.)םיכרוע(.1992 תיבושיח :תירבע ץבוק םירמאמ ימימ ןויע וכרענש םינשב,1988,1989 1990 י ע דרשמ עדמה.היגולונכטהו )8(,רזא.השמ.1972 יריבחת :ינכמ הטישה התפהו רפס.תור תירבע תיש פח.5 0-1 : 5 )9(,קבלא.ילר 1995. ח צפמ :םינבמ הטיש ל ילאמרופ טפשמ ירבע.דקונמ תירבע.39 10( ),רוטנב,רתסא הלאיבא ל גנא תינדו.בגש.ג נשת בשחוממ םילמ.תוירבע תירבע :36.37-33 11( ),רוטנב,רתסא הלאיבא,ל גנא תינד ןב בגש ירא ןולאו.איבל 1992. בשחוממ םילימ.תוירבע :ךותב יזוע,ןנר ןועדג ילאירא תעו.)םיכרוע(ןורוד תיבושיח :תירבע.38-36 12( ),ןייטשדלוג.ריל 1991. הריציו תייטנ ןינקה תומש.םייערלמ רוביח תלבקל ראות רטסיגמ,םיעדמל.ןוינכטה 13( ),ירה ןימינב המו.לאערזי לדומה ינונכתה רגאמ תירבעה תרבודמה.)ד מעמ(לארשיב ךרכב(.)הז 14( ),ץרה קחצי ירומו.ןומיר 1992. ןותימ תומימע תילקיסקל םישומישו םיפסונ טמוט רשקה.רצק :ךותב יזוע,ןנר ןועדג ילאירא תעו ןורוד.)םיכרוע( תיבושיח :תירבע.87-74 15( ),רנטניו.ילוש.1992 יריבחת םיטפשמ תועצמאב.patr :ךותב יזוע,ןנר ןועדג ילאירא תעו.)םיכרוע(ןורוד תיבושיח :תירבע.115-105 16( ),ןח השמ באזו.רורד.1976 אובמ קודקדל ינורצת.ירבע םיפמ םייאטיסרבינ האצוהל.רל 17( ),רהצי.הנד 1993. קודקד יבושיח םיפורצל םיינמש. תדובע,ךמסומ תקלחמ יעדמ,בשחמה הטיסרבינה.תירבעה 18( ),ןהכ.לאינד.ד משת יריבחת ינכמ טפשמ. רוביח תלבקל ראות רוטקוד,היפוסוליפל הטיסרבינה,תירבעה.םיורי 19( ),ןהכ.לאינד.ה משת םיטסקט םידקונמ םדוקינו.בשחמ ירבד ימי סרגנוקה 9 ה יעדמל,תודהיה.םיורי 122-117. )20(,רפל.רשא.ו ת רוביד ירבע יתוכמ תרזעב.בשחמ וננושל :מ.78-67

)21( )23( לביא, ון.. 1989 שיטת שתי הרמות למורפולוגיה עברית. חיבור לקבלת תר מגיסטר, הטכניון. )22( לוינגר, משה. 1992. הפגת עמימות מורפולוגית בעברית. חיבור לקבלת תר מגיסטר למדעים, הטכניון. ניסן, אפרים. תשנ ג. המטבעה הונית. בנות עברית 49-39. 36: )24( )25( סגל, פנקס, אר. תש ס. מנתח צורני הסתברותי לטקסטים חיבור לקבלת תר מגיסטר למדעים, הטכניון. גדי. תשמ ו. מערכת לינגיסטית לאחזור מידע. עבריים מעשה לא מנוקדים. 12: חושב. 16-10 )26( )27( )28( )29( רוזן, חיים. 1967. עברית טובה, עיונים בתחביר. ירושלים: קרית ספר. רובינשטיין, יעזר. תשכ ט. המשפט השמני, עיונים בתחביר ימינו. הוצאת הקיבוץ המאוחד והאוניברסיטה של תל אביב. רובינשטיין, יעזר. תשל א. הצירוף הפועלי. הוצאת הקיבוץ המאוחד. שויקה, יעקב. ההרצאות של אינפורמציה:. 1965 מחשבים ודקדוק: ניתוח מכני של הפועל העברי. קובץ הכנס.66-49 )30( שויקה, יעקב. הארצי יבוד נתונים. האיגוד. 1972 טכניקות מהירות לאיתור ושליפה בעברית. בנות עברית חפ שית.3 2-1 2 : 6 )31( שויקה, יעקב. במלון הישרי יבוד ובקונקורדנציה 1990. מלי ם מערכת לניתוח דקדוקי מלא, מדויק ומקוון למורפולוגיה של העברית בת זמננו בסביבת מחשב אישי ובסביבת ווקס. הכנס השנתי על מחשבים בחינוך. 63. )32( )33( שויקה, יעקב. תשנ ד. הערות למאמר ניתוח ממוחשב שנדפס בבנות עברית 36. בנות עברית 87. 37: שני קליין, מיכל..1990 )34( )35( ניתוח ויצירה נטיית של השמות של העברית. חיבור לקבלת תר מגיסטר למדעים, הטכניון. שני קליין, מיכל ועוזי אורנן. שפירא, מלים הסגוליים עבריות בשפה. 1992 ניתוח ויצירה של נטיית השמות הסגוליים בשפה העברית. בתוך: עוזי אורנן, גדעון אריי ועת דורון)עורכים(. בנות חישובית עברית. מאיר ויעקב שויקה. תשכ ד. ניתוח מיכאנוגראפי העברית: אפשרויות והישגים. וננו 372-354. 4/28: של המורפולוגיה (36) Adler, Meni and Miki Tebeka. 2001. Unsupervised Hebrew Part-of-Speech Tagging. In: Shuly Wintner (ed.). Israeli Seminar on Computational Linguistics (ISCOL Ol). 19-20.

(37) Attar, R., Y. Choueka, N. Dershowitz and A. S. Fraenkel. 1978. KEDMA Linguistic Tools for Retrieval Systems. Journal of the Association for Computing Machinery 25: 52-66. (38) Azar, Moche. 1970. Analyse morphologique automatique du texte hebreu de la Bible. Tech. Rep. 12 et 19, Faculte des Lettres et des Sciences Humaines, Nancy. (39) Bashkansky, Guy and Uzzi Oman. 1998. Monolingual translator workstation. In: MT and the Information Soup: Proceedings of AMTA 98. Springer. 136-149. (40) Beesley, Ken. 1996. Arabic finite-state morphological analysis and generation. In: Proceedings of COLING-96, the 16th International Conference on Computational Linguistics. (41) Beesley, Kenneth R. 1998. Arabic morphology using only finite-state operations. In: Michael Rosner (ed.). Proceedings of the Workshop on Computational Approaches to Semitic languages. COLING-ACL 98. 50-57. (42) Beesley, Kenneth R. and Lauri Karttunen. Forthcoming. Finite-State Morphology: Xerox Tools and Techniques. (43) Carmel, David and Yoelle Maarek. 1999. Morphological Disambiguation for Hebrew Search Systems. In: Proceedings of te 4th International Workshop NGITS-99, Israel. Lecture Notes in Computer Science 1649. Springer: 312-325. (44) Choueka, Yaacov. 1980. Computerized Full-Text Retrieval Systems and Research in the Humanities: The Responsa Project. Computers and the Humanities 14: 153-169. (45) Choueka, Yaacov and Serge Lusignan. 1985. Disambiguation by Short Context. Computers and the Humanities 19: 147-157. (46) Dagan, Ido and Alon Itai. 1994. Word sense disambiguation using a second language monolingual corpus. Computational Linguistics 20: 563-596. (47) Dahan Netzer, Yael. 1997. HUGG Unification-Based Grammar for the Generation of Hebrew Noun Phrases. Master s thesis, Ben-Gurion University of the Negev, Department of Computer Science, Faculty of Natural Sciences, Be er Sheva, Israel.

(48) Dahan Netzer, Yael and Michael Elhadad. 1998. Generating determiners and quantifiers in Hebrew. In: Michael Rosner (ed.). Proceedings of the Workshop on Computational Approaches to Semitic Languages (COLING/ACL 98). 82-88. (49) Dahan Netzer, Yael and Michael Elhadad. 1998. Generation of noun compounds in Hebrew: Can syntactic knowledge be fully encapsulated? In: Eduard Hovy (ed.). Proceedings of the Ninth International Workshop on Natural Language Generation. Association for Computational Linguistics. 168-177. (50) Dahan Netzer, Yael and Michael Elhadad. 1999. Hebrew-English Generation of Possessives and Partitives: Raising the Input Abstraction Level. In: Proceedings of the 37th meeting of the ACL. 144-151. (51) Dalrymple, Mary, Ronald M. Kaplan, John T. Maxwell and Annie Zaenen (eds.). 1995. Formal Issues in Lexical-Functional Grammar, vol. 47 of CSLI lecture notes. CSLI, Stanford, CA. (52) Fraenkel, Aviezri S. 1976. All about the Responsa Retrieval Project what you always wanted to know but were afraid to ask. Jurimetrics Journal 16: 149-156. (53) Glinert, Lewis. 1989. The Grammar of Modem Hebrew. Cambridge: Cambridge University Press. (54) Haddock, Nicholas, Ewan Klein and Glyn Morill (eds.). 1987. Categorial Grammar, Unification and Parsing, vol. 1 of Working Papers in Cognitive Science. University of Edinburgh, Center for Cognitive Science. (55) Herz, J. and M. Rimon. 1991. Local Syntactic Constraints. In: Proceedings of the Second International Workshop on Parsing Technologies. (56) Izre el, Shlomo, Benjamin Hary and Giora Rahav. 2001. Designing CoSIH: The corpus of Spoken Israeli Hebrew. International Journal of Corpus Linguistics 6/2: 171-197. (57) Joshi, A. K. 1987. An Introduction to Tree Adjoining Grammars. In: A. Manaster-Ramer (ed.). Mathematics of Language. Amsterdam: John Benjamins. (58) Kaplan, Ronald and Joan Bresnan. 1982. Lexical functional grammar: A

formal system for Grammatical Representation. In: J. Bresnan (ed.). The Mental Representation of Grammatical Relations. Cambridge, Mass.: MIT Press. 173-281. (59) Kaplan, Ronald M. and Martin Kay. 1994. Regular Models of Phonological Rule Systems. Computational Linguistics 20: 331-378. (60) Karttunen, Lauri, Jean-Pierre Chanod, Gregory Grefenstette and Anne Schiller. 1996. Regular Expressions for Language Engineering. Natural Language Engineering 214: 305-328. (61) Kiraz, George Anton. 2000. Multitiered Nonlinear Morphology Using Multitape Finite Automata: a Case Study on Syriac and Arabic. Computational Linguistics 26: 77-105. (62) Koskenniemi, Kimmo. 1983. Two-Level Morphology: a General Computational Model for Word-Form Recognition and Production. The Department of General Linguistics, University of Helsinki. (63) Lavie, Alon, Alon Itai, Uzzi Oman and Mori Rimon. 1988. On the Applicability of Two-Level Morphology to the Inflection of Hebrew Verbs. Tech. Rep. 513, Department of Computer Science, Technion. (64) Lavie, Alon, Alon Itai, Uzzi Oman and Mori Rimon. 1988. On the Applicability of Two-Level Morphology to the Inflection of Hebrew Verbs. In: Proceedings of the International Conference of the ALLC. (65) Lazewnik, Rabbi Grainom. 1970. Construction of an Algorithm for Stem Recognition in the Hebrew Language. Hebrew Computational Linguistics 2: 84-101. (66) Levinger, Moshe, Uzzi Oman and Alon Itai. 1995. Learning morpho-lexical probabilities from an untagged corpus with an application to Hebrew. Computational Linguistics 21/3: 383-404. (67) Mani, Andeijeet. 2001. Automatic Summarization. Amsterdam: Johns Benjamins. (68) Mani, Andeijeet and Mark T. Maybury (eds.). 1999. Advances in Automatic Text Summarization. Cambridge, Mass.: MIT Press. (69) Mohri, Mehryar. 1996. On Some Applications of Finite-State Automata Theory to Natural Language Processing. Natural Language Engineering 2: 61-80.

(70) Mohri, Mehryar, Fernando Pereira and Michael Riley. 1998. A rational design for a Weighted Finite-State Transducer Library. In: Lecture Notes in Computer Science. Springer. No. 1436. (71) Morgenbrod, M. and E. Serifi. 1976. Computer-Analysed Aspects of Hebrew Verbs. Hebrew Computational Linguistics 10, El-17. (72) Morgenbrod, M. and E. Serifi. 1977. Computer-Analysed Aspects of Hebrew Verbs: Mathematical Models. Hebrew Computational Linguistics 12, E l-18. (73) Morgenbrod, M. and E. Serifi. 1978. Computer-Analysed Aspects of Hebrew Verbs: The Binjanim Structure. Hebrew computational linguistics 14, V-XV. (74) Nirenburg, Sergei and Yosef Ben-Asher. 1984. HUHU the Hebrew University Hebrew Understander. Computer Languages 9, 3/4. (75) Oman, Uzzi. 1986. Phonemic Script: A Central Vehicle for Processing Natural Language the Case of Hebrew. Tech. Rep. 88.181. Haifa: IBM Research Center. (76) Oman, Uzzi. 1994. Basic Concepts in Romanization of Scripts. Tech. Rep. LCL 94-95. Haifa: Laboratory for Computational Linguistics, Technion. (77) Oman, Uzzi and Israel Gutter. 2000. Machine Translation by Semantic Features. In: Derek Lewis and Ruslan Mitkov (eds.). Machine Translation and Multilingual Applications in the New Millennium. (78) Oman, Uzzi and Katz, Michael. 1995. A New Program for Hebrew Index Based on the Phonemic Script. Tech. Rep. LCL 94-7, Laboratory for Computational Linguistics, Technion, Haifa, Israel. (79) Pollard, Carl and Sag, Ivan A. 1987. Information Based Syntax and Semantics. No. 13 in CSLI Lecture Notes. CSLI. (80) Pollard, Carl and Ivan A. Sag. 1994. Head-Driven Phrase Structure Grammar. University of Chicago Press and CSLI Publications. (81) Price, James D. 1969. An Algorithm for Generating Hebrew Words. Hebrew Computational Linguistics 1, 51-54. Reprinted from Computer Studies in the Humanities and Verbal Behavior, 1:84-102, 1969.

(82) Price, James D. 1970. The Development of a Theoretical Basis for Machine Aids for Translation from Hebrew to English. Hebrew Computational Linguistics 2,65-83. Abstract of a Doctoral Dissertation, The Dropsie College for Hebrew and Cognate Learning, Philadelphia. (83) Price, JamesD. 1971. An Algorithm for Analyzing Hebrew Words. Computer Studies in the Humanities and Verbal Behavior 3/2: 137-165. (84) Price, James D. 1971. A Computerized Phrase Structure Grammar (Modem Hebrew). Franklin Institute Report F-C2585-1/2/3/4. (85) Roche, Emmanuel and Yves Schabes (eds.). 1997. Finite-State Language Processing. Language, Speech and Communication. Cambridge: MIT Press. (86) Samuelsdorff, Paul Otto. 1980. Computational Analysis of Modem Hebrew. Hebrew Computational Linguistics 16, IV-XVI. (87) Segal, Erel. 1997. Morphological analyzer for unvocalized hebrew words. available from http://www.cs.technion.ac.il/erelsgl/hmntx.zip. (88) Shieber, Stuart M. 1986. An Introduction to Unification Based Approaches to Grammar. CSLI Lecture Notes. CSLI. (89) Shieber, Stuart M., Hans Uszkoreit, Fernando C. N. Pereira, J. J. Robinson and M. Tyson. 1983. The Formalism and Implementation of PATR-II. In: Research on Interactive Acquisition and Use of Knowledge. Menlo Park, Cal.: SRI International. (90) Sima an, Khalil, Alon Itai, Yoad Winter, Alon Altman and N. Nativ. To appear. Building a tree-bank of Modem Hebrew text. Traitment Automatique des Langues. (91) Skoblikov, Victoria. 2000. Feature-based Computational Lexicon of Hebrew Verbs. Master s thesis, Technion, Israel Institute of Technology, Haifa, Israel. (92) Sproat, R. W. 1992. Morphology and Computation. Cambridge: MIT Press. (93) Steedman, Mark. 2000. The Syntactic Process. Language, Speech and Communication. Cambridge: The MIT Press. (94) Talmon, Rafi and Shuly Wintner. 2001. Computational Processing of Spoken North Israeli Arabic. In: Arabic Language Processing: Status and Prospects, Association for Computational Linguistics. 124-126.