Microsoft PowerPoint - lecture02a-ling-general

מסמכים קשורים
Microsoft PowerPoint - Chap07cs.ppt

תורת החישוביות תרגול הכנה לוגיקה ותורת הקבוצות מה יש כאן? בקורס תורת החישוביות נניח ידע בסיסי בתורת הקבוצות ובלוגיקה, והכרות עם מושגים בסיסיים כמו א"ב

משימה תכנית המתרגמת קטעי טקסט לשפה אחרת הקלט: קובץ המכיל את קטעי הטקסט וכן את השפה אליה רוצים לתרגם תרגול מס' 4: המתרגם שימוש במחלקות קיימות תכנות מתק

מקביליות

àåðéáøñéèú úì àáéá

חינוך לשוני הוראת קריאה: נקודת מבט של הערכה: מהן הסוגיות שבהן ידע מחקרי עשוי לסייע בעיצוב מדיניות ועשייה?

מקביליות

מתמטיקה של מערכות

(Microsoft Word - 1 \367\351\365 \372\371\361''\342 - \371''\340)

תרגול מס' 4: המתרגם שימוש במחלקות קיימות מחרוזות, קבצים, וקבלת קלט מהמשתמש

מקביליות

הצעת פתרון בחינת הבגרות בעברית )שאלון א'( חורף 1023 שאלון 120, הצעת הפתרון הבחינה בעברית )שאלון א( נכתבה על-ידי דפנה עמית, סהר שוקר ועופר סלמן ש

מבחן 7002 פרטים כלליים מועד הבחינה: בכל זמן מספר השאלון: 1 משך הבחינה: 3 שעות חומר עזר בשימוש: הכל )ספרים ומחברות( המלצות: קרא המלצות לפני הבחינה ובדי

תהליך הגשה והנחיות כתיבה לעבודת גמר / תזה פרקים הקדמה תהליך הגשת עבודת המחקר ואישורה הנחיות תוכן לעבודת המחקר הנחיות כתיבה לעבודת המחקר הקדמה במסגרת ל

מבוא לתכנות ב- JAVA תרגול 7

שעור 6

התגוננות בפני כוחות האופל

מבחן סוף סמסטר מועד א 15/02/08 מרצה אחראית: דר שירלי הלוי גינסברג מתרגלים: גלעד קותיאל, דניאל גנקין הוראות: א. בטופס המבחן 7 עמודים ו 4 דפי נוסחאות. ב

מצגת מבנה וטבלה מתוקן [לקריאה בלבד]

דף נגזרות ואינטגרלים לשאלון 608 כללים למציאת נגזרת של פונקציה: n 1. y' n x n, y הנגזרת x.1 נכפול בחזקה )נרשום אותה משמאל ל- (. x א. נחסר אחד מהחזקה. ב

שקופית 1

ex1-bash

Limit

Microsoft Word - tik latalmid-final

<4D F736F F D20F4F8F E4F8F7F220E4EEE3F2E920ECF9E0ECFA20E4EEE7F7F82E646F63>

מבוא למדעי המחשב

1 תבניות טקסט מהי תבנית טקסט? שימוש ב- Characters Meta שימוש ב- Expression Grouping שימוש ב- Quantifiers תת תבניות הפונקציה preg_match הפונקציה preg_m

(Microsoft Word - \371\340\354\345\357 \340 \347\345\370\ doc)

ע 003 מרץ 10 מועד מיוחד פתרונות עפר

פייתון

תרגיל 9 מבוא ללוגיקה ותורת הקבוצות, סתיו תשע"ד 1. תהי L השפה בעלת סימן פונקצייה דו מקומי G, סימן פונקציה חד מקומי T, סימן יחס תלת מקומי.c, d וקבועים L

תרגול 1

PowerPoint Presentation

. [1,3] ו = 0 f(3) f(1) = עמוד 1 מתוך 6 דר' ז. אולחא מס' הקורס 9711 חדו''א הנ מכונות 1 f ( x) = ( x 1)( x 2)( x 3) c= f c = c (1,3), c תשובות I 1) פונ

פיסיקה 1 ב' מרצים: גולן בל, משה שכטר, מיכאל גדלין מועד ב משך המבחן 3 שעות חומר עזר: דף נוסחאות מצורף, מחשבון אסור בהצלחה! חלק א'

PowerPoint Presentation

<4D F736F F D20F4E9E6E9F7E420FAF8E2E5ED20ECF2E1F8E9FA20E4E2E4E420F1E5F4E9FA20496C616E2E646F63>

Slide 1

תשע"דד אביב תוכנה 1 תרגיל מספר 4 עיבוד מחרוזות וקריאה מקבצים הנחיות כלליות: קראו בעיון את קובץ נהלי הגשת התרגילים אשר נמצא באתר הקורס..(

מבוא למדעי המחשב

Bright Blue Gradients

rizufim answers

שקופית 1

תוכן העניינים

כתיבת דו"ח אבחון ארגוני

מבוא למדעי המחשב

VOCABULARY SYMBOLS AND ABBREVIATIONS Table of Contents: Chapter Four Abbreviations for Hebrew parts of speech present tense noun, masculine noun, dual

Microsoft PowerPoint - Lecture1

תוכן העניינים

מבחן סוף סמסטר מועד ב 28/10/08 מרצה אחראית: דר שירלי הלוי גינסברג מתרגלים: גלעד קותיאל, גדי אלכסנדרוביץ הוראות: א. בטופס המבחן 6 עמודים (כולל דף זה) ו

דיודה פולטת אור ניהול רכש קניינות ולוגיסטיקה

מבחן חוזר במכניקה 55 א יא יח""ללח פתור 3 מהשאלות 1-5 לכל שאלה 33%. חומר עזר מותר מחשבון ונוסחאון של בגרות. v m sec משך הבחינה 105 דקות. שאלה מספר 1 4

VOCABULARY SYMBOLS AND ABBREVIATIONS Table of Contents: Chapter Five Abbreviations for Hebrew parts of speech present tense noun, masculine noun, dual

2019 שאלות מומלצות לתרגול מס' דיפרנציאביליות של פונקציה סקלרית )המשך(. כלל השרשרת. S = ( x, y, z) z = x + 3y על המשטח מצאו נקודה בה מישור משיק

(Microsoft Word - \356\351\353\354 \354\340\372\ doc)

מספר מחברת: עמוד 1 מתוך 11 ת"ז: תשע"א מועד ב סמסטר א' תאריך: 00:11 שעה: 0 שעות הבחינה: משך כל חומר עזר אסור בשימוש בחינה בקורס: מבוא למדעי ה

מטלת מנחה (ממ"ן) 11 הקורס: חשבון אינפיניטסימלי II חומר הלימוד למטלה: יחידות 2,1 4 מספר השאלות: 7 משקל המטלה: נקודות סמסטר: ב 2007 מו

255 1 הוראת התחביר בגישה תהליכית ברוריה מרגולין מבוא ההתייחסות לתחביר העברי במישור הדקדוקי-הפורמלי בלבד, בדומה להתייחסות אל תחבירן של שפות כמו הלטינית

הגשה תוך שבוע בשעת התרגול

Homework-L9-Skills-1.pub

אוניברסיטת חיפה החוג למדעי המחשב מבוא למדעי המחשב מועד א' סמסטר ב', תשע"ג, משך המבחן: שעתיים וחצי חומר עזר: אסור הנחיות: וודאו כי יש בידיכם

מהוא לתכנות ב- JAVA מעבדה 3

מדריך לחיפוש במאגר JCR Journal Citation Reports מעודכן לדצמבר 2015 כל הזכויות שמורות לתחום היעץ, אוניברסיטת חיפה, הספריה

PowerPoint Presentation

הטכניון מכון טכנולוגי לישראל אלגוריתמים 1 )443432( סמסטר חורף הפקולטה למדעי המחשב תרגול 9 מסלולים קלים ביותר תרגיל APSP - 1 עד כה דנו באלגור

Microsoft Word - מארג השפה 9 - דגם.doc

מועד: א בחינה סופית במתמטיקה דיסקרטית משך הבחינה: 2 1 שעות מרצה: פרופ' תאופיק מנסור תאריך: סמסטר: א תשע"ח m 2 הוראות לנבחן: )1( הבחינה מו

פקולטה: מחלקה: שם הקורס: קוד הקורס: מדעי הטבע מדעי המחשב ומתמטיקה מתמטיקה בדידה תאריך בחינה: _ 07/07/2015 משך הבחינה: 3 שעות סמ' _ב' מועד

<4D F736F F D20E9F8E5F9ECE9ED2C20F8E72720E4E2E3E5E320E4E7EEE9F9E920312C20E2F0E920E9ECE3E9ED2E646F63>

I PRO Skills כישורים לעולם העבודה I CAN I AM I GROW I BUILD I NET I MIX כל הזכויות שמורות לג'וינט ישראל- תבת 2017

שיעור מס' 6 – סבולות ואפיצויות

אוניברסיטת בן-גוריון המחלקה למדעי המחשב בוחן במבנים בדידים וקומבינטוריקה פרופ' מתיא כ"ץ, ד"ר עופר נימן, ד"ר סטוארט סמית, ד"ר נתן רובין, גב'

תוכן הגדרת שאלת רב-ברירה ]אמריקאית[...2 הגדרת שאלת נכון\לא נכון...8 שאלות אמריקאיות 1

ביו-סטטיסטיקה למתקדמים - תרגיל מספר 9

בגרות לבתי ספר על יסודיים א. סוג הבחינה: מדינת ישראל בגרות לנבחנים אקסטרניים ב. משרד החינוך קיץ תשע"ג, 2013 מועד הבחינה: , מספר השאלון: א. מ

מבוא למדעי המחשב

Microsoft Word - tips and tricks - wave 5.doc

WinZIP תוכנה לדחיסת קבצים ספטמבר 2007

פרויקט שורשים דמות

עב 001 ינואר 12 מועד חורף פתרונות עפר

People. Partnership. Trust שלבי הפרויקט והמסלולים השונים - פלטפורמת "קהילה לומדת" מסלול Free שלבי הפרויקט: חיבור לשירותי Office 365 ללא עלות פורטל התח

כמה מילים לפני שקופצים לתוך ה...ציור זוכרים? מרי פופינס קופצת עם הילדים לתוך הציורים, כמה מילות קסמים והם בפנים! וכמה קורה שם בפנים: הילולה, הרפתקה, ו

Tutorial 11

Slide 1

בית ספר תיכון מאר אליאס- אעבלין

! 1! משוואות מסדר ראשו! (הפרדת משתני*, הומוגנית, לינארית) xyy = 1 x y xy 2 = 2xy 2 מצא את הפתרו' הכללי: x y y = 3 א) y ג) ב) ד) y tan x = y (1 ( x+ y

מטלת סיום שם הקורס: מורי מורים "עברית על הרצף" מוגשת ל- ד"ר האני מוסא תאריך הגשה: מגישה: זייד עביר יסודי ספר בית קחאוש אלפחם אום 1

בגרות לבתי ספר על יסודיים א. סוג הבחינה: מדינת ישראל בגרות לנבחנים אקסטרניים ב. משרד החינוך קיץ תשע"ג, 2013 מועד הבחינה: , מספר השאלון: הצעת

שאלון להערכה עצמית במתמטיקה לקראת לימודי שנה א מדוע להתכונן לשנה א מסלולי לימוד רבים באוניברסיטה (מדעי המחשב, הנדסה, פיזיקה וכמובן מתמטיקה) דורשים לימ

סדנת תכנות ב C/C++

Microsoft Word - c_SimA_MoedA2006.doc

<4D F736F F D20F4F2E5ECE5FA20EEE5EEF6E0E5FA20312E646F63>

תמליל:

מושגים בסיסיים בבלשנות NP PP N P A N 1

שפות טבעיות לעומת שפות פורמליות שפות פורמליות הן אובייקט שנוצר ע"י אדם. הכללים שלהן ידועים ומוגדרים היטב, וניתנים לשינוי אם צריך. שפות טבעיות הן אובייקט אמפירי. הכללים שלהן דומים לחוקי טבע שאנחנו מנסים לגלות, וייתכן שלעולם לא נבין אותם עד הסוף. שינויים בשפה אפשריים רק תחת מגבלות ביולוגיות, קוגניטיביות וחברתיות חמורות. 2

בלשנות מודרנית לעומת מסורתית דנה בשפה ברגע נתון דנה בהתפתחות השפה.1 סינכרונית לעומת דיאכרונית: ומטפלת בשפות הקיימות בשימוש יומיומי. עברית מודרנית ולא תנכית.2 דסקריפטיבית (לא פרספריקטיבית): שואפת לתאר, ולא לקבוע מה נכון ומה לא נכון. חמש שקל 3

סוגות של חומר בלשני שפה מדוברת: דיבור ספונטני קריאה המרצפות שעוגבות בגדר ביתה, צבועות שפה בצבע של כתובה: גלויה בלוג SMS מסן מרקו עננים בצבע בורדו עיתונות קטע שמים מחושמל מאמרים מדעיים ובסוף הרחבה מוברגות יותר ספרות יפה: רומנים מאלף יונים כפנסי לילה ספרות ילדים שירה פרסומות בדיחות חמישה שמנים מרעננה מחפשים חמש דקות מכפר סבא 4

שלבים בניתוח לשוני slowly = slow+ly גלי קול טקסט מורפולוגיה מורפמות He will talk very slowly to this girl זיהוי דיבור (פונטיקה+ פונולוגיה) תחביר [this girl] זיהוי מטרת הדובר פרגמטיקה סמנטיקה Talk(man 22, girl 1 ) he = John קשר למסד הנתונים (לעולם) עץ תחביר --חלוקה לרכיבים 5

תחומי הבלשנות המודרנית 6 פונטיקה: מחקר התכונות האנטומיות של מערכת הדיבור והתכונות הפיזיות של גלי הקול שהיא מייצרת. פונולוגיה: מחקר יחידות הקול הבסיסיות בשפה המדוברת. מורפולוגיה: מחקר יחידות המשמעות הקטנות ביותר בשפה (מורפימות) ואופן צירופן למילים. תחביר: מחקר אופן צירוף המילים בשפה ליחידות גדולות יותר. סמנטיקה: מחקר המשמעויות של ביטויים בשפה והיחסים ביניהן. פרגמטיקה: מחקר אופני השימוש בשפה בחברה.

תכנות לניתוח לשוני מקובל לחלק את מטלות ניתוח טקסטים לשכבות, שכבה מתייחסת לקודמתה כאל קופסה שחורה: כאשר כל השכבה זיהוי דיבור ניתוח מורפולוגי ניתוח תחבירי ניתוח סמנטי ניתוח פרגמטי קלט גל קול תמניות (מילים) מורפמות + תכוניות עץ תחביר ייצוג לוגי פלט טכסט מורפמות ותכוניות עץ תחביר ייצוג לוגי פעולות החיסרון: לפעמים יש צורך במידע של השכבה 7 שמעליה

זיהוי דיבור -- גלי הקול התנועות vowels מאופיינות ע"י גל קול מחזורי וממושך: 8 n 1 הגל של התנועה [iy] כל פונקציה מחזורית ניתנת לתיאור כסכום a 0 f t a cos 2 sin 2 n nt bn nt 2 תדר בסיסי 1=n. כל שאר התדרים הם כפולות של התדר הבסיסי

גלי הקול של תנועות התנועות נבדלות בחלוקה של העצמה בין התדרים formant עצמת הקול מתחלקת בין התדירות הבסיסית לבין הכפולות שלהם ). בעיקר F1 ו.(F2- תדר o easy and זמן 9

תנועה [a] 10

vowels -- תנועות 11

consonants עיצורים נוצרים ע"י חסימה חלקית של הפה או הלוע. הגל האקוסטי לא מחזורי (attack) חלקם באים עם תנועה וחלקם בלי (ד' לעומת ט') חלקם פוצצים,[p]) (...[t], [k] בפוצצים יש הפסקה של התנועה [p] ו-[ b ] נבדלות במשך הזמן בין הפיצוץ לבין התנועה (תלוי שפה!) 12

דיגיטציה כדי למדוד את הגל צריך לפחות שתי דגימות למחזור. בדיבור אנושי רוב האינפורמציה היא בתחום 10,000 הרץ, ולכן צריך 20,000 דגימות לשנייה. טלפון רק 4,000 הרץ ולכן 8,000 דגימות לשנייה 13

זיהוי דיבור המיתוס: יש התאמה 1-1 בין גלי קול ואותיות. ולכן כל שנותר הוא להמציא מכונה שתתרגם גלי קול לאותיות. המציאות: אין התאמה כזו. שפות שונות מקבצות את הרעשים (phones) לאותיות בצורות שונות. 14

IPA--International Phonetic Alphabet נותן תעתיק לכל phone כך שניתן לכתוב באמצעותו כל שפה 107 letters, 52 diacritics, and 4 prosodic markers. 15

Phones and allophones (תלוי שפה). למה לא כותבים את כל השפות באמצעות?IPA phones Allophone שונים שמתאימים לאותה פונמה יחידה מינימלית של קול שיכולה להבחין בין מילים שונות באנגלית van ban v b כי גם באותה השפה, במילה וכו'. ביצוע הפונמה תלוי בפונמות השכנות, במיקום נחש לעומת בנק יש פונמות שיש להן ביצועים שונים: ב לעומת ב כל שפה מקבצת את ה- phones לקבוצות שקילות מסמן את הפונמות. (פונמות) והכתב 16

ביצוע פונמות ביצוע פונמה משתנה ע"פ הפנמות שלפניה ואחריה מיקום הפונמה במילה (התחלה, אמצע או סוף) הטעם stress) ( האם ההברה מוטעמת? תלוי מאד בדובר, במבטא, גבר לעומת אישה, ובתנאים משתנים: מצב רוח, (התרגשות), מצב בריאותי (צרידות), רעש רקע. לכן נקבל התפלגות ונחפש את הזיהוי הסביר ביותר. 17

זיהוי דיבור תרגום הפונמות למילים מילה אינה יחידה אקוסטית מחברים בין המילים. בדיבור אנו מערכות זיהוי דיבור זקוקות למודל שפה מסד נתונים שמחזיק את כל המילים בשפה וכיצד הן יכולות להתחבר. בפרט חייבים מודל שפה שונה לכל שפה 18

state of the art זיהוי דיבור 19 עם מודל של השפה וכלים סטטיסטיים (HMM) נקבל את הזיהוי הסביר ביותר פרמטרים המשפיעים על טיב הזיהוי אימון על דובר יחיד, לעומת זיהוי כל דובר גודל הלקסיקון 10 מילים או 40,000? דיבור ספונטני לעומת דיבור מתפריט דובר יחיד או דו-שיח סביבה שקטה לעומת רועשת מיקרופון שולחני או צמוד לדובר Them all the mole יש שגיאות מביכות Scuse me, while I kiss the sky (Jimmy Hendrix) Scuse me, while I kiss this guy

תחומי הבלשנות המודרנית 20 פונטיקה: מחקר התכונות האנטומיות של מערכת הדיבור והתכונות הפיזיות של גלי הקול שהיא מייצרת. פונולוגיה: מחקר יחידות הקול הבסיסיות בשפה המדוברת. מורפולוגיה: מחקר יחידות המשמעות הקטנות ביותר בשפה (מורפימות) ואופן צירופן למילים. תחביר: מחקר אופן צירוף המילים בשפה ליחידות גדולות יותר. סמנטיקה: מחקר המשמעויות של ביטויים בשפה והיחסים ביניהן. פרגמטיקה: מחקר אופני השימוש בשפה בחברה.

מורפמות היחידות המשמעות הקטנות ביותר יחד מצטרפות למילים: Boy + s ו+ל+ה+ילד+ה ו ל י ל ד ה 21

טרנספורמציות מורפולוגיות התהליך הוא דו שלבי: קודם משרשרים את המורפמות ואח"כ מפעילים עליהן טרנספורמציות מורפולוגיות שמ ונ ע ות ע"י כללי הפונטיקה של השפה. לפעמים הטרנספורמציות מתבטאות בכתב י + הצטרף יצטרף in + probable improbable ולפעמים לא cats, dogs 22

טרנספורמציות מורפולוגיות בעברית לא יותר משווא אחד בתחילת מילה, ביקוע צרור של שלושה שוואים. דוגמא: ב+ב נ י ב ב נ י ב ב נ י התרחקות הטעם: קמץ הופך לשווא ד ב ר + ים ד ב ר ים ד ב ר ים כאשר נוצר נסמך, הטעם עובר למילה הבאה: ד ב ר ים-(הימים) ד ב ר י- ד ב ר י- שימו לב שיש סדר לפעולות קודם יוצרים את המילה ורק אח"כ מוסיפים את אותיות השימוש (מש"ה וכל"ב = בכל"ם, ה', ו, ש ( ב+ ד ב ר ים ב ד ב ר ים ב ד ב ר ים ב+ד ב ר י ב ד ב ר י נלמד שיטות לביצוע וניתוח מורפולוגיה 23

תחומי הבלשנות המודרנית 24 פונטיקה: מחקר התכונות האנטומיות של מערכת הדיבור והתכונות הפיזיות של גלי הקול שהיא מייצרת. פונולוגיה: מחקר יחידות הקול הבסיסיות בשפה המדוברת. מורפולוגיה: מחקר יחידות המשמעות הקטנות ביותר בשפה (מורפימות) ואופן צירופן למילים. תחביר: מחקר אופן צירוף המילים בשפה ליחידות גדולות יותר. סמנטיקה: מחקר המשמעויות של ביטויים בשפה והיחסים ביניהן. פרגמטיקה: מחקר אופני השימוש בשפה בחברה.

קטגוריות לקסיקליות (1) ראיתי ילד גדול את המילה "ילד" ניתן להחליף במילה "חלון" ולקבל עדיין משפט תקין: (2) ראיתי חלון גדול אבל לא את המילים "גדול" או "ראיתי": (3) *ראיתי ילד חלון (4) *חלון ילד גדול 25

קטגוריות לקסיקליות (1) ראיתי ילד גדול את המילה "ילד" ניתן להחליף במילה "חלון" משפט תקין: (2) ראיתי חלון גדול אבל לא את המילים "גדול" או "ראיתי": (3) *ראיתי ילד חלון (4) *חלון ילד גדול ולקבל עדיין נאמר ששתי המילים הן מאותה קטגוריה: שם עצם (N, (Noun 27 נגדיר יחס שקילות בין מורפמות: שתי מורפמות שקולות אם מבחינה תחבירית ניתן להחליף ביניהן. קטגוריה לקסיקלית היא מחלקת שקילות של יחס זה.

קטגוריות לקסיקליות, פתוחות וסגורות קטגוריות פתוחות הן כאלה שיש בהן מספר לא חסום של מילים לא חסום במובן שבקלות יתווספו מילים חדשות לקטגוריה. N - (common) noun ( שם עצם (כללי boy, girl, cat, revolution, PN - proper noun שם עצם פרטי Mary, New York, Microsoft A - adjective תואר tall, short, clever, ADV adverb תואר הפועל slowly, fast, independently V - verb פועל speak, walk, radiate, 28

קטגוריות לקסיקליות, פתוחות וסגורות קטגוריות סגורות הן כאלה שיש בהן מספר חסום (בד"כ קטן) של מילים. D determiner מיידע this, every, some, a, three, all AUX - auxiliary פועל עזר will, can, may, would, might P preposition מילת יחס to, from, by, of, at, on, in pronoun כינוי גוף she, they, we, her, us, himself 29

תיוג חלקי דיבר tagging) (part-of-speech לכל אחת מהקטגוריות הלקסיקליות ניתן להוסיף אינפורמציה רבה על המורפולוגיה או התפקיד התחבירי של המילה. למשל: (1) ראיתי ילד גדול (2) ראיתי ילדה גדולה (3) ראיתי ילדים גדולים (4) ראיתי את הילד הגדול 31

תיוג חלקי דיבר tagging) (part-of-speech לכל אחת מהקטגוריות הלקסיקליות ניתן להוסיף אינפורמציה רבה על המורפולוגיה או התפקיד התחבירי של המילה. למשל: (1) ראיתי ילד גדול זכר, יחיד, לא-מיודע (2) ראיתי ילדה גדולה נקבה, יחיד, לא-מיודע (3) ראיתי ילדים גדולים זכר, רבים, לא-מיודע (4) ראיתי את הילד הגדולזכר, יחיד, מיודע 32

תיוג חלקי דיבר tagging) (part-of-speech לכל אחת מהקטגוריות הלקסיקליות ניתן להוסיף אינפורמציה רבה על המורפולוגיה או התפקיד התחבירי של המילה. למשל: (1) ראיתי ילד גדול זכר, יחיד, לא-מיודע (2) ראיתי ילדה גדולה נקבה, יחיד, לא-מיודע (3) ראיתי ילדים גדולים זכר, רבים, לא-מיודע (4) ראיתי את הילד הגדולזכר, יחיד, מיודע 33

תיוג חלקי דיבר tagging) (part-of-speech לכל אחת מהקטגוריות הלקסיקליות ניתן להוסיף אינפורמציה רבה על המורפולוגיה או התפקיד התחבירי של המילה. למשל: (1) ראיתי ילד גדול (2) ראיתי ילדה גדולה (3) ראיתי ילדים גדולים (4) ראיתי את הילד הגדול אינפורמציה מהסוג הזה של תכוניות (features) משלימה את תהליך קביעת הקטגוריה הלקסיקלית, לתהליך של תיוג חלקי דיבּ ר tagging).(part-of-speech 34

תחביר חלוקה לרכיבים קלט: [This tall boy] [will talk [very slowly] [to [that girl]]] תוצאה: Subject Object Verb aux Place Manner Degree 35

תחביר חלוקה לרכיבים קלט: [This tall boy] [will talk [very slowly] [to [that girl]]] Subject Object Verb aux Place Manner תוצאה: Degree 36

תחביר חלוקה לרכיבים גם מבלי להיכנס לפרטים ברור שהחלוקה הזו של המשפט לתת-מחרוזות קשורה קשר הדוק לאינפורמציה שהוא מקודד התחביר קשור לסמנטיקה. הרבה חלוקות אלטרנטיביות לתת-מחרוזות נראות מאוד לא סבירות. למשל: [[This tall] [[boy will] [talk very]] [slowly to that]] girl לתת-מחרוזת שהיא סבירה מבחינה אינטואיטיבית, תיאורטית, או מעשית נקרא רכיב.(constituent) אחד מתפקידי התחביר הוא לחלק משפטים לרכיבים. * 37

חלוקה לרכיבים היא רק ביחס למשפט he [saw [John and Mary]] אבל לא: he [saw [John and Mary ]] did too 38

חלוקה לרכיבים היא רק ביחס למשפט he [saw [John and Mary]] אבל לא: he [saw [John and Mary ]] did too אלא: [he [saw John]] and [Mary [did too]] 39

קטגוריות מורכבות (1) הילד הנמוך ראה ילדה גבוהה את הרכיב "הילד הנמוך" ניתן להחליף במחרוזת "הכלב השחור" ולקבל עדיין משפט תקין: (2) הכלב השחור ראה ילדה גבוהה אבל לא את הרכיב "ראה ילדה גבוהה": (3) *הילד הנמוך הכלב השחור 40

קטגוריות מורכבות (1) הילד הנמוך ראה ילדה גבוהה את הרכיב "הילד הנמוך" ניתן להחליף במחרוזת "הכלב השחור" ולקבל עדיין משפט תקין: (2) הכלב השחור ראה ילדה גבוהה אבל לא את הרכיב "ראה ילדה גבוהה": (3) *הילד הנמוך הכלב השחור נאמר ששני הרכיבים הם מאותה קטגוריה: צירוף שמני NP) (Noun Phrase, 41

קטגוריות מורכבות (1) הילד הנמוך ראה ילדה גבוהה את הרכיב "הילד הנמוך" ניתן להחליף במחרוזת "הכלב השחור" ולקבל עדיין משפט תקין: (2) הכלב השחור ראה ילדה גבוהה אבל לא את הרכיב "ראה ילדה גבוהה": (3) *הילד הנמוך הכלב השחור כמו לגבי קטיגוריות לקסיקליות כך גם לגבי רכיבים: נחלק את הרכיבים למחלקות שקילות הקרויות קטגוריות מורכבות, או קטגוריות תחביריות. 42

כמה קטגוריות מורכבות מקובלות משפט (מ) S sentence NP - noun phrase ( צירוף שמני (צש every boy, this girl VP - verb phrase ( צירוף פעלי (צפ see this girl, go to school PP - prepositional phrase ( צירוף יחס (צי to this girl, at the party AP - adjective phrase ( צירוף תואר (צת very quick, quite slow ADVP - adverb phrase very quickly, quite slowly צ. תהפ (צתהפ ( 43

Subcategorization והצרכות הפועל משלים של פועל צרוף שנוסף לפועל: יוסי אכל מהר את התפוח האדום. Direct object adverb subject * יוסי הלך את התפוח. לפעלים שונים יש משלימים שונים. 44

Subcategorization והצרכות הפועל ניתן לחלק את הפעלים למחלקות שקילות ע"פ המשלימים שהם מקבלים. כך נחלק את הפעלים לתת קבוצות הנקראות subcategory ניתן להשתמש במשלימים כדי להבחין בין משמעויות שונות של אותו הפועל: המ"כ הריץ את הטירונים. התכניתן הריץ את התכנה. הקצין חזר לבסיס. הקצין חזר בו. 45

Subcategorization והצרכות הפועל ניתן לחלק את הפעלים למחלקות שקילות ע"פ המשלימים שהם מקבלים. כך נחלק את הפעלים לתת קבוצות הנקראות subcategory יש משלימים שהם הכרחיים ואלה נקראים הצרכות * The boy ate lunch ראובן מתגורר בתל אביב 46

מטרות התחביר להראות את הקשר בין הרכיבים. אילו רכיבים משלימים רכיבים אחרים, ראיתי את האיש עם הטלסקופ. ראיתי את האיש באמצעות הטלסקופ. או ראיתי איש שמחזיק טלסקופ. 47

עץ גזירה לדוגמא S VP PP NP NP? ADVP? D A N AUX V DEG ADV P D A N this tall boy will speak very slowly to that short girl 48

ניתוח סוגריים מקביל [ S [ NP [ D [ this] VP [ V [ speak] PP [[ [ A P tall] to] [ [ [ N ADVP NP boy]]] [ [ D DEG that] [ AUX very] [[ A will] [ ADV short] slowly]] [ N girl]]]]]] 49

Dependency Grammar גישה שונה לניתוח, בלי צמתים פנימיים: This tall boy will talk very slowly to that short girl 50 ניתן להוסיף תוויות לקשתות שיתארו את התפקיד התחבירי של הקשר למשל "תואר", "נושא" בעוד שעץ התחביר מדגיש את הסדר דקדוק התלויות מדגיש את הקשר

מילה ות מ נית (token) בדרך כלל, כל תמנית היא מילה נפרדת. אך מה בקשר ל- בית ספר, אחר כך, אף על פי כן? והילד, לביתו? מסקנה: אין זהות בין מילים ותמניות. 54

יחידות הבסיס של התחביר יש לשים לב שהטרמינלים בניתוח התחבירי הן המורפמות, לא התמניות. S 2 NP S CONJ S 1 NP V PN V PN 55 משה נסע ו-יצחק חזר

תחומי הבלשנות המודרנית 56 פונטיקה: מחקר התכונות האנטומיות של מערכת הדיבור והתכונות הפיזיות של גלי הקול שהיא מייצרת. פונולוגיה: מחקר יחידות הקול הבסיסיות בשפה המדוברת. מורפולוגיה: מחקר יחידות המשמעות הקטנות ביותר בשפה (מורפימות) ואופן צירופן למילים. תחביר: מחקר אופן צירוף המילים בשפה ליחידות גדולות יותר. סמנטיקה: מחקר המשמעויות של ביטויים בשפה והיחסים ביניהן. פרגמטיקה: מחקר אופני השימוש בשפה בחברה.

סמנטיקה חלוקה לתפקידים קלט: [This tall boy] [will talk [very slowly] [to [that girl]]] Subject Object Verb aux Place Manner Degree Agent recipient action time Manner degree 57 מתאר את התפקיד הסמנטי של המילה/צרוף

Thematic Roles agent recipient instrumental The boy broke the window with a stick. subject instrumental The stick broke the window. subject direct object recipient direct object indirect object The window was broken 58 recipient subject

סמנטיקה [This tall boy] [will talk [very slowly] [to [that girl]]] נמיר את הטקסט לנוסחה לוגית Slowly(Talk(boy 31,girl 72 )) שיכול להיות לה ערך true או false ניתן להשתמש בנוסחאות אלו כדי להסיק מסקנות: Person(Socrates), Person(X) Mortal(X) Mortal(Socrates) 59

ידע עולם כדי להסיק מסקנות דרוש ידע על העולם (לדוגמא Person(X) Mortal(X).( אוסף אחד של חוקים כאלה הוא: Cyc(Doug Lenat) is an AI project that attempts to assemble a comprehensive ontology and knowledge base of everyday common sense knowledge 60

פרגמטיקה תורת השיח למצוא את המטרה של הדיבור. תחום שקשה למחשב כיון שהמטרה לא מוגדרת היטב. יש תת-מטלות שניתן למחשב לדוגמא אנפורות. 61

אנפורות כינויי גוף שמתי את הספל על השולחן והוא נשבר. הרצל חזה את המדינה השולחן או הספל? איזו מדינה? 62 אנפורה היא מילה שמתייחסת לישות אחרת בשיח. התרת אנפורות למצוא ל מה מתייחסת כל אנפורה.

רב משמעות (ambiguity) מורפולוגית: שבתה שׁ ב ת ה =שבה (פועל) עבר נקבה גוף 3 שׁ ב ת ה =שבת (פועל) עבר נקבה גוף 3 שׁ בּ תּ הּ = ש+בת שלה שׁ בּ ת ה = ש+ב +תה שׁ בּ תּ ה = ש+בּ+ה+תה שׁ בּ ת הּ = שׁ בּ ת+ שלה... 63

רב משמעות (ambiguity) תחבירית: מספר אפשרויות לחלוקה לרכיבים. (1) יוסי תקף את האיש עם הסכין. יוסי תקף [את [האיש עם הסכין]] יוסי [תקף [את האיש] [עם הסכין]] לקסיקלית: מספר מובנים (או אפילו קטגוריות) לאותה מילה. (2) יוסי ביקר את השר. (3 א). שיטה זאת לא תעבוד. ב. העז טיפסה על שיטה. ג. יוסי שיטה בבריות. 64 פרגמטית: זיהוי המטרה של השיח, התרת אנפורות.

רב משמעות (ambiguity) הרב-משמעות הרבה מבדילה שפות טבעיות מרוב השפות הפורמליות, והיא אחד הקשיים המרכזיים בעיבוד שפות טבעיות. 65

שיטות מחקר בבלשנות החוקר מציב השערה, ובודק אותה באמצעות informant דובר ילידי של השפה. דוגמא לכלל שרוצים לבדוק: בעברית כל שמות עצם הנגמרים ב- ה הם ממין נקבה. נשאל דובר עברית למין הדקדוקי של מילים: ילדה, מסעדה, ארוחה,... דוגמא נגדית: לילה נעדן את ההשערה ע"י כך שנדרוש שההטעמה תהיה בהברה האחרונה (מלרע). הכלל המתוקן יותר מצומצם, אך לא כולל את אינפלציה, דמוקרטיה. נעדיף כללים פשוטים, מקיפים ככל האפשר, אך נרשה מספר קטן של יוצאים מהכלל (נמזער את :(Kolmogorov Complexity כל שמות העצם בעברית, שנגמרים ב- ה, פרט ללילה, הם ממין נקבה. 66

שיטות מבוססות קורפוס שיטת ה- informant היא בעייתית, כיון שהיא מחייבת דוברים להחליט אם משפט הוא תקין. אין הסכמה בין דוברים שונים. בהרבה מקרים ההחלטה מושפעת מהסמנטיקה: העגבנייה אכלה את הילדה. שיטת הקורפוס: נבסס את החלטותינו על סמך הסתכלות על קורפוס גדול. דוגמא: האם ניתן לנתח את המילה עליך כ-על י ך 67