regular_expression_examples.pages

מסמכים קשורים
regular_expression_examples

1 תבניות טקסט מהי תבנית טקסט? שימוש ב- Characters Meta שימוש ב- Expression Grouping שימוש ב- Quantifiers תת תבניות הפונקציה preg_match הפונקציה preg_m

תוכן העניינים

תוכן העניינים

משימה תכנית המתרגמת קטעי טקסט לשפה אחרת הקלט: קובץ המכיל את קטעי הטקסט וכן את השפה אליה רוצים לתרגם תרגול מס' 4: המתרגם שימוש במחלקות קיימות תכנות מתק

פייתון

<4D F736F F D20E7E5F7E920E0E9EEE5FA20E1E8E1ECE42E646F63>

פרויקט "רמזור" של קרן אביטל בס "ד מערך שיעור בנושא: "פונקציה" טליה קיפניס והדסה ערמי, מאולפנת צביה פרטים מקדימים על מערך השיעור: השיעור מהווה מבוא לנו

מבוא לתכנות ב- JAVA תרגול 7

דף נגזרות ואינטגרלים לשאלון 608 כללים למציאת נגזרת של פונקציה: n 1. y' n x n, y הנגזרת x.1 נכפול בחזקה )נרשום אותה משמאל ל- (. x א. נחסר אחד מהחזקה. ב

מרצים יקרים, אתר המכללה מאפשר למרצי המכללה להזין את פרטיהם וקורות חייהם. זאת בדומה לאתרים מקבילים של מוסדות אקדמיים בארץ ובעולם. עמודי המרצים נועדו לא

תרגול מס' 4: המתרגם שימוש במחלקות קיימות מחרוזות, קבצים, וקבלת קלט מהמשתמש

מבוא למדעי המחשב

תרגיל בית מספר 1#

Microsoft Word - ExamA_Final_Solution.docx

HTML - Hipper Text Makeup Language

2019 שאלות מומלצות לתרגול מס' דיפרנציאביליות של פונקציה סקלרית )המשך(. כלל השרשרת. S = ( x, y, z) z = x + 3y על המשטח מצאו נקודה בה מישור משיק

מספר מחברת: עמוד 1 מתוך 11 ת"ז: תשע"א מועד ב סמסטר א' תאריך: 00:11 שעה: 0 שעות הבחינה: משך כל חומר עזר אסור בשימוש בחינה בקורס: מבוא למדעי ה

שאלהIgal : מערכים דו מימדיים רקורסיה:

1 בגרות עח יולי 18 מועד קיץ ב שאלון x b 2 2 y x 6x שיעור ה- א x לכן, של קדקוד הפרבולה, ו-, מתקבל על ידי הנוסחה a. C(3, 9) ובהתאם, y. (3, 9) 2 C

PowerPoint Presentation

מדריך למרצים ומתרגלים 1

פתרון מבחן במיקרו בקרים תשעו

מבוא למדעי המחשב

תשע"דד אביב תוכנה 1 תרגיל מספר 4 עיבוד מחרוזות וקריאה מקבצים הנחיות כלליות: קראו בעיון את קובץ נהלי הגשת התרגילים אשר נמצא באתר הקורס..(

Slide 1

טעימה מסדנת 4 החלקים: קסמים מדהימים 3 מייסד בית הספר: יוני לחמי פלאפון:

Microsoft Word - tips and tricks - wave 5.doc

PowerPoint Presentation

ייבוא וייצוא של קבצי אקסל וטקסט

PowerPoint Presentation

234114

PowerPoint Presentation

שאלהIgal : מערכים דו מימדיים רקורסיה:

שקופית 1

פתרון מוצע לבחינת מה"ט ב_שפת c מועד ב אביב תשע"ט, אפריל 2019 מחברת: גב' זהבה לביא, מכללת אורט רחובות שאלה מספר 1 מוגדרת מחרוזת המורכבת מהספרות 0 עד 9.

תוכנה 1 1 אביב תשע"ג תרגיל מספר 5 מערכים, מחרוזות, עיבוד טקסט ומבני בקרה הנחיות כלליות: קראו בעיון את קובץ נהלי הגשת התרגילים אשר נמצא באתר הקורס. הגש

ISI

Slide 1

Slide 1

אוניברסיטת בן גוריון בנגב תאריך המבחן: שם המרצה: מר אלכסנדר שקולניק, בשפת JAVA מבחן ב: מבוא לתכנות מס' הקורס : מיועד לתלמידי : הנד

PowerPoint Presentation

בגרות עז יולי 17 מועד קיץ ב שאלון ,000 א. ניתוח הנתונים מחירה של ספה הוא שקלים, והיא התייקרה ב-. 25% כאשר המחיר מתייקר ב- המחיר החדש הוא פי,

PowerPoint Presentation

שאלהIgal : מערכים דו מימדיים רקורסיה:

דוגמאות שהוצגו בהרצאה 10 בקורס יסודות מערכות פתוחות דוגמה 1 דוגמאות של פונקציות ב- awk שמראות שהעברת פרמטרים של משתנים פשוטים היא by value והעברת פרמט

יצוא לחשבשבת תוכן עיניינים הגדרות - חשבונות בנק...2 הגדרות - הגדרות חשבשבת... 3 הגדרות - כרטיסי אשראי... 4 הגדרות - סוגי הכנסה... 5 יצוא לחשבשבת...6 י

PowerPoint Presentation

גילוי דעת 74.doc

שיעור מס' 6 – סבולות ואפיצויות

Microsoft Word - tik latalmid-final

Microsoft Word - אלגברה מעורב 2.doc

תכנות מונחה עצמים א' – תש"ע

<4D F736F F D20F4FAF8E5EF20EEE5F2E320E020F1EEF1E8F820E120FAF9F2E3>

פקולטה לחינוך מנהל סטודנטים Beit Berl College الكلية االكاديمية بيت بيرل 20/06/2016 י"ד/סיון/תשע"ו ייעוץ וירטואלי הרכבת מערכת )רישום לקורסים( באמצעות

הטכניון מכון טכנולוגי לישראל אלגוריתמים 1 )443432( סמסטר חורף הפקולטה למדעי המחשב תרגול 9 מסלולים קלים ביותר תרגיל APSP - 1 עד כה דנו באלגור

מבוא למדעי המחשב

תרגול מס' 1

מבוא למדעי המחשב

Microsoft Word - 01 difernziali razionalit

Slide 1

נובמבר 2010 תקנון הצטרפות למבצע מחשב טאבלט - Acer לקוחות חדשים ומשדרגים 1. תקופת המבצע המבצע יחל בתאריך ויסתיים ב או עד גמר המלאי,

סרגל כלים ל-Outlook או לExplorer- מדריך למשתמש

עוצמת ההורשה מה הופך את ההורשה לכלי כל כך עוצמתי? מעבר לכך שהוא מקל בהגדרת מחלקות חדשות על סמך מחלקות קיימות, יש לנו אפשרות להתייחס לאובייקט מסויים בכ

מבוא למדעי המחשב

untitled

תיק משימטיקה מגרף הנגזרת לגרף הפונקציה להנגשה פרטנית נא לפנות: כל הזכויות שמורות

Microsoft Word - tutorial Dynamic Programming _Jun_-05.doc

" תלמידים מלמדים תלמידים."

1 בחירת מנועי חיפוש באינטרנט תוצאות החיפושים באינטרנט, תלויות בבחירת מנוע חיפוש מתאים. אמנם גוגל הוא המנוע המוכר ביותר, ובכ"ז, לעתים השימוש במנוע אחר,

מבחן 7002 פרטים כלליים מועד הבחינה: בכל זמן מספר השאלון: 1 משך הבחינה: 3 שעות חומר עזר בשימוש: הכל )ספרים ומחברות( המלצות: קרא המלצות לפני הבחינה ובדי

פרק ג': עיצובים

מבוא למדעי המחשב - חובלים

לא טוב היות האדם לבדו

תורת החישוביות תרגול הכנה לוגיקה ותורת הקבוצות מה יש כאן? בקורס תורת החישוביות נניח ידע בסיסי בתורת הקבוצות ובלוגיקה, והכרות עם מושגים בסיסיים כמו א"ב

Microsoft Word - 28

Microsoft Word - c_SimA_MoedB2005.doc

PowerPoint Presentation

תרגול 1

בארץ אחרת

שבוע 4 סינטקס של HACK ASSEMBLY ניתן להשתמש בשלושה אוגרים בלבד:,A,D,M כולם בעלי 16 ביטים. M אינו אוגר ישיר- הוא מסמן את האוגר של ה RAM שאנחנו מצביעים ע

מבחן סוף סמסטר מועד א 15/02/08 מרצה אחראית: דר שירלי הלוי גינסברג מתרגלים: גלעד קותיאל, דניאל גנקין הוראות: א. בטופס המבחן 7 עמודים ו 4 דפי נוסחאות. ב

תכנות בשפת פייתון ברק גונן

Slide 1

תרגול מס' 7 – חזרה על MST ואלגוריתם Dijkstra

תוכן הגדרת שאלת רב-ברירה ]אמריקאית[...2 הגדרת שאלת נכון\לא נכון...8 שאלות אמריקאיות 1

Python 2.7 in Hebrew

Slide 1

Slide 1

מהוא לתכנות ב- JAVA מעבדה 3

Microsoft PowerPoint - T-10.ppt [Compatibility Mode]

הנחיות הורדה ותפעול לספרים דיגיטלים. הוצאת כנרת, זמורה ביתן שמחה להגיש לכם, התלמידים, ספר דיגיטלי. הספרים עצמם הינם בקבצי PDF הניתנים להורדה ללא עלות

אוניברסיטת בן גוריון בנגב תאריך המבחן: שקולניק אלכסנדר שם המרצה: מר בשפת JAVA מבוא לתכנות מבחן ב: מס' הקורס : הנדסת תעשיה וניהול מ

PowerPoint Presentation

ע 001 ינואר 10 מועד חורף פתרונות עפר

חטיבה של ג'יי סי הלת' קר בע"מ 1/10/2015 תקנון מבצע "תוכניות שנתיות" הטבה של חודשיים מתנה בעת רכישת "תוכנית שנתית" של עדשות מגע חד-יומיות ממותג אקיוביו

אי שוויונים ממעלה ראשונה לארבע יחידות

תמליל:

כדי להשתמש בתבנית של re כמשתנה, עלינו לבצע קומפילציה של הביטוי pattern = re.compile( abc ) text = Ha HaHa matches = re.findall(pattern, text) matches = re.finditer(pattern, text) - match מחזירה או אובייקט או.None בודק רק מהתחלת המחרוזת. (לא שימושי) search מחזירה אובייקט מסוג match (עבור המופע הראשון משמאל שתואם). findall מחזיר רשימה finditer מחזיר אובייקט שהוא איטרטור ומתוכו אפשר לקבל אינפורמציה. למשל את הפוזיציות של מה שהתאים על ידי המתודה:( span( את התת מחרוזות התואמת על ידי group() תוים שזקוקים ל הגנה בתוך ביטוי רגולרי (מיוחדים) הם: ( ) \ [ ] { }? + * $ ^. ההגנה נחוצה על מנת שיאבדו את תפקידם המיוחד והיא מורכבת מציון התו \ slash) ( back לפני התו המיוחד - ניראה זאת בהמשך.. התו נקודה תואם כל תו מלבד תו שורה חדשה. d\ - כל ספרה D\ - כל דבר שאינו סיפרה. (a-z A-Z 0-9 (_ אותיות קטנות או גדולות או סיפרה או קו תחתון - w\ w\ כל דבר שאינו W\ t\ או tab וגם n\ כל תו שהוא ניראה כרווח (גם התו של שורה חדשה s\ s\ כל מה שאינו S\ התוים המיוחדים הבאים משמשים כעזר לגידור תוים אחרים. דוגמה: example1 Ha HaHa למשל אם נתונה המחרוזת:.(word boundary) נועד כדי לגדר מילה b\ מדוע קיבלנו רק שתי התאמות ולא שלוש? pattern = \bha התו b\ מציין גבול מילה לפני המילה, כלומר גם התחלת המחרוזת וגם תו הרווח הם כאלה. ה- Ha השלישי אינו כזה. B\ כל מה שאינו בגידור של מילה. זה למשל יתן לנו את ה- Ha השלישי בלבד.

דוגמה: example2 ^ - נועד לגדר משהו בתחילת המחרוזת $ - נועד לגדר בסוף המחרוזת. דוגמה: example3 חיפוש תבניות כלליות נניח שאנחנו רוצים לחפש משהו שנראה כמו מספרי טלפון מהסוג: 054-8381185 או מהסוג: 050.4040398 (כלומר מפריד של נקודה או מקף בין קידומת ומיספר) ננסה להשתמש במה שמציין סיפרה: d\ למשל: \d\d\d.\d\d\d\d\d\d\d שימו לב ששמנו את התו המיוחד נקודה בין השלוש הראשונות והשבע הבאות (זה נועד להכיל את המקף או הנקודה, כיוון שנקודה משמע כל תו כמעט) מחלקות תוים אנו עלולים לקבל יותר מידי. כדי לציין שרק מקף או נקודה רצויים נוכל להשתמש במה שניקרא: מחלקת תוים class) ( charcter set שמצויינת על ידי סוגריים מרובעים. שימו לב שהסוגריים המרובעים מציינים רק תו אחד והבחירה היא או בין התוים שבתוכם. עוד דוגמה אפשר כך לבדוק תקינות של מספר טלפון. עבור סלולרי, הקידומת היא 05 בתוך מחלקת תוים התו מקף מקבל משמעות מיוחדת. הוא נועד לומר ממשהו ועד משהו. כך אפשר לשפר עוד יותר את הדיוק של בדיקת הטלפון. בואו נניח שכל הסלולריים בעלי קידומות 055,054,053,052,051,050 ניתן לסיפרה הימנית לרוץ מ- 0 ועד 5) [a-z] [A-G] [a-za-z] באותה מידה אפשר להשתמש בטווח אותיות: שלילת רישיון לתו

example4 גם התו ^ (caret) מקבל משמעות מיוחדת בתוך מחלקת תוים. פירושו שלילת התוים, כלומר כל מה שהוא לא התוים שבאים אחריו. למשל [^abc] פירושו כל מה שאינו a, אינו b ואינו c. למשל זיהוי הזמנות. חייבת להתחיל בסיפרה 8 7, או 9, וחייבת להיות בעלת 4 ספרות. מצייני כמויות {4} {1,3}?,*,+ + אחד או יותר * אפס או יותר? אפס או אחד {n} מספר פעמים שבסוגריים m ל- n כמספר בין {n,m} אפשר למשל לקצר את הבדיקה של מספר הטלפון כמו בדוגמה הראשונה של.example5 נעבור לדוגמה קצת יותר חכמה. נניח שרוצים להיות מסוגלים לתפוס כותרת של מכתב שמופנית לאדם והאפשרויות הן: Mr. Jones Mr Eduards Ms Smith Mr. T Mrs. Robinson קודם ננסה לתפוס את,Mr. Mr והשם משפחה. לאחר מכן ננסה גם את ה - Ms וה- Mrs. לשם כך נלמד מושג נוסף שנקרא קבוצה והיא מוגדרת בין סוגריים רגילות. בתוך הסוגריים אפשר להשתמש בסימן או אחרי שהצלחנו לתפוס את כל הכותרות (עוד נחזור לנושא של קבוצות ביתר פירוט).

כתובות email בואו ננסה לכתוב ביטוי שיתפוס את 3 הכתובות הבאות: js3104@nyu.edu freddy.krooger@yahoo.net aaron@gmai.com example6 ישנם באינטרנט הרבה ביטויים שמנסים להכיל כמה שיותר אפשרויות עבור כתובת mail ולקרוא אחד כזה יותר קשה מאשר לכתוב בדרך כלל. דוגמה אינטרנטית עבור כתובת mail r [a-za-z0-9-.]+@[a-za-z0-9]+\.[a-za-z0-9-.]+ שימו לב שלא צריך הגנה על הנקודה בתוך הסוגריים המרובעים, אבל צריך מחוצה להם. חלוקה לקבוצות בעזרת סוגריים example7 בדוגמה הבאה ברצוננו לתפוס כתובות אינטרנט מכל מיני סוגים, למשל: https://www.google.com http://yahoo.com https://youtube.com https://www.nasa.gov רואים שלעיתים יש http ולעיתים https בתור פרוטוקול. נעשה את ה- s אופציונלי. בשם הדוממין לעיתים יש www ולעיתים לא. גם רמת הדומיין הגבוהה לעיתים.com ולעיתים.gov ניכתוב ביטוי שלא רק יבצע בדיקת התאמה, אלא גם יתפוס קבוצות של סוגריים עגולים. לשם הבנת התוצאה נשתמש במתודה group של אובייקט.match קבוצת האפס היא תמיד כל מה שתואם לביטוי כולו. pattern = re.compile('https?://(www\.)?(\w+)(\.\w+)') מלבד קבוצת האפס יש לנו כאן את קבוצת הרמה הנמוכה של הדומיין, שם הדומיין וקבוצה עבור הרמה הגבוהה של הדומיין. כאשר משתמשים בקבוצות, השימוש ב - findall יותר מורכב, כי הוא מחזיר את כל הקבוצות שתאמו. example8

יחד עם הקבוצות ניתן גם להשתמש בשיטה שניקראת התיחסות לאחור back) (reference שמאפשרת לנו באותה נשימה של יצירת הקבוצות, גם להשתמש בהן. ניראה זאת בעזרת דוגמה שגם משלבת החלפה של המחרוזות שתאמו בקבוצה או קבוצות שהתקבלו. הקבוצות מצויינות על פי סדר יצירתן ניתנות להתייחסות כ: 1\ \3 \2, וכדומה. דגלים זהו פרמטר נוסף בסוגריים. למשל אם רוצים להתעלם מאותיות גדולות/קטנות, מוסיפים דגל של re.i ישנו דגל שמאפשר להשתמש ב- ^ ו- $ עבור כל שורה בטקסט מרובה שורות על כל שורה במקום רק על התחלה וסיום מחרוזת. ישנם עוד דגלים שלעיתים ניתן להיעזר בהם. תירגול של ביטויים רגולריים.1 נתונה מחרוזת, יש לכתוב פונקציה בפייתון שתחזיר אמת אם יש במחרוזת רק ספרות בינריות, ושקר אחרת. הבדיקה תיעשה בעזרת ביטוי רגולרי מתאים..2 נתונה מחרוזת ובה ישנם מספרים בני 3 ספרות. יש לכתוב פונקציה שתיעזר בביטוי רגולרי ותחזיר ברשימה את כל המספרים הללו. הם חייבים להיות מוקפים ברווחים לפני ואחרי.