מהנדס מידע - Engineer Data 295 שעות לימוד אקדמיות תיאור התפקיד: ככל שהאנושות צועדת עמוק יותר לתוך "עידן המידע" והארגונים מאמצים את הטכנולוגיות המתקדמו

מסמכים קשורים
BIG DATA תיאור הקורס המונח Big Data הולך וצובר תאוצה בשנים האחרונות, הוא הופך למגמה רווחת בתעשייה. המשמעות הפרקטית של המונח Big Data הינה טכנולוגיות נ

Data Analyst Expert 042 שעות תיאור ההכשרה: בעולם העסקי של היום, נתונים, מידע וחיזוי הם העתיד של כל ארגון. כמויות המידע שנאספות בארגונים ובאנושות כולה

Real Time College Course: Networking Duration: 90 Hours Hands-On-Training

תיאור הכשרה: BI & Big Data Analyst Expert 544 שעות בעולם טכנולוגי ועסקי, הנתונים והמידע הם הנכס האמיתי של כל ארגון בעולם. מסלול התמחות זה מכשיר את המו

MCSA Professional System & Network Administrator ניהול מחשבים רשתות ותקשורת Microsoft ו Cisco- להסמכות בינלאומיות MCSA 2016R2 & CCNA כמה עובדות חשובות

PowerPoint Presentation

מערכות הפעלה קורס מס'

PowerPoint Presentation

Microsoft PowerPoint - CE_Candidates_2011.ppt [Compatibility Mode]

PowerPoint Presentation

הכרת משאבי הספרייה קורס מקוון חיפוש במאגרי המידע ו- PubMed Biosis Previews, Zoological Record )לתלמידי החוג למדעי החיים( (Biosis Previews:

(Microsoft Word - SQL\353\351\345\345\365 \341\361\351\361 \360\372\345\360\351\355 \ doc)

מבחן בפיתוח מערכות תוכנה בשפת Java ( )

dh.bgu.class2

מצגת של PowerPoint

סילבוס קורס קידום ושיווק דיגיטלי מרצה: דן יופה אודות הקורס בקורס ילמדו המשתתפים על מעמקי שיווק האתרים החל מלמידת תאוריות שיווקיות עדכניות ועד הכשרה מל

לימודים קורסים השתלמויות לפורטל המשרות באתר הבוגרים משרות חמות הנדסת חשמל מתמטיקה פיזיקה מדעי המחשב תעשייה וניהול הנדסת מכונות הנדסה ביורפואית הנדסה א

PowerPoint Presentation

Cloud Governance הכלי למזעור סיכונים ומקסום התועלת העסקית

ללא כותרת שקופית

Slide 1

ISI

Customer Engagement Optimisation

Portal 6

<4D F736F F D20E1E9F7E5F8FA20E1F1E1E9E1FA20EEF2F8EBE5FA20EEE9E3F22DF2E1F820E4E5E5E420F2FAE9E32E646F63>

התגוננות בפני כוחות האופל

משימה תכנית המתרגמת קטעי טקסט לשפה אחרת הקלט: קובץ המכיל את קטעי הטקסט וכן את השפה אליה רוצים לתרגם תרגול מס' 4: המתרגם שימוש במחלקות קיימות תכנות מתק

תרגול מס' 4: המתרגם שימוש במחלקות קיימות מחרוזות, קבצים, וקבלת קלט מהמשתמש

Slide 1

חינוך לשוני הוראת קריאה: נקודת מבט של הערכה: מהן הסוגיות שבהן ידע מחקרי עשוי לסייע בעיצוב מדיניות ועשייה?

Bootcamp_Syllabus_2

1 בחירת מנועי חיפוש באינטרנט תוצאות החיפושים באינטרנט, תלויות בבחירת מנוע חיפוש מתאים. אמנם גוגל הוא המנוע המוכר ביותר, ובכ"ז, לעתים השימוש במנוע אחר,

שאלה 2. תכנות ב - CShell

תואר שני M.A. בייעוץ ופיתוח ארגוני בית הספר למדעי ההתנהגות

Microsoft PowerPoint - Lecture1

HUJI Syllabus

שקופית 1

HUJI Syllabus

Microsoft PowerPoint - lec2.ppt

החינוך הגופני בבית הספר מה רצוי ? מהו מקומה ש המכללה?

המעבר לחטיבה עליונה

- גרסת חורף 18' של Salesforce 10 חידושים בענן המכירות גרסת חורף 18' כבר כאן, ולפני שנסקור את השיפורים בגרסה זו, הכנו לכם חידה: ב- Webinar שעשינו בגרסה

29 מאי 2019 לכבוד המשתתפים שלום רב, הנדון: מכרז פומבי מס' 3213/2019 לתכנון, הספקת והתקנת ציוד לאולפן צילום TAU ONLINE בבניין נזריאן בקמפוס אוניברסיטת

כתיבת דו"ח אבחון ארגוני

Microsoft PowerPoint - T-10.ppt [Compatibility Mode]

טיפול זוגי בגישת AEDP טיפול חווייתי דינמי מואץ Accelarated Experiential Dynamic Psychotherapy

תורת הקומפילציה

95% בוגרים להשכלה גבוהה 70% דור ראשון במשפחתם יוזמה להקמת בית ספר תיכון על פי מודל ה - Picture Big תמונההגדולהה

(Microsoft PowerPoint \372\347\370\345\372 \341\362\351\343\357 \344\343\351\342\351\350\354\351)

מבוא למדעי המחשב

meli 2014

PowerPoint Presentation

Microsoft PowerPoint - 07_tdd.ppt

תרגיל 3 בקורס תוכנה 1

PowerPoint Presentation

I PRO Skills כישורים לעולם העבודה I CAN I AM I GROW I BUILD I NET I MIX כל הזכויות שמורות לג'וינט ישראל- תבת 2017

הסבר והתקנת ELK – ElasticSearch | Logstash | Kibana

Microsoft Word - Ass1Bgu2019b_java docx

תוכנה חופשית מאחורי הקלעים? על סדר היום: קצת על עצמי מה זאת תוכנה חופשית? ההיסטוריה של תוכנה חופשית כיצד תוכנה חופשית משתלבת בשוק התוכנה היתרונות של ת

סדנת תכנות ב C/C++

מיכפל

שקופית 1

גילוי דעת 74.doc

תכנות מונחה עצמים א' – תש"ע

Microsoft Word - markus214.doc

מטרות הקורס סמינר מחקר רגשות בשירות סמסטר א' תשע"ט דר' אריק חשין הקורס מיועד להקנות מיומנות בחשיבה מחקרית וביצוע מחקר באמצעו

1

Slide 1

תרגיל בית מספר 1#

Microsoft PowerPoint - meli-iso.ppt

אוקטובר 2007 מחקר מס 21 תקציר מנהלים הקמתם של אזורי תעשייה משותפים במגזר הערבי מחמוד ח טיב עמית קורת מכון מילקן

קורס בדיקות חוסן ופיתוח מאובטח 155 שעות

מצגת של PowerPoint

PowerPoint Presentation

מבוא ללוגיקה ולתורת הקבוצות

מסמך ניתוח תפקיד מדריך קבוצה במע"ש תעשייתי. מגישות: ציפי בן שמואל מנהלת מע"ש תעשייתי - אקי"ם חדרה דיאנה אטלס מנהלת רש"ת אלווין אשקלון קורס מיומנויות נ

Microsoft Word - UsingXMTenvironment.rtf

TEL- AVIV UNIVERSITY SACKLER FACULTY OF MEDICINE THE STANLEY STEYER SCHOOL OF HEALTH PROFESSIONS DEPARTMENT OF NURSING אוניברסיטת תל-אביב הפקולטה לרפו

Microsoft PowerPoint - L01-n.ppt

שעור 6

.#8)* '!),$ 217):: '!),$ ,'!8$ !20/

Microsoft PowerPoint - ציפי זלקוביץ ואולז'ן גולדשטיין - מושב 3 [Read-Only] [Compatibility Mode]

Access Medicine אוקטובר 2018

מכרז לבחירת רכז התחדשות עירונית במחלקת קהילה.docx ט' 1

ח ס פ - י ש י ז ר א מ w w w. p t o r a. c o. i l S a l e p t o r a. c o. i l

מבט על הוראת תלמידים מחוננים ומצטיינים בכיתה רגילה

הטכניון מכון טכנולוגי לישראל הפקולטה למדעי המחשב הוראות הגשה: ההגשה בזוגות. הוסיפו שמות, ת.ז., אי-מייל, תא אליו יש להחזיר את התרגיל ואת תשובותיכם לתרג

PowerPoint Presentation

תכנית לימודים לקורס מורי דרך מוסמכים

ענף המלונאות

עמוד 1 מתוך 5 הוועדה המקצועית לפסיכולוגיה קלינית י"ד אב, תשע"ו 18 אוגוסט, לימודי ליבה במגמות הקליניות, כישורים לתחילת התמחות, וההכשרה ב

תמליל:

מהנדס מידע - Engineer Data 295 שעות לימוד אקדמיות תיאור התפקיד: ככל שהאנושות צועדת עמוק יותר לתוך "עידן המידע" והארגונים מאמצים את הטכנולוגיות המתקדמות ביניהן גם טכנולוגיות ה- Data,Big עולה הצורך באנשי מקצוע שידעו לארגן את המידע הנרחב והמגוון שנאסף מהערוצים השונים ולהתאים אותו לצרכי הארגון. מחקר של Gartner לשנת 2017 מצא כי ארגונים מפסידים בממוצע 9.7 מיליון דולר בשנה כתוצאה מאיכות נתונים ירודה. נתונים לא מהימנים דורשים זמן רב מאוד לטיוב והכנתם לתחקור ע"י מדעני נתונים ואנליסטים, וזה יכול להגיע לכמעט 80% זמן השקעה מהזמן הכולל מדובר בשימוש לא מיטבי בכישוריהם. אבל איך ארגונים יכולים להרגיש בטוחים כי מקור הנתונים שלהם הוא אמין מבלי להבין תחילה מהו סוג הנתונים שנכנסים למערכת וכיצד להוציא אותם. מהנדס המידע, או ה - Engineer,Data ממלא תפקיד מפתח משמעותי ביותר בכל ארגון בו הוא משתלב. מהנדסי המידע מעצבים, מפתחים ומנהלים פתרונות לשינוע הנתונים )בניית (, Pipelines תוך כדי עבודה עם טכנולוגיות Big Data מגוונות ומתקדמות. עליהם לשלוט בטכנולוגיות המידע השונות, כולל בסביבות הענן, בכלים המובילים לשינוע ועיבוד מידע בנפחים גדולים ובשפת התכנות המובילה היום בעולמות ה - Data Engineering שהיא. Python למעשה מהנדס מידע מבין מהם הנתונים הנכנסים לארגון מכל מקור שהוא: הוא עובד עם נתונים גולמיים המכילים טעויות ושגיאות, או מכילים רשומות חשודות ולא מזוהות בפורמט שלהן, הוא מזהה מאיזה מקורות נכנס המידע, איזה סוג נתונים, הוא עוסק בחילוץ הנתונים בתבניות שמישות, ומוודא שהנתונים נטולי שגיאות וטעינתם תקינה עבור מדעני נתונים ואנליסטים. מהנדסי הנתונים יצטרכו להמליץ ולפעמים ליישם דרכים לשיפור אמינות הנתונים, יעילותם ואיכותם. כדי לעשות זאת, הם יצטרכו להשתמש במגוון שפות וכלים, הם יהיו מומחים בבנייה ותחזוקה של מערכות מבוססות נתונים התומכות בפעילות האנליטית והעסקית של הארגון. אף על פי שהם אינם מתפארים בכישורים הכמותיים שמדען נתונים ישתמש בהם, מהנדסי הנתונים יעשו את רוב העבודה הנדרשת כדי לתמוך בעומס העבודה של מדען הנתונים. תיאור ההכשרה: קורס Data Engineer של נאיה קולג' "צמח מהשטח" ופותח בהתאם לדרישות הקיימות כיום בשוק העבודה עבור Data.Engineers הכשרה זו מותאמת לדרישות התפקיד ולכן הינה מגוונת וכוללת היכרות עם טכנולוגיות מידע וכלים שונים. הקורס מתחיל בהיכרות ממפגש היכרות עם עולמות ה- Data המסורתיים וטכנולוגיות ענן ו- Data Big חדישות השולטות כיום בשוק המידע. לאחר מכן צולל לתוך מודול חשוב ביותר המקנה הבנה מעמיקה ומתקדמת בבניית תהליכי ETL מורכבים, כולל מתודולוגיה ו-.Best Practices לאחר מכן הקורס נכנס למודול ליבה הראשון של הקורס המלמד לעומק מגוון טכנולוגיות מתקדמות וחדשניות ביותר, כגון AWS,, Hadoop, Hbase, MongoDB, Kafka, Amazon - כולל תרגול תוך כדי השיעורים. מודול ליבה השני של הקורס מתמקד בלימוד מעמיק של שפת Python שהיא כלי עבודה מרכזי של מהנדס המידע בביצוע עיבודים שונים על המידע. נראה כיצד Python והחבילות ה"עוטפות" שלו APIs(,)Python מאפשרים לנו לאסוף מידע ממקורות שונים, לעבד אותו, לנתח אותו ואף להציג אותו בדרכים מגוונות. לאחר שנבין את הממשקים הבסיסיים הקיימים ב- Python לתהליכי עיבוד מידע נראה כיצד הם נראים בסביבת Big Data מאפשר לנהל את ה- Pipeline. PySpark ונכיר כיצד Spark נתייחס לסביבת Big Data בסביבת.Hadoop APIs לקראת סיום המודול הזה, נחשוף את העקרונות הבסיסיים בעולם ה- Machine Learning מפני במצבים רבים הלקוח המרכזי בתהליכי עיבוד דאטה הוא ה- Scientist.Data

בנוסף ללימוד התיאורטי והתרגולים השוטפים בקורס במודולים השונים, הקורס כולל פרוייקט Hands-on מקיף בו תוכלו להתנסות במכלול הטכנולוגיות הנלמדות. הפרוייקט מסייע לבוגרי הקורס לבצע אינטגרציה לכישורים והידע שאספו במודולים השונים באמצעות תפירת פתרון Big Data מהעולם האמיתי מקצה לקצה. באופן זה ההכשרה מכינה את בוגריה באופן מיטבי להתמודדות עם האתגרים בהם יתקלו בהמשך דרכם המקצועית. קהל יעד: מפתחים,,DBA אנשי,BI אנשי,IT מומחי,DevOps מנהלי מוצר טכנולוגי, מנהלי פרויקטים טכנולוגיים, בעלי ידע ונסיון במערכות מידע ומסדי נתונים רלציוניים. דרישות קדם: משתתפים בקורס צריכים להיות בעלי ידע וניסיון בתחום ה- DATA. נדרשות 5 שנות ניסיון לפחות בתחום ה- IT, מערכות מידע או פיתוח BI הכולל עבודה עם בסיסי נתונים והיכרות מעמיקה עם שפת.SQL הקבלה לקורס מותנית במעבר ראיון אישי ומבחן קבלה. תוכנית הלימודים: Data Technologies Introduction for Data Engineers Introduction to Big Data o History of Database Systems o Internet of Things and Data Explosion o Birth of clustered computing systems o Big Data technologies Hadoop - a closer look o Introduction to Hadoop o The Hadoop Eco-System o Hadoop and Data Science o Real world implementations of Hadoop NoSQL o Introduction to NoSQL o Main characteristics of NoSQL solutions o The four types of NoSQL solutions, leading technologies and real world use cases Technologies and trends in the world of Big Data o Search engines (Elastic search, SOLR) o Cloud Computing o NewSQL databases (Vertica, VoltDB, MemSQL) Module I - Advanced Data Modelling Concepts Database Modelling for OLTP, DWH and OLAP o OLTP vs. OLAP o Star / Snowflake schemas, Normalization o Identifying my data o Historical and Snapshot data o Logging events o Modelling many-to-many relationships o Slowly changing dimensions and facts

o Coping with large volumes of data o Multi-dimensional technologies Advanced ETL concepts and techniques o Full and incremental ETL o Loading techniques o ETL frequency o Cleaning and Transformation o Data Integrity o Performance o Scheduling and Logging o Validation and QA Module II - Big Data and NoSQL Main Technologies for Data Engineer Basic Linux o History & introduction o Connection & Man Pages o Files & Directories o Files Contents o Commands and Arguments o Shell Variables o Introduction to vi o Bash Scripting o Pipes and Commands Hadoop Infrastructure and Ecosystem Services o Hadoop core and ecosystem - The essentials (e.g. HDFS) o Using Flume to ingest data from various sources in real time o Using Sqoop to ingest data from Relational databases o Using Hive to query HDFS data with SQL o Using Impala to query HDFS data with SQL o Implementing Kudu as a columnar storage solution o Using Oozie as a workflow manager and job scheduler Implementing Kafka o Introduction to Kafka o Installation & configuration o Kafka components - consumer, producer and brokers o Configure Kafka operations on topic o Kafka integration with various consumers o Kafka APIs o Kafka cluster configuration and balancing NoSQL - HBase & MongoDB o Introduction to HBase o HBase client API for Batch, Scan, and Scan operations o HBase and MapReduce Integration o Basic data analytics using Hive and YARN

o Introduction to MongoDB and use cases o Understand documents and collections o Querying MongoDB database o Performing updates and deletes o Understanding MongoDB replication and sharding Search Engines - ELK & SOLR o Introduction to search engines o Introduction to Elasticsearch and typical use-cases o Basic setup and configurations o Indexes (Lucene) and mapping configurations o Querying: APIs, queries and complex queries, aggregations o Introduction to Logstash o Introduction to Kibana o Introduction to Solr search engine & components o Solr indexing o Use analyzers, tokenizers, and filters o Searching using Solr queries o Schema updates o Solr APIs Module III - Cloud Technologies for Data Engineers Cloud Computing o Introduction to cloud technologies o Types of cloud computing o Introduction to AWS / Azure / Google Cloud AWS o Introduction to AWS o Introduction to AWS Products o AWS RDS & Redshift o Amazon EMR o Amazon Kinesis o Amazon Athena o AWS Glue o AWS BigData processing with Lambda Module IV Python Programming and Tools for Data Engineers Python programming o Working environments (Python, Anaconda, Jupyter, PyCharm, etc.) o Data types (numbers, strings, Booleans, etc.) o Data collections (lists, dictionaries, etc.) o Flow control (if, for, while, etc.) o Textual interface (input and formatting) o Functions

o File-like objects o Object-Oriented programming (OOP) o Error handling (try and except) o Beyond the built-in library o Python Tools for Data Engineers Pandas Json Regular expressions Python APIs o Web scraping o Working with databases (sqlite3, pyodbc, ReST APIs) o Telegram bot Hadoop APIs o HDFS o Hive & Impala o Kafka Module V Spark and PySpark Introduction to Spark and PySpark Basic concepts (RDD, persistence, broadcast, etc.) Spark SQL (DataFrame, data sources, etc.) Module VI Machine Learning Introduction to machine learning & Spark ML Regression o Linear regression o Regression trees Classification o Decision trees Clustering o K-means