לפני 20 שנה, עיבוד שפה לא היה נכלל תחת "מדעי הנתונים", מאז הדברים השתנו מאד. רשתות הלמידה ואלגוריתמים עתירי נתונים נמצאים בחזית הטכנולוגיה בתחום של תרגום מכונה, תיקון שגיאות, ניתוח רגשות, זיהוי נושא ושאר בעיות NLP.
בפרק זה, נדבר עם פרופ' רועי רייכרט מהפקולטה להנדסת תעשייה בטכניון, על עיבוד שפה טבעית. מה הן בעיות היסוד בתחום? אילו מהן פתורות וכיצד? כמו כן, נדבר על הקשר למדעי נתונים ואלגוריתמים
רועי רייכרט הוא פרופסור חבר בפקולטה להנדסת תעשיה וניהול בטכניון. תחום המחקר שלו הוא עיבוד שפה טבעית והוא עובד על שלוש בעיות עיקריות הקשורות זו לזו: (א) בעיית ההכללה - יצירת אלגוריתמים שיכולים ללמוד שפות מסוימות בסביבות מסוימות (למשל ביקורות על מוצרים באנגלית) ולהבין שפות חדשות בסביבות חדשות (למשל סקירות פוליטיות ביפנית); (ב) פיתוח כלי הסקה סיבתית לתחום - כדי ליצור מודלים יציבים וקומפקטיים יותר וכדי להבין כיצד מודלים של עיבוד שפה פועלים; ו (ג) הממשק בין עיבוד שפה לבין חיזוי של רגשות, קבלת החלטות והתנהגויות אנושיות - מתוך תפישה ששפה עשויה לשמש צוהר לנפש האדם, ושניתן להבין מתוך פעולתם של מודלים חישוביים כיצד אנשים מעבדים שפה בהקשרים שונים. רועי משמש כעורך בעיתונים ובכנסים המובילים בתחום, פרסם מעל 100 מאמרים (כולל בכתבי העת המובילים בבינה מלאכותית ובפסיכולוגיה) ומשמש כיועץ ומדען בחברות היי-טק מובילות בישראל ובעולם.
יש לכם שאלות או הצעות לנושאים שתרצו שנסקור בפרקים עתידיים? צרו איתנו קשר!
Follow us on Twitter!! 🐥 https://twitter.com/TalkingDataPod
לינקדאין של ד"ר רוזנבלט: https://www.linkedin.com/in/johnros/
לצפייה בפעילויות נוספות של איגוד מדעי הנתונים: https://www.aeai.org.il/professional-society/data-science/datascience-past-activity/