שיעור 15 – סמנטיקה.


66 views
Uploaded on:
Description
שיעור 15 – סמנטיקה. יעל נצר מדעי המחשב. ייצוג המשמעות. מחפשים דרכים לייצוג סמנטי של משמעות מבעים בשפה טבעית, נקרא להם שפות ייצוג סמנטי meaning representation languages כהמשך למה שראינו עד כה (ייצוג מורפולוגי, ייצוג תחבירי).
Transcripts
Slide 1

שיעור 15 – סמנטיקה יעל נצר מדעי המחשב

Slide 2

ייצוג המשמעות מחפשים דרכים לייצוג סמנטי של משמעות מבעים בשפה טבעית, נקרא להם שפות ייצוג סמנטי meaning representation dialects כהמשך למה שראינו עד כה (ייצוג מורפולוגי, ייצוג תחבירי). שפת ייצוג למשמעות נדרשת מכיוון שהייצוגים הנ"ל אינם מספיקים לעיבוד סמנטי של מבעים בשפה. למשל – כשעונים על שאלות במבחן או כשעוקבים אחר הוראות של מתכון, או כשמבינים שמה שנאמר לך היה עלבון. כדי לבצע פעולות כאלה דרוש חיבור בין הרכיבים הלשוניים ובין ידע העולם. הפעולה של השמת מבני משמעות לרכיבים לשוניים נקראת ניתוח סמנטי semantic investigation .

Slide 3

ייצוגים אפשריים למשמעות x,y Having (x) Haver (Speaker, x)  HadThing (y,x)  Car (y) 1 Having Haver: Speaker HadThing: auto 2 4 Having Haver HadThing Car POSS-BY Speaker 3 auto Speaker

Slide 4

צורות ייצוג משפט על פי First Order Predicate Calculus . הגרף נקרא רשת סמנטית semantic system תלות מושגית applied reliance ייצוג outline based למרות ההבדלים בייצוג ברמה האבסטרקטית בכולם הייצוג המושגי מורכב ממבנה שהוא אוסף מושגים הכוללים אובייקטים ויחסים בין האובייקטים באיזשהו עולם מיוצג. כל הייצוגים הנ"ל ניתן לראות מלפחות שתי נקודות מבט: ייצוג של המשפט I have an auto . ייצוג על מצב בעולם הדואליות הזו מאפשרת לייצוג להיות החוליה המקשרת בין השפה ובין העולם.

Slide 5

עניינים בסיסיים בייצוג חישובי - Verifability Does Maharani serve veggie lover nourishment? הדרישה היא שנמצא את הקשר בין הייצוג המשמעות של המשפט ובין העולם המיוצג כפי שאנו מכירים אותו. כלומר, אנו נדרשים למצוא את ערך האמת של המשמעות ביחס לעולם. אפשרות בסיסית לעשות זאת היא על ידי התאמה בין ייצוג המשמעות ובין בסיס נתונים המייצג את העולם. Serves(Maharani, VegetarianFood) אם נמצא בבסיס הנתונים אישור לעובדה זו נחזיר אישור, אחרת התשובה היא "לא" אם הידע על העולם הוא "מלא" או תשובה אחרת באם ידוע שהמידע הוא מידע חסר. Verifability אם כן מתייחס ליכולת להשוות בין המצב המתקבל מהייצוג של המשפט ובין המצב בעולם כפי שהוא מיוצג בבסיס הנתונים.

Slide 6

דרישות – המשך – ייצוג חד משמעי I wanna eat somewhere that " s near ICSI שתי משמעויות – המערכת צריכה לבחור את המשמעות העדיפה או הנכונה בהקשר. הייצוג צריך להיות חד משמעי למרות שהקלט עצמו הוא רב משמעי. אפשרות אחרת היא unclearness "עירפול" I need to eat Italian sustenance . הדוגמא היא חד משמעית אך לא אומרת באמת מה רוצה הדובר לאכול. לעיתים ייצוג מעורפל הוא דווקא מועיל ולפעמים יש צורך בייצוג מדוייק וחד משמעי יותר כדי למצוא את הנתונים המתאימים ב\'עולם\'

Slide 7

דרישות – המשך – ייצוג קאנוני sanctioned structure אין התאמה חח"ע בין משפט ובין הייצוג הסמנטי שלו (רב משמעות) וגם לא להפך: Does Maharani have veggie lover dishes? Do they have veggie lover sustenance at Maharani? Are vegan dishes served at Maharani? Does Maharani serve vegan charge? מצד אחד זה נראה הגיוני שלכל משפט יהיה ייצוג שונה, מצד שני זה יהיה לא רצוי מבחינת אפשרויות ההתאמה על הייצוג שיש ל\'עולם\' (איחסון של כל אפשרויות המבע לעובדה בעולם היתה אולי אפשרית אך בלתי רצויה בעליל). ניתן לצמצם ייצוגים לפחות ביחס ל space או למטרה מסויימת.

Slide 8

דרישות – accepted structure - המשך המושג לקלטים שונים שלהם צריך להיות אותו ייצוג למשמעות נקרא authoritative structure המאפשר פישוט של תהליך ההסקה, אם המערכת צריכה להתמודד רק עם ייצוג יחיד. מצד שני, ייצוג קנוני מסבך את תהליך הניתוח הסמנטי (וראו הדוגמאות). ומצד שלישי, יש כמה דרכים להתגבר על הבעיה...

Slide 9

דרישות – sanctioned structure - המשך למילים sustenance, dish, admission יש שימושים רבים, אך גם לכולם יש איזושהי מובן sense משותף Fare Food and beverage; diet: basic home-cooked charge . Sustenance A predefined sort of support: breakfast nourishment; plant sustenance. Dish The nourishment served or contained in a dish: a dish of dessert. A specific assortment or arrangement of sustenance: Sushi is a Japanese dish.

Slide 10

דרישות – authoritative structure - המשך אם למערכת יש את האפשרות למצוא את המובן המשותף למילים שונות, אזי אותו ייצוג משמעות אפשרי לצירופים המכילים את אותה מילה. אומרים שלמילים יש word faculties מגוונות, ובחירת המובן הנכון בהקשר נתון נקרא word sense disambiguation , או תיוג, בדומה לתהליך השמת POS למילה. לכן ניתן לומר שלמרות שבקלטים שונים יש מילים שונות, עדיין ניתן לתת להם את אותו מבנה משמעות.

Slide 11

דרישות – standard structure - המשך קשרים אחרים, לא לקסיקליים בין קלים שונים בעלי אותה משמעות, הם ייצוגים תחביריים שונים. כלומר, מבנים שונים יכולים להיות קשורים זה לזה באופן סיסטמטי גם מנקודת המבט התחבירית: Maharani serves veggie lover dishes. Vegan dishes are served by Maharani . למרות המיקום השונה של הארגומנטים בפועל serve ניתן לראות ש veggie lover dishes ו-maharani אותם תפקידים במשפטים השונים ב-voice : האחד פעיל והשני סביל.

Slide 12

דרישות חישוביות – המשך – היסק ומשתנים Can veggie lover eat at Maharani? אין פה אותו מבנה קנוני כמו לשאלות שראינו קודם, למרות שהתשובה היא אותה תשובה. הקשר הוא קשר של הגיון sound judgment , בין מה שצמחונים אוכלים ומה שמגישים במסעדות צמחוניות. כלומר: זוהי עובדה על העולם ולא עובדה הנובעת מתוך השפה עצמה. לכן, ייצוג קנוני אינו מספיק, ודרושה אפשרות לקשר בין ייצוג כזה ובין עובדות נתונות על העולם – כלומר דרוש מכניזם של היסק Inference שיאפשר למערכת למצוא ערכי אמת של מבנים שאינם נמצאים בבסיס הידע.

Slide 13

דרישות חישוביות – המשך – היסק ומשתנים I " d like to discover an eatery where I can get vegan nourishment. בדוגמא הזו אין איזכור למסעדה ספציפית, לא ניתן לעשות התאמה ליטרלית בין בסיס הידע ובין מבנה המשמעות, ויש צורך בהתאמה על פי משתנים. Serves(x, VegetarianFood) בשפה המדוברת יש הרבה מקרים של התייחסות לאובייקטים \'לא ידועים\' ומכניזם כזה הוא הכרחי.

Slide 14

דרישות חישוביות - expressiveness המצב האידאלי הוא פורמליזם שיאפשר ייצוג סמנטי יחיד לכל מבע אפשרי בעולם. נראה ששימוש ב-first request predicate math הוא טוב מספיק או טוב למדי...

Slide 15

מבני משמעות בשפה – predicate contention structure בכל השפות המדוברות מבנה הפרדיקט-ארגומנטים הוא הגרעין והיסוד של המשמעות בשפה. ההנחה הגסה הראשונה היא, אם כן, שבמשפט קיים יחס כלשהו בין המושגים המובעים במילים שבו וברכיביו השונים. אותו יחס הוא הבסיס לייצוג הסמנטי שיש למשפט. אחד התפקידים החשובים של התחביר הוא לתת מסגרת שתאפשר בנייה של אותו ייצוג, והייצוג צריך שיהיה לו קשר הדוק עם אותו מבנה תחבירי.

Slide 16

מבנה פרדיקט - דוגמא I need Italian nourishment. I need to spend under five dollars. I need it to be close by here. NP need NP need Inf-VP NP need NP Inf-VP

Slide 17

מבנה פרדיקט ארגומנטים ניתן לראות מכל המסגרות הנ"ל שהארגומנט הראשון הוא NP , שהוא ממוקם לפני הפועל, ושהוא מתייחס ל\'רוצה\'. הארגומנט השני שייך, בכל המקרים, למה ש\'רוצים\'. מסגרת ה-subcategorization של הפועל מהווה Link – קשר בין הארגומנטים

Recommended
View more...