עיבוד שפות טבעיות (NLP) הוא תחום של בינה מלאכותית המאפשר למחשבים לנתח ולהבין שפה אנושית. היא נוסחה לבניית תוכנה המייצרת ומבינה שפות טבעיות כך שמשתמש יכול לנהל שיחות טבעיות עם המחשב שלו או באמצעות תכנות או שפות מלאכותיות כמו Java או C.
פירוק עיבוד שפות טבעיות (NLP)
עיבוד שפות טבעיות (NLP) הוא צעד אחד במשימה גדולה יותר עבור תחום הטכנולוגיה - כלומר להשתמש בבינה מלאכותית (AI) כדי לפשט את אופן פעולתו של העולם. העולם הדיגיטלי התגלה כמחלף משחקים עבור חברות רבות, שכן אוכלוסייה מתמצאת בטכנולוגיה הולכת וגוברת מוצאת דרכים חדשות לקיים אינטראקציה זו עם זו ועם חברות. המדיה החברתית הגדירה מחדש את משמעות הקהילה; cryptocurrency שינה את נורמת התשלום הדיגיטלי; המסחר האלקטרוני יצר משמעות חדשה של המילה נוחות, ואחסון בענן הציג רמה נוספת של שמירת נתונים להמונים.
באמצעות AI, תחומים כמו למידת מכונה ולמידה עמוקה פוקחים עיניים לעולם של כל האפשרויות. לימוד מכונה נעשה יותר ויותר בשימוש בניתוח נתונים כדי להבין את הנתונים הגדולים. זה משמש גם לתכנת צ'אט בוטים כדי לדמות שיחות אנושיות עם לקוחות. עם זאת, יישומים קדימה אלה של למידת מכונה לא יתאפשרו ללא אלתור של עיבוד שפות טבעיות (NLP).
כיצד פועלת NLP?
NLP משלב AI עם בלשנות חישוב ומדעי מחשב לעיבוד שפות ודיבור אנושיים או טבעיים. ניתן לפרק את התהליך לשלושה חלקים. המשימה הראשונה של NLP היא להבין את השפה הטבעית שמתקבלת על ידי המחשב. המחשב משתמש במודל סטטיסטי מובנה לביצוע שגרת זיהוי דיבור שממירה את השפה הטבעית לשפת תכנות. זה עושה זאת על ידי פירוק הנאום האחרון שהוא שומע ליחידות קטנטנות, ואז משווה יחידות אלה ליחידות קודמות מנאום קודם. הפלט או התוצאה בפורמט טקסט קובע סטטיסטית את המילים והמשפטים שנאמרו ככל הנראה. משימה ראשונה זו נקראת תהליך הדיבור לטקסט.
המשימה הבאה נקראת תיוג חלק-דיבור (POS) או הפרשת קטגוריית מילים. תהליך זה מזהה באופן יסודי מילים בצורתם הדקדוקית כשמות עצם, פעלים, שמות תואר, עבר עבר וכו 'באמצעות קבוצה של כללי לקסיקון המקודדים למחשב. לאחר שני התהליכים הללו, המחשב כנראה מבין כעת את משמעות הנאום שנשמע.
הצעד השלישי שננקט על ידי NLP הוא המרת טקסט לדיבור. בשלב זה, שפת תכנות המחשב ממירה לתבנית נשמעת או טקסטואלית עבור המשתמש. צ'ט בוט חדשני, למשל, שנשאל שאלה כמו "איך גוגל מתנהלת היום?" יסביר ככל הנראה אתרי מימון מקוונים עבור מניות גוגל, ועשוי להחליט לבחור רק במידע כמו מחיר ונפח כתשובה.
NLP מנסה להפוך אינטליגנציה למחשבים על ידי גורם לבני אדם להאמין שהם מקיימים אינטראקציה עם אדם אחר. מבחן טיורינג, שהוצע על ידי אלן טיורינג בשנת 1950, קובע כי מחשב יכול להיות אינטליגנטי לחלוטין אם הוא יכול לחשוב ולנהל שיחה כמו בן אנוש מבלי שהאדם ידע שהוא או היא משוחחים עם מכונה. עד כה, רק מחשב אחד עבר את המבחן - צ'ט בוט עם פרסונה של ילד בן 13. זה לא אומר שאי אפשר לבנות מכונה אינטליגנטית, אך היא מתארת את הקשיים הטמונים לגרום למחשב לחשוב או לשוחח כמו בן אנוש. מכיוון שניתן להשתמש במילים בהקשרים שונים, ולמכונות אין את החוויה האמיתית שיש לבני אדם להעברת ותיאור ישויות במילים, זה עשוי לקחת קצת יותר זמן עד שהעולם יוכל להיפטר לחלוטין משפת תכנות מחשבים.
