קורס יסודות בינה מלאכותית – RB30-01 : סיכום הרצאה מושגי יסוד

קורס יסודות בינה מלאכותית – RB30-01 : סיכום הרצאה מושגי יסוד

  1. מה זה בינה מלאכותית ולמידת מכונה 

  • בינה מלאכותית (AI): תחום שמטרתו לגרום למחשב לבצע משימות “אינטליגנטיות” כמו זיהוי, החלטה, תכנון ושיחה.

  • למידת מכונה (ML): תת־תחום בתוך AI שבו המחשב לומד דפוסים מנתונים כדי לבצע משימה, בלי לתכנת כל חוק ידנית.

  • ההבדל: AI הוא המטריה הרחבה; ML היא דרך אחת (היום המרכזית) לממש AI בעזרת נתונים ולמידה

  • מה בינה מלאכותית ולמידת מכונה שונה מתוכנה רגילה ?
  • תוכנה רגילה

    • אתה כותב חוקים מפורשים: if/else, נוסחאות, לוגיקה.

    • ההתנהגות צפויה וקבועה.

    • שינוי התנהגות = שינוי קוד.

    למידת מכונה / AI מבוסס ML

    • אתה לא כותב את החוקים עצמם; המודל “לומד” אותם מנתונים.

    • ההתנהגות היא סטטיסטית (הסתברותית) ולא תמיד זהה.

    • שינוי התנהגות = לרוב איסוף/שיפור נתונים, אימון מחדש, או שינוי מודל/פרמטרים.

    דוגמה אחת פשוטה מאוד

    • רגיל: “אם המילה SALE   חוזרת ומופיעה בכותרת של אימיילים שאתם מעברים לדואר זבל או ספאם”.

    • ML: לומד מאלפי מיילים מה מאפיין ספאם, גם בלי חוק אחד ברור יעביר אותו לספם.

  • בבינה מלאכותית (AI):  דוגמאות:

    1. מערכת שמנהלת תנועה ברמזורים לפי עומסים.

    2. מערכת שמחליטה מסלול לרובוט במחסן בלי להתנגש.

    3. מנוע שחמט/גו שמחשב מהלך טוב ביותר.

    למידת מכונה (ML): שיטה בתוך AI שבה המחשב לומד מדוגמאות (Dataset) כדי לנבא/לזהות, בלי לכתוב את כל החוקים ידנית.
    דוגמאות:

    1. סינון ספאם במייל לפי דוגמאות של ספאם/לא ספאם.

    2. זיהוי פנים בתמונה לפי אימון על הרבה תמונות.

    3. חיזוי מחיר דירה לפי נתונים (מיקום, גודל, חדרים).

  • 2. מהו dataset ? 

  • Dataset הוא אוסף מסודר של נתונים שמשמש ללמידה/בדיקה של מודל.דוגמאות:
    • לתמונות: תיקייה של תמונות + קובץ שמצמיד לכל תמונה תווית (למשל “חתול/כלב”).
    • לטקסט: אלפי משפטים + תווית (למשל “חיובי/שלילי”).
    • לדיפ־פייק: סרטונים אמיתיים וסרטונים מזויפים + תווית “Real/Fake”.

    לרוב מחלקים ל־Train / Validation / Test.

  • 3. DeapFake

  • דיפ־פייק (Deepfake) הוא וידאו/תמונה/קול שנוצרו או נערכו בעזרת מודלים גנרטיביים כך שייראו אמתיים (למשל החלפת פנים, סנכרון שפתיים, שיבוט קול).חסרונות וסכנות
    • הונאות זהות וכסף (שיחת “בוס/בן משפחה” בקול משוכפל).
    • פגיעה במוניטין, סחיטה, זיוף ראיות, דיסאינפורמציה.
    • קושי גובר להסתמך על “ראיתי/שמעתי” כהוכחה.

    יתרונות ושימושים לגיטימיים

    • דיבוב ותרגום עם סנכרון שפתיים.
    • נגישות: שחזור קול לאנשים שאיבדו דיבור.
    • קולנוע/אולפן: תיקונים והפקה יעילה (בתנאי סימון והסכמה).

    זיהוי “מקצועי” של דיפ־פייק (וידאו או שיחה)

    1. אימות מקור (Provenance) לפני הכול
      • לחפש “שרשרת מקור”/חתימה של תוכן: תקן Content Credentials של C2PA נועד לציין מקור ועריכות של מדיה, וכשקיים הוא כלי חזק נגד זיופים. (C2PA)
      • אם אין מקור/חתימה/מטא־דאטה אמין: להתייחס כתוכן לא מאומת.
    2. פורנזיקה טכנית (וידאו/תמונה)
      • בדיקות עקביות: תאורה והצללות, השתקפויות בעיניים, גבולות פנים/שיער (Artifacts של “הדבקה”), תנועת ראש מול רקע, דחיסת וידאו לא עקבית.
      • בדיקות פיזיולוגיות (כשאפשר): התאמה של תנועות מיקרו/סימני דופק בפנים (rPPG) מול הווידאו.
      • חשוב: מערכות זיהוי מתקשות “להכליל” כשכלי הזיוף משתנים או אחרי עיבוד/דחיסה—זה אתגר ידוע במחקר ובהערכות ביצועים. (NIST)
    3. פורנזיקה טכנית (אודיו/שיחה)
      • סימנים נפוצים: פרוזודיה “שטוחה”, נשימות לא טבעיות, חיתוכים זעירים, עיוותים בספקטרום, חוסר עקביות בין רעשי רקע לקול.
      • גם כאן: יש מרוץ חימוש; הספרות מדגישה צורך בשיטות חזקות מול שינויי דומיין וכלים חדשים. (PMC)
    4. בדיקות “אימות חי” בשיחה (הכי יעיל נגד הונאות בזמן אמת)
      • אימות מחוץ לערוץ: לנתק ולחזור למספר שמור, או לאשר בוואטסאפ/מייל ארגוני/שיחה נוספת.
      • “אתגר” ספונטני: לבקש פעולה בזמן אמת שקשה לזייף מהר (למשל לעבור לחדר אחר, להראות שעון/חלון, להגיד משפט אקראי, לבצע תנועה/מחווה ספציפית).
      • כלל זהב: בקשות דחופות לכסף/קוד/סיסמה—לא מבצעים לפני אימות כפול.
    5. כלים אוטומטיים (לארגונים)
      • קיימות פלטפורמות שמנתחות וידאו/אודיו/תמונה לזיהוי מניפולציות, אבל יש להתייחס אליהן כ”עוד אות” ולא כהוכחה יחידה (כי הדיוק תלוי בסוג הזיוף, דחיסה, ותנאי צילום). (darpa.mil)

    אם תתאר תרחיש (שיחת טלפון עם “בן משפחה”, ראיון עבודה בווידאו, סרטון שרץ ברשת), אתן לך פרוטוקול בדיקה קצר של 6–10 צעדים שמתאים בדיוק למקרה.

  • 4.מהו מודל GAN 

  • מודל GAN הוא קיצור של Generative Adversarial Network(s): שתי רשתות נוירונים שמתחרות זו בזו כדי לייצר דוגמאות שנראות אמיתיות. (arXiv)מה הוא עושה (הרעיון)
    • Generator (G) מייצר תמונה/פריים/פנים “מזויפים”.
    • Discriminator (D) מנסה לזהות האם זה “אמיתי” או “מזויף”.
    • G משתפר כדי “להטעות” את D, וככה איכות היצירה עולה. (arXiv)

    למה הוא נועד בדיפ־פייק

    • יצירת פנים ריאליסטיות.
    • החלפת פנים (face swap), תיקוני מרקם/פרטים, ושיפור ריאליזם כך שהפנים המושתלות ייראו טבעיות בפריים.

    למה קשה לזהות זיופים “מושלמים”

    • כי המטרה של GAN היא להתקרב להתפלגות של נתוני אמת: ככל שהוא מצליח, נשארים פחות “ארטיפקטים” קבועים שניתן לתפוס. (arXiv)
    • גלאים לרוב נשענים על עקבות ספציפיים (תבניות דחיסה, רעש, חוסר עקביות). אבל כשעוברים בין כלים/גרסאות, עושים עיבוד נוסף (דחיסה, רזולוציה, פילטרים) או משתמשים בשיטות חדשות — יכולת ההכללה של הגלאים נפגעת. (ScienceDirect)

    מתי הומצא ועל ידי מי

    • הוצג ביוני 2014 ע״י Ian J. Goodfellow ושותפיו (כולל Yoshua Bengio, Aaron Courville ועוד) במאמר “Generative Adversarial Nets”. (arXiv)

    איזו “מהפכה” הוא עשה

    • נתן מסגרת פשוטה וחזקה ללמידה גנרטיבית שמייצרת דוגמאות חדשות שנראות אמיתיות, והפך ליסוד מרכזי בגל של יצירת תמונות/פנים/סגנונות בריאליזם גבוה (כולל התשתית לרבות טכניקות דיפ־פייק). (ibm.com)

 

 

5.היסטוריה קצרה של בינה מלאכותית (AI) נקודות ציון

  • 1943 – מק׳קאלוך ופיטס (McCulloch & Pitts): מודל מתמטי מוקדם של “נוירון” לוגי (בסיס לרשתות עצביות).
  • 1950 – אלן טיורינג: מציע את “מבחן טיורינג” לשאלה האם מכונה יכולה להפגין אינטליגנציה.
  • 1956 – ג׳ון מקארתי, מרווין מינסקי, קלוד שאנון, נתניאל רוצ׳סטר: כנס דארטמות’ שבו נטבע המונח “Artificial Intelligence” ונולד התחום באופן רשמי.
  • 1958 – ג׳ון מקארתי: מפתח את שפת Lisp שהפכה מרכזית במחקר AI מוקדם.
  • 1960–1970s – מערכות “סמליות” וחוקים (Expert Systems): התחום מתקדם בעיקר בעזרת לוגיקה וכללי If/Else.
  • 1986 – רומלהארט, הינטון, ויליאמס: הפצה לאחור (Backpropagation) הופכת אימון רשתות עצביות למעשי.
  • 1997 – IBM Deep Blue מנצח את אלוף העולם בשחמט גארי קספרוב (ציון דרך במערכות החלטה וחיפוש).
  • 2012 – אלכס קריז׳בסקי, איליה סוצקבר, ג׳פרי הינטון: AlexNet פורץ דרך בלמידה עמוקה בראייה ממוחשבת ומאיץ את מהפכת ה-Deep Learning.
  • 2016 – DeepMind AlphaGo מנצח את לי סדול במשחק גו (שילוב חיזוי עמוק + חיפוש).
  • 2017 – הצגת Transformer (ואסוואני ושות׳): בסיס למודלים מודרניים של שפה.
  • 2020s – מודלים גנרטיביים גדולים (LLMs, Diffusion): יצירת טקסט/תמונות/וידאו ברמה גבוהה ושימוש רחב בתעשייה.

אם תרצה: גרסה “עוד יותר קצרה” של 5 נקודות בלבד.