בינה מלאכותית עצמאית : RB25-01






הסוכן צריך לדעת מה עשות שלא ליפול בחור
מאוד מזכיר את

שלבים שי 16 אמצבים ו 4 פעולות



עברו משחק שח מט יש 10 בחזקת 43 ש אפשריות לכן כל מצב של השחקנים ניקרא STATE
אז איך Q מחושב ?

ולא חד פעמי




בינה מלאכותית עצמאית : RB25-01






הסוכן צריך לדעת מה עשות שלא ליפול בחור
מאוד מזכיר את

שלבים שי 16 אמצבים ו 4 פעולות



עברו משחק שח מט יש 10 בחזקת 43 ש אפשריות לכן כל מצב של השחקנים ניקרא STATE
אז איך Q מחושב ?

ולא חד פעמי



