בינה מלאכותית עצמאית : – RB25-02 Q-Learning

פיתוח בינה מלאכותית עצמאית : –

Introduction to State Transition Probabilities, Actions, Episodes, and Rewards with OpenAI Gym Python Library- Reinforcement Learning Tutorial

המטרה שהשחן ימנע מכל המכשולים וידע להגיע למטרה

האלגוריתם של למידת המכונה למצוא את הדרך היעליה ולא ליפול לבורות

למידת מכונה

S התחלה

H חור המשחק ניגמר

F מקום ללכת אליו קפוא

G מטרה

בכל STATE – יש לנו אפשרות למספר 4 מצבים לבחור

המצבים הבאים נקראים סיום אפיסוד terminal episode

actions פעולות לכל אחד יש מספר

action space כל הפעולות

בדוגמא שלנו יש התסברות שאני ילך למשבצת למעלה ויחבר בפעול F למעלה

ויש גם את ההסתברות שניחבר דווקא במהלך

REWARD

Reinforcement RB25-02 Q-Learning

יש להיות מחובר כדי לפרסם תגובה.