קורס בינה מלאכותית – RB33-02 : מבוא לבינה מלאכותית ולמידת מכונה yolo
חלק א: יצירת תמונות (שימוש בתוכנה A.I)
(היכרות ראשונה של עבודה עם תוכנת A.I כניסה עם GMAIL)
Text-to-Image – הוא מודל שמקבל תיאור במילים ומייצר תמונה חדשה שמתאימה לו.
הוא מתחיל מתמונה אקראית של “רעש” ומבצע הרבה צעדים שבהם הוא מנקה את הרעש בהדרגה.
בכל צעד הוא משתמש במשמעות של המילים כדי לכוון איך הפיקסלים צריכים להיראות.
בסוף מתקבלת תמונה ברורה, והסגנון נקבע לפי מילים כמו “ריאליסטי”, “ציור”, או “אנימה”.
(קישור לגוגל טרנאסליישן )
יצירת תמונה עם בינה מלאכותית – תרגיל כיתה יחד עם המרצה שלב אחרי שלב
תרגיל כיתה 1 – טקסט – לתמונה Text-to-Image
1. נכתוב את הטקסט הבא בתוכנה https://www.piclumen.com/
בחר אחת מהאפשריות (או משלך ) :
-
A small golden fox wearing a scarf, riding a skateboard through a snowy village at sunset
-
A friendly robot made of wood and brass, walking through a glowing mushroom forest at night
A tiny elephant with butterfly wings flying above a field of giant flowers at dawn
חלק ב . יצירת שירים ומוסיקה עם בינה מלאכותית
יחידת החשמונאים :
נעשה על ידי בינה מלאכותית A.I זוהר ארגוב ועפרה חזה – גדולי הזמר הישראלי
איך עשו את השיר
רקע תיאורטי
עקרונות של בינה מלאכותית שעליהם בדרך-כלל בנויה תוכנה ליצירת שירים (Text-to-Music / Text-to-Song), ומה ההבדל בין מוזיקה אינסטרומנטלית לבין שיר עם מילים.
1) הרקע: איך מחשב “מייצר” אודיו
אודיו הוא גל רציף. כדי שמודל ייצור אותו, ממירים את הבעיה לייצור “ייצוג” שקל יותר לחזות:
-
ספקטרוגרמה (Spectrogram): תמונת זמן-תדר, ואז ממירים חזרה לגל (vocoder).
-
Codec Tokens: מקודד נוירוני (כמו VQ-VAE/EnCodec) הופך אודיו לרצף “טוקנים” בדידים; המודל מייצר טוקנים ואז מפענח חזרה לאודיו.
-
MIDI / אירועים מוזיקליים (פחות נפוץ במודלי שירה מודרניים, יותר בכלי קומפוזיציה): תווים, מקצבים, כלים.
בפועל, רוב המערכות המודרניות ליצירת מוזיקה באיכות גבוהה משתמשות ב-Codec tokens או ב-Latent audio (מרחב חבוי).
2) איזה סוגי מודלים משתמשים
יש שתי משפחות מרכזיות (ולפעמים שילוב ביניהן):
A) מודלים אוטורגרסיביים (Transformers)
-
המודל מייצר רצף טוקנים אחד אחרי השני (כמו מודל שפה, רק לטוקנים של אודיו).
-
יתרון: שליטה טובה במבנה לאורך זמן (מקצב/חזרות/מעברים).
-
חסרון: יכול להיות איטי יותר ביצירה ארוכה.
דוגמאות לארכיטקטורה: Transformer decoder, לפעמים עם היררכיה (coarse→fine).
B) מודלי דיפיוז’ן (Diffusion) / Flow
-
מתחילים מרעש ומנקים אותו בהדרגה עד שמתקבל אודיו (או ייצוג חבוי של אודיו).
-
יתרון: איכות טקסטורה/סאונד גבוהה, סינתזה “עשירה”.
-
חסרון: לפעמים קשה יותר לשמור על מבנה מוזיקלי ארוך בלי טריקים (conditioning, planning).
במערכות מסחריות רבות יש גם רכיב “מתכנן” מבנה (מבוא/בית/פזמון) בנוסף למודל הסאונד.
3) “מה המודל לומד” בפועל
בזמן אימון נותנים למודל:
-
אודיו (או טוקנים של אודיו)
-
תנאים (conditioning): תיאור טקסטואלי, ז’אנר, מצב רוח, BPM, סולם, כלים, תקופה, ולעיתים גם “רפרנס” קצר.
המטרה: ללמוד את ההתפלגות
ולדגום ממנה אודיו חדש.
4) ההבדל בין מוזיקה בלי מילים לבין שיר עם מילים
מוזיקה בלי מילים (Instrumental)
המודל צריך לייצר:
-
הרמוניה, מלודיה, מקצב, עיבוד, סאונד של כלים
-
מבנה (קטעים חוזרים, מעברים)
בלי צורך ביישור לטקסט או בהפקת פונמות.
בדרך כלל זה “קל” יותר: אין אילוץ חזק של דיוק מילים או תזמון הברות.
שיר עם מילים (Vocal / Lyrics)
כאן יש עוד שכבות:
-
יצירת טקסט (אם המשתמש לא סיפק): מודל שפה שמייצר מילים לפי סגנון/חריזה/מבנה.
-
תזמון ויישור (Alignment): התאמה בין מילים/הברות לזמן בתוך המוזיקה.
-
הפקת קול שירה:
-
או שמודל אחד מייצר הכל יחד (מוזיקה+קול),
-
או שיש הפרדה: מוזיקה ברקע + מודל שירה שמייצר ערוץ ווקאלי ואז מיקס.
-
-
פונמות והיגוי: כדי שהמילים יהיו מובנות צריך ייצוג פונמי (צלילים של שפה), ולעיתים מודל שמותאם לשפה ספציפית.
-
אינטונציה/מלודיית שירה (Pitch contour): השירה חייבת “לשבת” על תווים, עם ויברטו, סליידים, דינמיקה.
לכן שירים עם מילים דורשים מודלים שמטפלים גם ב-תוכן לשוני וגם ב-סינתזת קול אנושי, בנוסף למוזיקה.
5) איך תוכנה מסחרית לרוב בנויה (Pipeline טיפוסי)
-
קלט: prompt (ז’אנר/מצב רוח/כלים) + (אופציונלי) מילים
-
שלב 1: “תכנון” בסיסי (סגנון, BPM, מבנה)
-
שלב 2: יצירת אודיו ב-latent/codec tokens (Transformer או Diffusion)
-
שלב 3: אם יש מילים — יצירת/יישור ווקאלי (integrated או separate)
-
שלב 4: post-processing: מיקס, קומפרסיה, EQ, לימיטר, לפעמים הפרדת stems.
6) אילו “מודלים” כדאי לציין ברקע (דוגמאות מחקריות)
כדי להבין את התחום, השמות הבאים מייצגים כיוונים חשובים:
-
Transformer-based audio token models (אודיו כטוקנים)
-
Neural audio codecs (VQ-VAE/EnCodec style)
-
Diffusion models for audio / latent audio
-
מערכות שמשלבות LLM לטקסט + Audio model + alignment
תרגיל כיתה 1 – יצירת שיר בעזרת שילוב בינות מלאכותיות SUNO
- היכנס ל chatGPT ובקש לרשום שיר קצר
- כתוב פרמטרים שיופיעו בשיר כמו מקום תיאורים האם השיר צריך להיות מרגש גיל השומע , בקש שזה יהיה עם חרוזים אם חשוב לך – (בדוק שיש חרוזים בשפה העברית אם זה בעברית )
- העתק את טקסט השיר
- פתח את תוכנת הבינה מלאכותית ליצירת שירים https://suno.com/
- שים לב שאתה בוחר את מצב custom
מעודכן לפי שלבים – יצירת הסרטון שלב אחרי שלב

סרטון הדרכה קצר : שלב אחרי שלב
חלק ב: Python and yolo
נריץ את הדברים ב COLAB
https://colab.google/
Lesson 1 – Printing and Running Python

|
1 2 3 4 5 6 7 8 9 10 11 12 13 |
from ultralytics import YOLO print("Program start...") # Load model model = YOLO("yolov8s.pt") # Run detection results = model(r"C:\AI\PICS\pic1.png") # Show detections results[0].show() |
this is an A.I simple model code out goal is to learn A.I , and A.I programing
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 |
# Learn Python to A.I Programming - Robotronix.co.il , Yaniv Maor # Example 1 – Print simple text print("Hello, world!") # Example 2 – Print a learning sentence print("I am learning Python for Artificial Intelligence.") # Example 3 – Print a number print(2025) # Example 4 – Print result of math print(5 + 3) # Example 5 – Print multiple words print("Python", "is", "fun") |
Output:
Example 1: Hello, world!
Example 2: I am learning Python for Artificial Intelligence.
Example 3: 2025
Example 4: 8
Example 5: Python is fun
|
1 2 3 4 5 6 7 8 9 10 11 12 |
# Learn Python to A.I Programming - Robotronix.co.il , Yaniv Maor # Example 1 – Print text + number print("The result is", 4 * 5) # Example 2 – Print with newline print("Hello\nWorld") # Example 3 – Print a quote inside text print('She said "Python is amazing!"') # Example 4 – Repeat word using multiplication print("AI " * 3) |
Output:
Example 1: The result is 20
Example 2: Hello
World
Example 3: She said "Python is amazing!"
Example 4: AI AI AI
|
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
# Learn Python to A.I Programming - Robotronix.co.il , Yaniv Maor # Example 1 – Print a floating-point number print(3.14159) # Example 2 – Round a number to nearest integer print(round(3.8)) # Example 3 – Round a float to 2 decimal places print(round(3.14159, 2)) # Example 4 – Format float using f-string to show 2 digits value = 12.34567 print(f"Value = {value:.2f}") # Example 5 – Combine text and rounded math result num = 10 / 3 print("10 divided by 3 is", round(num, 2)) |
Output:
Example 1: 1.1 2.22 3.333
Example 2: Average: 6.25
Example 3: Height: 1.76 m
Example 4: Age: 30, Weight: 72.6 kg
Example 5: Accuracy: 87.65%
Exercises – Lesson 1: Printing and Numbers
Exercise 1:
Write a program that prints your name and age on one line.
Exercise 2:
Print the result of 12.5 / 3 rounded to 2 decimal places.
Exercise 3:
Display the text "AI Power Level:" followed by the number 99.876 rounded to one decimal place.
Exercise 4:
Print three numbers (4, 8, 12) separated by commas, and then print their average rounded to 2 digits.
Exercise 5:
Show a floating number formatted as currency — for example 5.6789 → "$5.68".
Solutions
|
1 2 3 4 5 |
# Learn Python to A.I Programming - Robotronix.co.il , Yaniv Maor # Solution 1 – Print name and age print("My name is Yaniv, I am", 50, "years old") # Output: My name is Yaniv, I am 50 years old # Remark: Uses commas to combine text and numbers. |
|
1 2 3 4 5 6 |
# Learn Python to A.I Programming - Robotronix.co.il , Yaniv Maor # Solution 2 – Divide and round to 2 decimals result = 12.5 / 3 print("Rounded result:", round(result, 2)) # Output: Rounded result: 4.17 # Remark: round(number, 2) limits to 2 decimal digits. |
|
1 2 3 4 5 6 |
# Learn Python to A.I Programming - Robotronix.co.il , Yaniv Maor # Solution 3 – Round one decimal and print with text power = 99.876 print(f"AI Power Level: {power:.1f}") # Output: AI Power Level: 99.9 # Remark: f-string controls decimal precision with .1f. |
|
1 2 3 4 5 6 7 |
# Learn Python to A.I Programming - Robotronix.co.il , Yaniv Maor # Solution 4 – Average of three numbers a, b, c = 4, 8, 12 avg = (a + b + c) / 3 print(f"Average = {avg:.2f}") # Output: Average = 8.00 # Remark: Performs math and formats to 2 decimal places. |
|
1 2 3 4 5 6 |
# Learn Python to A.I Programming - Robotronix.co.il , Yaniv Maor # Solution 5 – Format as currency price = 5.6789 print(f"Price: ${price:.2f}") # Output: Price: $5.68 # Remark: f-string with '$' symbol and 2 digits after decimal. |
חלק ג : יצירת קוד בפייטון בעזרת בינה מלאכותית
- היכנסו ל chatGPT https://chatgpt.com/
1.1 בתוך chatGPT נכתוב את הפרומט הבא

2 תרגיל כיתה 1 – בניית קוד בעזרת בינה מלאכותית
.היכנסו ל COLAB והריצו לפי את הקוד (המרצה ידגים)

2 תרגיל כיתה 1 – בניית קוד בעזרת בינה מלאכותית – העלאת תמונה ל COLAB והצגתה
- הורד את הקובץ הבא למחשב

2. הרץ ב chatGPT את הפרומפט הבא ואז העתק אותו והרץ אותו ב COLAB
create colab program that load image from pc , resize it to width 300 px keep ratio , and show it in colab