קורס יסודות בינה מלאכותית – RB30-03 : יצירת שירים ומוסיקה עם בינה מלאכותית
מה חדש – סוכני בינה מלאכותית מתאחדים
חלק א: יצירת שירים ומוסיקה עם בינה מלאכותית – ושילוב סרטון וידאו עם בינה מלאכותית
יחידת החשמונאים :
https://suno.com/s/IHMZAKUEAWd5CTNg
נעשה על ידי בינה מלאכותית A.I זוהר ארגוב ועפרה חזה – גדולי הזמר הישראלי
איך עשו את השיר
Suno היא פלטפורמה מבוססת בינה מלאכותית המאפשרת יצירת מוזיקה באמצעות מחולל טקסט-למוזיקה. הפלטפורמה מאפשרת למשתמשים ליצור שירים מקוריים עם שירה וליריקה על ידי הזנת תיאורים טקסטואליים. מאז השקתה בדצמבר 2023, Suno זמינה באופן נרחב, כולל שיתוף פעולה עם מיקרוסופט לשילוב הפלטפורמה ב-Microsoft Copilot. citeturn0search8
Suno מציעה אפליקציות למכשירי iOS ואנדרואיד, המאפשרות למשתמשים ליצור מוזיקה ישירות מהטלפון הנייד שלהם. citeturn0search3turn0search1 הפלטפורמה משתמשת במודלים מתקדמים ליצירת מוזיקה בהתאם לתיאורים שהוזנו על ידי המשתמש, ומאפשרת התאמה אישית של סגנונות מוזיקליים, כלי נגינה וסוגי קול. citeturn0search5
Suno מציעה תוכניות מנוי שונות, כולל תוכנית חינמית עם 50 קרדיטים יומיים, ותוכניות פרימיום המאפשרות יצירת מוזיקה לשימוש מסחרי. citeturn0search3 הפלטפורמה מתאימה למגוון משתמשים, כולל מוזיקאים מקצועיים, חובבים, יוצרי תוכן ועסקים, ומאפשרת להם ליצור מוזיקה איכותית במהירות ובקלות. citeturn0search5
תרגיל כיתה 1
- היכנס ל chatGPT ובקש לרשום שיר קצר
- כתוב פרמטרים שיופיעו בשיר כמו מקום תיאורים האם השיר צריך להיות מרגש גיל השומע , בקש שזה יהיה עם חרוזים אם חשוב לך – (בדוק שיש חרוזים בשפה העברית אם זה בעברית )
- העתק את טקסט השיר
- פתח את תוכנת הבינה מלאכותית ליצירת שירים https://suno.com/
- שים לב שאתה בוחר את מצב custom
מעודכן לפי שלבים

ראש סרטון הדרכה קצר :
העשרה
1. יצירת מוזיקה (טקסט → מוזיקה)
- MusicGen (Meta) – יצירת מוזיקה מבוססת טקסט.
- Riffusion – יצירת מוזיקה באמצעות Stable Diffusion.
- Magenta (Google) – יצירת מוזיקה מבוססת AI.
2. סינתזה קולית (טקסט → קול/שירה)
- XTTS-v2 (Coqui TTS) – דיבור מציאותי עם רגש.
- Tortoise-TTS – סינתזה קולית מדויקת ואיכותית.
- ElevenLabs – יצירת דיבור ושירה ברמה גבוהה.
- VITS – דיבור ריאליסטי עם התאמה אישית.
3. עיבוד וניתוח אודיו
- Librosa – ניתוח והפקת תכונות קוליות.
- Torchaudio – עיבוד קול בעזרת PyTorch.
- FFmpeg – המרת פורמטים ועריכת אודיו.
4. יצירת כלי נגינה דיגיטליים
- Fluidsynth – יצירת צלילים מסינתיסייזרים.
- MIDIUtil – יצירת קובצי MIDI לכלי נגינה דיגיטליים.
💡 שילוב להפקת שירים: MusicGen + XTTS-v2 + Librosa.
חלק א: יצירת תמונות (שימוש בתוכנה A.I)
Text-to-Image – הוא מודל שמקבל תיאור במילים ומייצר תמונה חדשה שמתאימה לו.
הוא מתחיל מתמונה אקראית של “רעש” ומבצע הרבה צעדים שבהם הוא מנקה את הרעש בהדרגה.
בכל צעד הוא משתמש במשמעות של המילים כדי לכוון איך הפיקסלים צריכים להיראות.
בסוף מתקבלת תמונה ברורה, והסגנון נקבע לפי מילים כמו “ריאליסטי”, “ציור”, או “אנימה”.
(קישור לגוגל טרנאסליישן )
יצירת תמונה עם בינה מלאכותית – תרגיל כיתה יחד עם המרצה שלב אחרי שלב
תרגיל כיתה 1 – טקסט – לתמונה Text-to-Image
1. נכתוב את הטקסט הבא בתוכנה https://www.piclumen.com/
A fluffy pink cat riding a bicycle through a forest with a waterfall in the background
לימוד הרצת קוד של A.I בינה מלאכותית COLAB טקסט לקול
TTS (Text-to-Speech) = המרת טקסט כתוב לקול דיבור.
מה זה כולל בקצרה:
-
קלט: טקסט
-
פלט: אודיו (MP3/WAV) בקול אנושי
-
אפשר לבחור שפה, קול, מהירות, טון, ולעיתים גם רגש (תלוי במנוע)
דוגמאות שימוש:
-
קריינות לסרטונים
-
קריאת הודעות/מסמכים בקול
-
נגישות לעיוורים
-
בוטים טלפוניים ועוזרים קוליים
טקסט לקול (מתקדם – לא – קשה המרצה יסביר שלב אחר שלב ) לימוד הרצת קוד של A.I בינה מלאכותית COLAB
תרגיל כיתה 2 – הרצת קוד פיתיון של בינה מלאכותית (לא נידרש ידע בתכנות )
1. https://colab.research.google.com/drive/1PVp1-8UfoNDeROGjOSC9IfDVW6ixH5n1?usp=sharing
שוב שימוש ב AVATAR למכור דברים
חלק ג : A.I – בינה מלאכותית ברפואה
בינה מלאכותית ברפואה – דגש על LLM (Large Language Models)
מודלי שפה גדולים הם רשתות נוירונים שאומנו על כמויות עצומות של טקסט רפואי וכללי, ומסוגלים להבין שפה טבעית, להפיק סיכומים, להסיק הקשרים ולהציע תשובות מבוססות ידע.
בינה מלאכותית בחדר המיון A.I
למשל בחדר במיון ובאשפוז לא עובדים עם “מודל אחד”, אלא עם מערכת AI מרובת-מודלים. המטרה: להפוך מידע רפואי מפוזר (דיבור, טקסט, בדיקות, תמונות) ל”תמונה קלינית” אחת, ולעזור לרופא לקבל החלטות מהר ובדיוק גבוה יותר.
1) מודל שפה גדול (LLM) – “המוח שמבין טקסט”
מה הוא עושה
-
קורא ומסכם מידע מהתיק: מחלות רקע, תרופות, אלרגיות, ביקורים קודמים.
-
“מקשיב” לתיאור המטופל (או לצוות) ומפיק סיפור מחלה מובנה.
-
מציע אבחנות אפשריות (דיפרנציאל) וצעדים מומלצים לפי קווים מנחים.
-
כותב מסמכים: סיכום מיון, סיכום אשפוז, מכתב שחרור והנחיות.
מה חשוב להבין
LLM טוב מאוד בשפה ובהיגיון מילולי, אבל הוא עלול לטעות אם חסר מידע או אם אין לו גישה למקורות מאומתים.
2) מודלי ראייה רפואית (Computer Vision) – “העיניים שמבינות תמונה”
אלה מודלים שאומנו על תמונות רפואיות, למשל:
-
CT / MRI: זיהוי דימום, שבר, גידול, תסחיף.
-
צילום חזה: דלקת ריאות, בצקת ריאות, תפליט.
-
אולטרסאונד: נוזל חופשי, אבנים, ממצאים בסיסיים.
איך זה עובד בפועל
המודל מקבל תמונה ומחזיר:
-
“אזורים חשודים” (לוקליזציה/סימון)
-
ציון הסתברות לממצא
אבל עדיין רדיולוג/רופא מאשר את הפרשנות, במיוחד כי איכות תמונה ותנוחה יכולים להטעות.
3) מודלים לנתוני מעבדה וסדרות-זמן – “הסטטיסטיקאי של המדדים”
נתוני מעבדה (דם, CRP, טרופונין, אלקטרוליטים) ומדדים חיוניים הם מספרים לאורך זמן. כאן משתמשים במודלים שמזהים:
-
מגמות (למשל עלייה בטרופונין)
-
דפוסים מסוכנים (התדרדרות ספסיס, כשל כלייתי מתפתח)
-
חריגות ביחס לערכי הבסיס של המטופל
4) שכבת “איחוד מידע” (Fusion) – חיבור טקסט+תמונה+מעבדה
זו החלק הקריטי: מחברים את כל הזרמים:
-
מה שהמטופל סיפר
-
מה שנמדד פיזית
-
מה יצא במעבדה
-
מה נראה בהדמיה
כדי לקבל סיכון משוער, אבחנות סבירות, והצעה לתכנית בדיקות/טיפול.
5) איך מונעים טעויות: RAG + בקרה קלינית
כדי שה-LLM לא “ימציא”:
-
משתמשים ב-RAG: במקום לענות מהזיכרון, המודל “שולף” מידע מתוך מקורות מאומתים (פרוטוקולים, הנחיות, מאמרים, תיק המטופל) ואז מנסח תשובה.
-
Human-in-the-loop: רופא מאשר החלטות, במיוחד טיפול, תרופות ושחרור.
תפקיד הרופא בתוך המערכת
הרופא נשאר הגורם המרכזי כי הוא היחיד שמבצע:
-
בדיקה גופנית והערכת חומרה אמיתית
-
החלטה סופית על אבחנה וטיפול
-
איזון בין סיכונים/תועלת, והעדפות המטופל
-
אחריות אתית ומשפטית
ה-AI בעיקר עושה: איסוף, סיכום, איתור חריגים, והצעות מבוססות-מקורות.
אם תרצה, אני יכול לכתוב את זה כזרימה “מרגע כניסה למיון → בדיקות → אשפוז/ניתוח → שחרור” כולל דוגמה קונקרטית (כאב בחזה / טראומה / חום גבוה).