בינה משחקית – כך חודר (לאט אבל בטוח) ה- GenAI לעולם הגיימינג
- producttalesblog
- 12 במרץ
- זמן קריאה 12 דקות
עודכן: 10 באפר׳
מיקרוסופט חשפה את Muse – מודל בינה מלאכותית שיכול ליצור עולמות משחק ע"ב תמונות והנחיות טקסט – ומנסה להרגיע את היוצרים שהוא מיועד רק כדי לסייע להם

יש לי יחס די אמביוולנטי לסרטים שקשורים לעולם הגיימינג. ואני אסביר. אני לא ממש מתחבר לסרטים האלה מבוססי המשחקים, ז"א כאלה ששואבים את סיפור העלילה ומשתמשים באנקדוטות כאלה או אחרות מהמשחק כדי להעביר את החוויה למסך הגדול. איך נאמר, זה לא כזה מעניין כשאין פה את העניין הזה של... לשחק. באופן כללי, יש כנראה די הרבה אנשים בקהל היעד של סרטים כאלה ששותפים לדעתי – במשך השנים היו לא מעט פלופים מסחריים בז'אנר הזה, וגם כמה הצלחות בודדות.
לפני יותר מעשרים שנה יצא "סופר מריו" (עם בוב הוסקינס הזכור מ"רוג'ר ראביט") שזכה להצלחה נאה, ומאז הופקו עוד עשרות סרטים מבוססי עלילת משחק, כמו: "סטריט פייטר" עם ז'אן קלוד ואן דאם, "טומבריידר", עם אנג'לינה ג'ולי כלארה קרופט (שסרט ההמשך שלו נכשל לחלוטין), "דום", "היטמן", "Tekken", מורטל קומבט ועוד, שרובם זכו להצלחה בינונית מאוד בקופות. כמעט אף אחד מהם לא הצליח ליצור פרנצ'ייז אמיתי, למעט Resident Evil ("האויב מבפנים" עם מילה ג'ובוביץ', שזכה לשישה סרטים) או להפוך לאיזה סוג של סרט קאלט. תקציבי הענק כוסו בקושי, אפילו במקרים של כותרים עוצמתיים כמו Need for Speed, Assassin Creed (שתורגם כ"אחוות המתנקש"), האתחול מ- 2018 של טומב ריידר, Rampage בכיכובו של דוויין ג'ונסון, ו- וורקראפט, שכישלונו מהדהד במיוחד לאור עלילתו שלכאורה מתאימה ככפפה לעיבוד קולנועי.
מנגד, כשעושים את זה טוב, וכשהתוצר נוצר בהתאמה לקהל היעד הרצוי, זה כן יכול לעבוד. "סופר מריו" מ- 2023 היה להיט ענק, שהכניס לנינטנדו כמעט 1.5 מיליארד דולר (מעל חצי מיליארד בהכנסות מכרטיסים בארה"ב בלבד), סוניק הקיפוד הפך להצלחה הקולנועית הכמעט יחידה בימי הקורונה והמשיך מאז לסרטים נוספים, העיבוד של HBO ל- The last of Us עורר סנסציה טלוויזיונית שסחפה את קהל המבוגרים, ובכלל, האולפנים עסוקים בשנתיים האחרונות בשלל פרויקטים שנקודת המוצא שלהם היא סיפור טוב עליו מבוסס המשחק, ולאו דווקא כזה שחוויית הגיימינג בו היא הסיבה להצלחתו. ולאור מגמת ההעמקה והעיבוי של עלילות המשחק בשנים האחרונות, כנראה שיש בסיס מספיק חזק לעשות מהם סרטים טובים, ממש כמו העיבודים שנעשים מספרים טובים.

אבל גלשתי כאן (ממש...) לצד אחד של ה- "ואני אסביר" בראשית הדברים. האמביוולנטיות שלי מתבטאת מהצד השני בכמה סרטים אליהם מאוד התחברתי, והם אלו שמספרים סיפור שקשור לתהליך מסוים שעוברת דמות בתוך עולם המשחקים, זאת אומרת כזה שמתרחש בתוך משחק, אך העלילה חורגת מזו של סיפור המשחק עצמו. ואני (שוב) אסביר. בדוגמאות. הסרט "ראלף ההורס" מ- 2012 הביא את סיפורו של Wreck-it Ralph, דמות נבל במשחק ארקייד בשם "פליקס המתקן ג'וניור". הסרט מתרחש ביקום בו דמויות המשחקים חיות חיים משלהן וכל משחק הוא מעין מקום עבודה. ראלף, שעובר סוג של חרם מצד הדמויות האחרות במשחק (לא מוזמן אפילו למסיבה של חגיגות שנת השלושים) יוצא למסע להשגת מדליה שתאפשר לו להיחשב כ"אחד מהחבר'ה".
במהלך המסע ראלף נעדר מהמשחק, שהופך לחסר שימוש עד שהוא מנותק מהחשמל בחנות בה הוא מוצב (משחק ארקייד כמו של פעם, כן?). בסופה של ההרפתקה ראלף הופך לגיבור, מציל את המשחק, והופך למוערך ע"י חבריו. זה סיפור קלאסי על האנדרדוג שהופך למנצח, אבל התרחשותו בעולם המשחקים הפך אותו לשנון, מצחיק ומרגש. סצנה אחת, בה נפגשים נבלים ממשחקים שונים (כמו השד מפאקמן) לפגישת תמיכה בסגנון "אלכוהוליסטים אנונימיים" קורעת במיוחד, אבל בו זמנית גם מעניקה רקע לדמויות שבדרך כלל נשארות שטוחות. הסרט הצליח להביא עומק שלכאורה כמעט בלתי אפשרי ליצור במשחק שנדרשים משאבים עצומים לפיתוחו.

העניין הזה בא לידי ביטוי באופן חד יותר במה שעבורי הוא סרט הגיימינג האהוב ביותר: "לשחרר את גיא" ("Free Guy") מ- 2021. במוקד הסרט דמות, שהיא מה שנקרא NPC, ראשי תיבות של: Non-Player-Character, או בעברית: דמות שאינה שחקן. ל- NPC ישנם תפקידים מגוונים, החל מלתת הנחיות לשחקן, שימוש כאויב או יריב, מכירת ציוד בחנות וכד'. ואם יש כאן שרשרת מזון, אז בתחתיתה נמצא NPC שהוא חלק מיצירת אווירה בלבד, כמו אוהדי ספורט חסרי זהות באצטדיון או מישהו שהוא פרט מהמון אדם בעיר סואנת. וזה פחות או יותר תפקידו של גיא במשחק – כבול לאותו תפקיד של עובר אורח עם אותם משפטים בכל יום שחולף, במשחק הפופולארי "Free City".
גיא בעצם "כלוא" באותה שגרת יומיום של אמירת בוקר טוב לגולדי (דג הזהב שלו), צפייה בחדשות, הזמנת אותו קפה באותה חנות באותו דיאלוג עם המוכר, צפייה בחלון ראווה על הנעליים שהוא כל כך רוצה, ועבודה בבנק עם חברו באדי, במסגרתה (או במסגרת סיפור המשחק) הוא נשדד כמה פעמים ביום. זה עולמו ומבחינת המודעות שלו אלו הם חייו. הכל משתנה יום אחד כשהוא חולף מול עוברת אורח ובמקום לומר את המשפט הקבוע שלו כ- NPC (משהו בסגנון של: "שלא יהיה לך יום טוב, שיהיה לך יום נהדר") הוא מגיב לשיר שהיא מזמזמת. עוברת האורח הזו תתגלה בהמשך כ"ילדת מולוטוב" - שחקנית אמיתית בשם מילי, שמנהלת תביעה נגד חברת "סונאמי" (שיצרה את Free City על בסיס משחק אחר בשם Life Itself, שמילי היתה מעורבת בפיתוחו).
לא אסקור עתה את המשך העלילה (המסעירה והמותחת בפני עצמה) כדי לא לצאת מהפוקוס של הפוסט ומטעמי חשש מספוילר, רק אציין ששגרת חייו הקבועה של גיא מתחילה להשתבש: הוא מזמין קפה אחר ומטריף את המוכרת, שלמרות מגוון סוגי המשקאות בתפריט יודעת בפועל (וכמובן בהתאם לתכנות המשחק) להכין רק קפה אחד, הוא מתחיל להתעניין ב"נערת המולוטוב", שהיא אחת "מאנשי משקפי השמש" (שחקנים אמיתיים בז'רגון שלו ושל באדי), ובסופו של דבר מתנגד לקוד שמנהל אותו. מכאן הוא נסחף למערבולת מסחררת של הקרב המשותף של מילי וקיז (שותפה לפיתוח המשחק) נגד אנטואן מנהל החברה, שגנב את הקוד. סיום הסרט הוא הברקה אמיתית, שוב, בלי ספוילרים, אך הוא מערב אתחול קטסטרופלי של המשחק, מציאת הקוד שמאחוריו שמוכיח את הגנבה, ולבסוף כישלון של משחק ההמשך מול הצלחת משחק חדש של צמד המפתחים, שנקרא "חיים חופשיים", בו האהבה שמתפתחת בין מילי וגיא באה למימוש.

אז מעבר למה שניתן להבין עתה על כפל המשמעות של שם הסרט (Free Guy במובן של "בחור חופשי" ולא רק מילולית "לשחרר את גיא"), יש בסיפור על "חייו" של NPC "שטוח" בתוך עולם משחק עשיר ומלא דמויות את אחת הדוגמאות הבולטות יותר למקום בו ה- GenAI יכול להוות Game Changer (תרתי משמע) בעולם הגיימינג. שמרו בינתיים את המשפט הזה בראש להמשך הפוסט, אחרי שאסקור את המקום שתופסת הטכנולוגיה הזו היום, ואת פריצת הדרך הגדולה שהביאה מיקרוסופט לפני זמן קצר, עם מודל ייעודי לגיימינג בשם Muse.
הסיפור של שימוש ב- AI בעולם יצירת המשחקים, גם אם נקרא בעבר Machine Learning, אינו חדש. כלים שהוסיפו סוג של התנהגות נלמדת הוטמעו בלא מעט משחקים, כחלק מבניית ה- Environment הכללי של המשחק. הם גם היו כלי בסיסי מאוד ביחס למה שאנחנו מדמיינים לעצמנו כבינה מלאכותית כפי שהורגלנו בתחומים אחרים בשנתיים האחרונות. כמובן, שהמגמה העולמית של חדירת והתפתחות ה- AI היתה צפויה להגיע גם לעולם הגיימינג, אך עד ששחקניות מרכזיות בשוק לא הצהירו במפורש שזה הכיוון, מוכנות להתמודד עם ההשלכות והמחאה שתצוץ מכך, זה לא הפך לנושא מרכזי כמו שהפך לדרמה בעולם יצירת התוכן.
בסוף השנה שעברה ערכה ענקית המשחקים EA את כנס המשקיעים השנתי שלה, שהפך לחגיגית הצהרות בנושא הטמעת AI בתעשייה בכלל, ובאופן בו EA רואה את הטכנולוגיה הזו כליבת עסקיה בפרט. החברה הצהירה על למעלה ממאה פרויקטים חדשים של בינה מלאכותית, כשהיא מקטלגת אותם ליעילות (Efficiency), הרחבה (Expansion) ושינוי (Transformation). כך למשל, צוינה היעילות בפיתוח המשחק College Football 25, שבו נוצרו בעזרת בינה מלאכותית לא פחות מ- 150 אצטדיונים וכ- 11 אלף דמויות. למפתחים אמורה הטכנולוגיה הזו לתת יכולת "לצייר" בצבעים עשירים יותר עולמות חדשים - להרחיב את סקלת הדמויות, עם יותר עומק ושכל. הטרנספורמציה האמיתית לפי חזונה של EA תהיה הסתכלות קדימה בחיפוש אחר חוויות משחק שלא קיימות היום, במיוחד סביב תוכן מייצור עצמי (Self-Generated-content).
מובילי הטכנולוגיה בחברה תיארו כמה פעילויות במוצרים קיימים שכבר בוצעו בעזרת AI, בין השאר פיתוחו של The Sims Hub, השילוב הראשון של בינה מלאכותית באופן מעשי ביקום המשחקים של החברה. הפלטפורמה הזו אמורה להכיל כלי גילוי חזקים במיוחד, כדי לאפשר למשתמשים למצוא תוכן שנוצר ע"י משתמשים אחרים בקלות. למי שמכיר את The Sims זה ישמע די אטרקטיבי, לדוגמא הכנסת תמונה של הבית האמיתי שלך ומציאת בית דומה שנוצר ע"י משתמש אחר, או יצירה ממש של דמות Sim ע"ב תמונה של סלבריטי או אדם אחר בתלבושת מסוימת.

ל- EA יש מסד נתונים עצום של Assets מאינספור המשחקים ששחררה במשך השנים, או כמו שהוא מכונה "הסמית'יסוניאן של נכסי המשחק". מדובר באוצר של ממש בכל הקשור באימון מודלים של Machine Learning ו- LLM, ומעבדת החדשנות של החברה SEED, שמשמעה: Search for Extraordinary Experiences Division, משתמשת בו לטובת פיתוח כלים מתקדמים, דוגמת Script to Scene. מדובר בכלי המאפשר למפתחים ליצור דמויות, לביים הופעות ולהגדיר עולמות באמצעות טקסט. בדוגמא שהוצגה בכנס, הונחה צ'ט AI ייעודי "לבנות בניין מגורים פריזאי". לאחר מכן הוספה הנחיה להגביה אותו, לשנות אותו לסגנון מודרני יותר, ואז להרחיב לשכונה שלמה. בסופו של דבר היכולת אפשרה ליוצר לבנות סצנה שלמה בעזרת שימוש בטקסט פשוט וחופשי יחסית.

מונח מעניין שצוין הוא "AI טקטי", שימוש מכוון מטרה הנעזר מנתונים מהעולם האמיתי כדי לדמות בצורה מדויקת כיצד שחקנים וקבוצות משחקים יחד. היכולת הזו, שנקראת FC IQ, הוזנה ב- FC 25 שהוזכר קודם, שם ההתייעלות הביאה לכ- 70% הפחתה מזמן היצירה. לכך יש להוסיף אבטיפוס ראשוני של סימולטור חיזוי תוצאות ומענה לשאלות בשפה פשוטה, שיכול להפיק למשל הערכה בנוגע למנצחת במשחק היפותטי.
אחת ההשוואות (הדי מוזרות יש להודות) שהוצגו בכנס היתה בין הטכנולוגיה המהפכנית שמחלחלת לעולם הגיימינג לבין... סרטוני הדרכה בטיקטוק. או סרטוני החתולים בראשית ימי האינטרנט. הרעיון הוא שגם האחרונים נראו בזמנו כמשהו נישתי והפכו למאוד פופולאריים עם הזמן. בדומה (לפחות לדעת איש הקריאייטיב מאחורי ההשוואה הזו) צריך להתבונן במאמצי הבינה המלאכותית הניסיוניים של EA כמו לאותם סרטי YouTube מוקדמים, ומה שמרגיש עתה בסיסי או מוגבל, ישתפר במקביל להתקדמות הטכנולוגיה. יש משהו מתנצל בגישה הכללית הזאת של הצגת פיתוחי AI, המגיעה בעיקר בשל הפחד המוכר מאובדן היצירתיות ומקומות עבודה. הטרנספורמציה נועדה, לפחות כלפי חוץ, לא כדי להחליף משחקים ברמת AAA, אלא לפתח קטגוריות חדשות וקרובות שמוסיפות לארסנל המשחקים ולא פוגעות בקיים. נראה שקטגוריות כאלו ייוצרו ע"ב אפליקציות ושירותים זמינים למפתחים ואולי אף לאנשים מן היישוב, שיוכלו "לטייל" בינות מאגר הנכסים העצום של EA ולהשתמש ביכולות ה- AI ליצור מיני-משחקים מגוונים.
דוגמא לתהליך כזה הוצגה בכנס. תחילה התבקשה הבינה המלאכותית ליצור "מבוך מקופסאות קרטון". לאחר מכן להפוך אותו למורכב יותר ואז גם למרובה-רמות – בדרך למשחק Multi-Level.

וכאן העניינים משתכללים. עתה התבקשה המערכת ליצור "שתי דמויות עם כלי נשק", מה שפותח אפשרות לבחור מתוך גלריה של דמויות EA קיימות. אז נבחרו כאלו שעוצבו בקהילת המעצבים, והתבקש לצייד אותם ברובים מספריית כלי הנשק.

בשלב זה הגיע הזמן ליצור את המשחק עצמו. המערכת מאפשרת בחירה מתוך קומץ של מצבי משחק, Game-modes, ולאחר הנחיה מתחיל מרדף בין שתי הדמויות בתוך המבוך. בסיום הונחתה המערכת "לעשות את זה יותר אפי", וכתוצאה מכך פירמידת קופסת קרטון ענקית מופיעה בזמן אמת לתדהמת צמד השחקנים.

עוד עדות מעניינת "מבפנים" על חזון ה- AI בגיימינג, הגיעה בתחילת השנה מהסבריו של מנהל טכני ב- Capcom (מפתחת כותרים מצליחים כמו: Monster Hunter: World ו- Exoprimal) כיצד החברה מתנסה בהטעמת בינה מלאכותית בתהליכי פיתוח המשחקים שלה. אחת הבעיות המרכזיות בתחום, שדורשת השקעת זמן ומאמץ רב, היא הצורך בהעלאת מאות אלפי רעיונות ייחודיים, וזה נכון הן למשחקים עצמם והן לפלטפורמות (שלהן דרישות מיוחדות). לכל מסת הרעיונות הזאת צריך להוסיף את העבודה הכרוכה בהנגשתם לשותפים, כמו איורים הדרושים למנהל האומנותי, טקסטים הנובעים מהרעיונות וכדומה. כאן, בטח ניחשתם, נכנס אלמנט היעילות, והחברה פיתחה מערכת שבאמצעות GenAI יכולה לקרוא מסמכי עיצוב ממשחקים שונים, לייצר מהם רעיונות, לספק לעצמה משוב ולחדד עוד יותר את התוצר. הפידבקים בתוך החברה היו חיוביים למערכת, ולנו חשוב לשים לב לגבול הברור שהוצב כאן (לפחות כיום): היבטי תכנון המשחק, עיצוב הדמויות ויצירת הסיפור נותרו בידי בני אדם.
עתה, חושפת מיקרוסופט מודל חדש בשם MUSE, שמהווה פריצת דרך בתחום ה- GenAI בעולם המשחקים. המודל נחשב לראשון מסוגו במסגרת פיתוח משותף של יחידות ה- Research Game Intelligence ו- Teachable AI Experience בחברה, יחד עם מפתחת משחקי ה- Xbox המובילה Ninja Theory. המודל הוא יריית הפתיחה של פרויקט WHAM, ראשי תיבות של World and Human Action Model – כלי הבינה המלאכותית הראשון שיכול ליצור סביבת משחק המבוססת על תמונות חזותיות או פעילות קונטרולר של השחקן. המודל אומן והתמקצע בעולמות ה- 3D Games ופיזיקת המשחק שלהם, כך שהוא מסוגל להגיב בזמן אמת לאופן בו השחקנים משנים את אינטראקציית המשחק שלהם.

מודל ה- Muse עבר אימון רחב מאוד, על כמות גדולה של Game Players ששיחקו שחקנים אנושיים ב- Bleeding Edge, משחק פעולה בגוף שלישי מרובה משתתפים (Battle Arena), מבית היצירה של Ninja Theory. הכל, תוך כדי שיתוף פעולה צמוד עם חברת המשחקים, לטובת מיקוד יכולותיו למה שהמפתחים והשחקנים באמת זקוקים לו. מדובר בגישה שוות ערך לשבע שנים של משחק אנושי, או סה"כ כמיליארד צמדים של תמונות פעולה. הנתונים הללו מרשימים מאוד, אלא שבפועל, מאחר ומדובר במודל ראשוני, הוא מוגבל לייצור Gameplays ברמת רזולוציה נמוכה של 180 X 300 פיקסלים. בניסויים קודמים שביצעה מיקרוסופט על מודלי AI הרזולוציה היתה אמנם נמוכה אפילו יותר (ברמה של 128 X 128), אבל המרחק לרזולוציה הנפוצה בקרב גיימרים של 1080p (1920 x 1080) עדיין גדול מאוד.

במהלך חשיפת המודל הוצגו מספר דוגמאות ליצירת Gameplays ואפילו יכולת של השחקנים לטעון וויזואלים לממשק כדי להנחות את פעולתו. זה נראה מאוד מרשים (ברמת המורכבות, לא הוויזואליות כאמור), אך גם מיקוסופט הודתה ש- Muse עדיין לא מסוגל ליצור משחק שלם או להחליף בפועל את היוצרים מקצה לקצה, אלא לשמש יותר ככלי לבחינת שלבי האינטראקציה המוקדמים של המשחק.

כמו בכל תחום הבינה המלאכותית, גם במקרה תעשיית הגיימינג קיימים חששות רבים מצד היוצרים והמפתחים מהחלפתם בכלי GenAI, מה שמסביר את ההסברים הרבים שהציגה מיקרוסופט למה היא המטרה אליה היא מכוונת את הפיתוח. העקרונות המניעים את גישת החברה לטכנולוגיה המתקדמת הם יצירת ערך רב יותר עבור שחקנים ויוצרי משחקים ולהביא יותר משחקים ליותר אנשים ברחבי העולם. יש הכרה בכך שפיתוח של משחק תמיד יהיה מבוסס על החזון ואומנותו של היוצר, ושבינה מלאכותית גנרטיבית היא בעלת פוטנציאל לשפר את היצירתיות ולפתוח אפשרויות חדשות.
הדגמה שבוצעה בלייב הציגה דמו של יצירת Gameplay בזמן אמת, כולל תגובה לאובייקטים שהופלו למשחק כדי לשנות את סביבתו. גם כאן, מדובר בהרצה ב- 10fps ברזולוציה של 180 X 300, אך הפוטנציאל לעתיד ברור. מיקרוסופט מתכוונת גם לבדוק שימוש ב- Muse לשיפור משחקים קלאסיים כך שיפעלו גם בחומרה מודרנית. הכוונה שהמודל יוכל ללמוד מנתוני משחקי ווידיאו ישנים את האופן בו יוכל להפוך אותם לזמינים בכל פלטפורמה, ללא צורך בשימוש במנוע משחקים ישן שפועל רק על החומרה המקורית.
בחינה נוספת היא כיצד המודל יוכל לעזור למפתחי המשחקים ביצירת אבטיפוס של ממש, או הוספה לכותרים קיימים של חוויות משחקיות חדשות המופעלות ע"י AI. מיקרוסופט לא פירטה על אילו חוויות מדובר, אבל בקרוב תהפוך חלק מהן לזמינות במעבדות Copilot לטובת התנסות של צוותי פיתוח, כמו גם שיתוף כלים וניסויים בבינה מלאכותית עם שחקני Xbox. זוהי חלק מהאג'נדה הכללית של החברה: לוודא שהחידושים הללו אכן יטפלו בבעיות האמיתיות של המפתחים (ודרישות השחקנים) ויוסיפו ערך לחוויית המשחק. במקביל, הבהירה מיקרוסופט שהשימוש ב- GenAI יהיה נתון לשיקוליהם של אולפני המשחקים, באופן אינדיבידואלי ומותאם לצרכי כל סטודיו.
יכולותיו של Muse אם כך הן לא רק פורצות דרך, אלא גם מגדירות את מה שיידרש ממודלים בעתיד להביא לקצה כדי ליצור משחק ברמה גבוהה. ראשית כמובן היא יכולת ה- Gameplay generation עצמה. Muse מסוגל לייצר רצפים של משחק השומרים על עקביות במשך מספר דקות. ע"י הנחיית המודל בעשרה פריימים ראשונים של משחק אנושי (בני שניה) ופעולות בקר מתאימות, המודל מסוגל לחזות את התפתחות המשחק ב- World Model Mode.
חוזקה הכרחית ראשונה של מודל כזה היא העקביות (Consistency) – Muse מבטיח שרצפי ה- Gameplay שנוצרים על ידו מותאמים לדינמיקה המובנית של המשחק. הרצפים מתאמים את תנועות הדמות עם פעולות הבקר, מונעים פעולות לא הגיוניות כמו נפילה מהרצפה ושומרים על נאמנות לפיזיקת המשחק. בחינה (Evaluation) של רמת העקביות מערבת תחילה את מתן ההנחיות למודל יחד עם יצירת רצף המשחק ופעולות הבקר, ולאחר מכן, הוויזואליזציה שנוצרת מושווית לזו הראשונית באמצעות מדד שנקרא FVD (Fréchet Video Distance), שפותח בקהילת יוצרי הווידאו לבחינת רמת איכותו של תוצר Video-Generation.

אלמנט מרכזי נוסף הוא הגיוון (Diversity) – המודל מייצר טווח של גרסאות Gameplay מאותן הנחיות בסיסיות זהות, ומכסה בכך ספקטרום רחב של התפתחות משחק פוטנציאלית. זה כולל הן גיוון חזותי, כמו תנועות ריחוף בסגנונות שונים, והן גיוון התנהגותי, למשל תנועות מצלמה וניווט במספר נתיבים. בחינת רמת הגיוון מבוססת על מדידת Wasserstein distance, שמשווה רצפים שנוצרו ע"י מודלי GenAI לגיוון שקיים בהקלטות Gameplays של שחקנים אנושיים.

הנקודה האחרונה היא התמדה (Persistency) – Muse מטמיע התאמות ושינויים של השחקן לתוך רצפי המשחק המיוצרים על ידו, כמו במקרה של דמות חדשה שמצטרפת לחלק משחק מקורי, והמודל יכול "להצמיד" את המשך ייצור המשחק עם הדמות שנוספה, קרי ליצור Gameplays המתפתחים מאותה נקודה בה בוצע השינוי.

אז כדי לקבל פרספקטיבה על האופן בו מטלטל ה- Game Generation את עולם המשחקים, נבחן את החידושים הגדולים שמביא אתו Muse. ראינו כאן מודל ראשון שמגיע ממשפחת-על חדשה של מודלים: WHAM. זוהי ראשיתה של יכולת בינה מלאכותית ליצור הן ויזואליזציה של משחק והן יישום פקודות בקר, ומייצגת גישה חדשה למודלים של סביבות משחק ואינטראקציות של השחקנים. בנוסף, המודל פועל כמובן ע"ב גישת Data-Driven – ציינו כבר ש- Muse משתמש בכמות עצומה של נתוני משחקי אנושיים מבית Bleeding Edge, מה שאפשר לו להתאמן וללמוד דינמיקה מורכבת של התנהלות משחק וליצור Gameplays אמינים.
גישה מובילה אחרת בפרויקט היתה שת"פ רב תחומי – פיתוח המודל כלל חוקרי Machine Learning, מפתחי משחקים ואנשי קריאטייב, תוך התפקסות על יכולות המודל לענות על צרכי הלקוחות (יוצרים ושחקנים) יחד עם שמירה על אתיקה ואחריות. הערות מפתחי המשחקים שהתקבלו כבר בשלב מוקדם סייעו לעצב את יכולות המודל מראשית הפיתוח.
רכיב קריטי וחדשני שנוסף למודל הוא ה- WHAM Demonstrator – סוג של ממשק חזותי לביצוע אינטראקציה עם Muse, המאפשר טעינת רכיבים חזותיים כסוג של הנחיות ראשוניות, מהם ייוצרו מספר המשכים פוטנציאליים. ניתן גם להתאים את יצירת הרצפים ע"י שינוי פעולות בקר, וכך להקל על תהליכיי יצירה אינטרטיביים. ה- Demonstrator מאפשר ברמה שלא היתה קודם לכן אפשרות להתממשק ישירות עם המודל, לחקור אותו ולבחון באמצעותו רעיונות.

לסיום, כפי שפורט קודם לכן, המודל כולל כמה פרוטוקולי בחינה לרמת העקביות, הגיוון והתמדה, מה שמאפשר הערכת ביצועים שיטתית ומתן תובנות לשיפור היכולות. מסגרת ההערכה שהוטמעה ב- Muse יחד עם מחקרי משתמשים עמוקים אפשרו למיקרוסופט לזהות את אותן יכולות מפתח הנדרשות ליוצרים לטובת שכלול תהליך הפיתוח.
ההשקה של Muse מהווה קפיצה אמיתית בשימוש ב- GenAI בעולם הגיימינג, כרגע לטובת יצירת רעיונות משחק והתייעלות שלבי הפיתוח הרעיוני. מיקרוסופט מתעתדת להוציא החוצה את המשקלים השונים של המודל וה- Data עליו הוא התבסס כקוד פתוח, ויחד עם מתן גישה לקובץ ההפעלה של ה- Demonstrator המודל יוכל להיהפך לכלי לשכלול פוטנציאל הבינה המלאכותית בתחום. ברור שיש כאן הצגת תכלית ראשונית של עד לאן הטכנולוגיה הזו תוכל להתקדם, וכאן כאמור טמון החשש של היוצרים. ולא מדובר פה בפראנויה. הפחד של מפתחי משחקים והסטדיוז לגבי האופן שבו GenAI יכול להשפיע על התהליך היצירתי של ייצור משחקים, מגיע בתקופה שבה כמעט כל שבוע אנו שומעים בשורת פיטורים נוספת בתעשייה. ההערכות הן שאחד מכל עשרה מפתחי משחקים איבד את עבודתו ב- 2024 בלבד.
הארכיטקטורה המתקדמת של המודל, המבוססת על Transformer Networks ואימון על נתוני משחק אנושיים, מצליחה בפועל להדגים יצירת Gameplays של ממש, מוגבלים כרגע רק באורכם ורמת הרזולוציה. והפוטנציאל ברור – מה שהיום מתאים לבחינת רעיונות, יוכל עם התרחבות היכולות הטכניות גם לשמש ליצירת משחק מקצה לקצה. אז אומנם הרעיון ל- Hallo או ה- Call of Duty הבאים יעלה במוחו המתוחכם של יוצר אנושי, אבל מפתחי היצירות האלה בפועל יודעים שזה כנראה הזמן האחרון ליצור תשתית אתית ומשפטית נכונה, שתגדר את המחוזות אליהם יותר ל- GenAI להגיע, רגע לפני שצונאמי של משחקים מהירי פיתוח וזולים ישטפו את התעשייה ואת רוב המועסקים בה (החוצה).

ובכל זאת, אם נשים בצד את הטלטלה התעסוקתית שהבינה המלאכותית מאיימת בה כמעט בכל תחום אליו היא נכנסת, אולי משהו אחרון שמגיע ממקום טהור של העשרת חוויית משתמש. זוכרים את גיא מתחילת הפוסט? כן, אותו NPC שמגיע לפתע להתפקחות והארה של מי הוא ומה תפקידו במשחק ואז "מורד בקוד בדרכו להפוך לגיבור ולמצוא אהבה? אז רק דמיינו מה יכולות הטכנולוגיה הזו יעשו לכל עולם "דמויות המשנה" שמסתובבות במשחק, במקרה הטוב כמנחה לגיבור הראשי ובמקרה הרע כעובר אורח חסר משמעות (למעט היותו חלק זניח בבניית האווירה). בעזרת ה- GenAI ניתן יהיה ליצור דמויות משנה עם חיים עשירים, דעות, התנהגות אנושית, יכולות שיחה – וכל זאת לפי צרכי המשחק ואג'נדת ה- Environment שלו.
דמיינו ביקור באצטדיון שבו ניתן לשוחח עם האוהד שלידיכם, להיות חלק מצוות חילוץ בני ערובה שהסקרנים מסביב מתנהגים באופן שמפריע כמו שקהל צופים כזה מפריע, או ליצור משחק מדמה חיים אמיתי בו כל דמות, החל ממוכר הקפה ועד מי שחולף מולך במעבר החציה, הוא דמות עמוקה שמסוגלת להניע התרחשות שונה לגמרי. אווירת משחק כזה תהיה משהו מהפכני בעולם הגיימינג, וזאת עוד לפני שנחשוב על פוטנציאל העשרת עלילת המשחק עצמה. יכולות ה- GenAI החדשות מחזקות בצורה מהפכנית את עומקו הפוטנציאלי של המשחק ומורכבות הסיפור שלו. וגם אם אתם בתכלס מעדיפים משחקים פשוטים, לפחות ייעשה פה צדק עם הרבה NPCs שישוחררו ממגבלות הקוד ויקבלו חיים חדשים ובעלי משמעות...
Comments