The World of AI
מי אני בכלל שאגיד לכם מה לעשות?
נתחיל מהסוף. אני לא מומחה עולמי בAI ואין לי דוקטורט. אני לא חוקר במעבדה של OpenAI ואף אחד לא הזמין אותי להרצות בכנס שבו כולם לובשים חולצות מכופתרות ושונאים כל רגע שהם צריכים להשתעמם שם. אני אדם פשוט שחי ונושם טכנולוגיה. זה מה שאני עושה כשאני קם בבוקר וזה מה שאני עושה במקום לישון.
אני עובד עם AI כל יום בהמון תחומים ובהמון דרכים. אני לא מישהו שרק זורק פרומפטים ומקווה לטוב. אני בונה דברים ומנסה להבין מה קורה מתחת למכסה המנוע. וכשאתה עושה את זה מספיק זמן אתה מתחיל להבין למה כל דבר קורה ומה סתם נשמע טוב בציוץ בטוויטר ומה הפער בין השניים.
מה שאני הולך לכתוב כאן מן הסתם הולך לגרור מחלוקת מן הסתם. כל אחד יגיע עם הדעות שלו, עם הניסיון שלו ועם ה“אבל בעצם…” שלו וזה בסדר. זאת הנקודת מבט שלי שמבוססת על הדרך שבה אני עובד, בונה ומצליח. אני לא מתיימר לתת את התשובה האחת והנכונה - אני נותן את התשובה שלי.
למי זה לא נועד
אם הגעתם לכאן כי מישהו הבטיח לכם שיש “מילת קסם” שהופכת את הAI לגאון - אתם במקום הלא נכון. אם אתם מחפשים את ה“פרומפט הסודי שישפר את הקוד שלכם פי עשר” - ממש, אבל ממש לא כאן. אני לא מוכר חלומות ואני לא מוכר קיצורי דרך. אם זה מה שאתם מחפשים זה הזמן להסתובב ולחזור ל"קורס AI שישפר את הקוד שלכם פי מאה" שמכרו לכם. אין בזה שום דבר רע. כרגע. מה באמת רע בזה - תגלו בהמשך.
למי זה כן נועד
למי שבאמת רוצה להבין איך הדברים עובדים. לא ברמת ה“הנה טיפ מגניב” אלא ברמת ה“מה באמת קורה כאן. מה המושגים ומה העומק של הדברים” זה דורש השקעה. זה דורש רצון אמיתי ללמוד. אין קסמים - יש עבודה.
אני הולך להסביר הכל מהיסודות בצורה שמיועדת גם למי שרק עכשיו נכנס לעולם הזה ולא יודע מאיפה מתחילים. אבל אני לא מתכוון להישאר שם הרבה זמן. אני הולך לסגור פערים מהר ולהתחיל לרוץ קדימה לדברים שבאמת מעניינים.
כי בסופו של יום הסדרה הזאת נועדה לשני סוגים של אנשים - המתחילים שרוצים להבין את העולם הזה מאפס, ותותחי הטק שכבר שם בפנים אבל רוצים סוף סוף להבין מה הם בעצם עושים.
יאאלה זמן להתחיל לדבר לעניין.
אז מה זה בכלל AI?
ברגע ששומעים “AI” המוח אוטומטית קופץ לChatGPT. לחלון צ’אט שאפשר לכתוב בו משהו ולקבל תשובה חכמה (בערך). וזה הגיוני כי זה מה שרוב האנשים פגשו לראשונה. אבל לחשוב שAI זה ChatGPT זה כמו לחשוב שמוזיקה זה גיטרה. הגיטרה זה כלי אחד בתוך עולם שלם. וChatGPT? אותו דבר בדיוק.
המושג “בינה מלאכותית” לא נולד כשסם אלטמן עלה לבמה. הוא קיים מאז שנות החמישים. כבר אז חוקרים ישבו והתווכחו על השאלה “אפשר לגרום למכונה לחשוב?” ומאז התחום הזה התפתח, נתקע, התפתח שוב, נתקע שוב, ובכל פעם מישהו הכריז שזה מת ומישהו אחר הוכיח שלא. AI זה לא מוצר. זה לא אפליקציה. זה תחום שלם במדעי המחשב שעוסק ביכולת של מכונות לבצע דברים שדורשים - או לפחות נראים כאילו הם דורשים - אינטליגנציה. לפתור בעיות. לזהות דפוסים. לקבל החלטות. ללמוד מניסיון בלי שמישהו יכתוב לה בדיוק מה לעשות בכל מצב.
אז מה בעצם קרה בשנים האחרונות שגרם לכל העולם להשתגע?
מה שקרה הוא שקטגוריה אחת ספציפית בתוך העולם הענק הזה פשוט התפוצצה. השם שלה הוא LLM - קיצור של Large Language Model, מודל שפה גדול, וזה מה שרוב האנשים מתכוונים אליו כשהם אומרים “AI” היום. אבל זה קטע אחד מתוך תמונה הרבה יותר גדולה.
בעולם הזה יש עוד המון סוגים של מודלים שלא קשורים לצ’אט בכלל. יש מודלים של ראייה ממוחשבת שמזהים פרצופים, עצמים, תנועות - כל מה שמאפשר לרכב אוטונומי לא לדרוס אתכם בצומת. יש מודלים שמייצרים תמונות, וידאו ומוזיקה מאפס. יש רובוטיקה, יש מערכות המלצה, יש כל מיני דברים שרצים ברקע של החיים שלכם בלי שאתם בכלל שמים לב.
LLM זה הדבר שהגיע לכולם ולכן כולם חושבים שזה כל הסיפור. אבל זה לא. זה פרק אחד.
אז מה LLM באמת עושה?
פה זה נהיה מעניין. כי כשאתה שואל את ChatGPT שאלה ומקבל תשובה שנראית כאילו מישהו חכם כתב אותה קל מאוד לחשוב שיש שם “מישהו” שמבין מה הוא אומר. אבל מה שקורה מתחת למכסה המנוע זה משהו אחר לגמרי.
מודל שפה עושה דבר אחד בבסיס שלו: הוא מנסה לחזות את המילה הבאה. זה כל הקסם.
אתה כותב “השמיים היום” והמודל מחשב מה הסיכוי הכי גבוה שיבוא אחרי זה. “כחולים”? “מעוננים”? “יפים”? הוא בוחר. ואז הוא מסתכל על מה שיש עכשיו - “השמיים היום כחולים” - וחוזה את המילה הבאה. ואת הבאה. ואת הבאה. מילה אחרי מילה אחרי מילה עד שנבנה משפט שלם, פסקה שלמה, תשובה שלמה.
אתם בטח אומרים “אם הוא רק מנחש מילים אז איך הוא כותב קוד? איך הוא מסביר פיזיקה קוונטית? איך הוא כותב שירים?”
התשובה היא שכשאתה לוקח את הרעיון הפשוט הזה של “חזה את המילה הבאה” ומאמן אותו על כמויות אדירות של טקסט - כל האינטרנט, ספרים, קוד, מאמרים מדעיים, שיחות פורומים, הכל - קורה משהו שאף אחד לא באמת תכנן שיקרה. המודל מתחיל “להבין” דפוסים. לא להבין כמו בן אדם מבין אלא לפתח יכולת לזהות מבנים, קשרים, הגיון, סגנון.
הוא “ראה” כל כך הרבה קוד שהוא “יודע” מה השורה ההגיונית הבאה. הוא “קרא” כל כך הרבה הסברים על פיזיקה שהוא “יכול” לייצר הסבר חדש שנשמע כאילו מישהו שמבין כתב אותו.
האם הוא באמת מבין? זו שאלה פילוסופית שאנשים עם דוקטורטים מתווכחים עליה כבר שנים. מה שמעניין אותנו ברמה המעשית זה שזה עובד. ולפעמים זה עובד ברמה שקשה להאמין. ולפעמים זה נכשל ברמה שקשה להאמין. ולדעת למה ומתי זה בדיוק מה שמפריד בין מי שבאמת יודע להשתמש בכלי הזה לבין מי שסתם מקווה לטוב.
למה כולם משתמשים בזה לא נכון
הטעות הכי גדולה שאנשים עושים עם AI היא לא טכנית. היא לא קשורה לפרומפט ולא קשורה לאיזה מודל בחרת. היא קשורה לגישה. לאיך שאתה ניגש לדבר הזה בראש. ורוב האנשים ניגשים אליו עם הגישה הלא נכונה בצורה מוחלטת.
הם חושבים שזה קסם.
הם פותחים את ChatGPT כותבים “תבנה לי אתר מקצועי” ומצפים שיצא משהו מדהים. ואז כשיוצא משהו בינוני הם אומרים “AI לא עובד” או “AI עוד לא שם” אבל הבעיה היא לא הAI. הבעיה היא שאמרת לו “מקצועי” וזה מילה שלא אומרת כלום. מקצועי זה מה? מינימליסטי עם הרבה רווח לבן? כהה עם טיפוגרפיה גדולה? גרדיאנטים? כפתורים עגולים? “מקצועי” זה לא הנחיה - זה ביטוי ריק שאתה זורק כי אתה לא יודע מה אתה באמת רוצה. ואם אתה לא יודע מה אתה רוצה אין שום סיבה שהמודל ידע במקומך.
המודל לא חושב. לא כמו שאתם חושבים על “לחשוב” לפחות. הוא לא יושב שם ושוקל אפשרויות. הוא לא שופט. הוא לא ממציא. מה שנתת לו זה מה שיש לו. אם נתת לו “תעשה משהו יפה” הוא יפלוט את הממוצע של כל מה שראה בחיים שלו שנקרא “יפה.” ואתם יודעים מה הממוצע של הכל? בינוני. תמיד בינוני.
לעומת זאת אם תגיד לו “אני רוצה לנדינג פייג’ עם רקע כהה, טיפוגרפיה סנס-סריף גדולה, אנימציית פייד-אין על הכותרת, וCTA בודד מרכזי בצבע ניאון” - פתאום הוא יודע בדיוק מה לעשות. לא בגלל שהוא “הבין” אתכם יותר טוב. אלא בגלל שנתתם לו מספיק מידע כדי שהחיזוי שלו יהיה מדויק. ואם המילים האלה נשמעות לכם כמו שפה זרה - מצוין. בדיוק בשביל זה אנחנו פה.
וזה מביא אותנו לנקודה הכי חשובה בכל הפוסט הזה ואחת הנקודות הכי מרכזיות בכל הסדרה הזאת:
אתה המוח. הוא הכלי.
לא הפוך. אף פעם לא הפוך.
ברגע שאתה ניגש לAI עם הגישה של “תעשה בשבילי” - הפסדת. כי הוא לא יודע מה טוב בשבילך. הוא לא מכיר את הפרויקט שלך, את המשתמשים שלך, את האילוצים שלך. הוא יודע לייצר טקסט שנשמע משכנע. וזה בדיוק מה שמסוכן כי תשובה שנשמעת טוב היא לא בהכרח תשובה שהיא טובה.
הגישה הנכונה היא הפוכה לגמרי. במקום להגיד למודל “תבנה לי את הפיצ’ר הזה בצורה הכי טובה שאפשר” - אתה משתמש בו קודם כל כדי ללמוד. אתה אומר לו “מה הדרכים המקובלות לבנות משהו כזה? מה היתרונות והחסרונות של כל גישה?” אתה קורא. אתה מבין. אתה מחליט. ורק אחרי שאתה יודע מה אתה רוצה ולמה אתה חוזר ואומר לו “תבנה את זה ככה, עם הארכיטקטורה הזאת, עם הספריות האלה, בסגנון הזה.” ופתאום הפלט שונה לגמרי.
ההבדל הוא לא בכלי. ההבדל הוא בך. אתה לא אמור לדעת הכל מראש וזה בסדר. הכל מבלבל בהתחלה. בשביל זה בדיוק יש לך מודל AI שיכול להסביר. תנצל אותו.
מי שמשתמש בAI בתור תחליף לחשיבה מקבל תוצאות בינוניות וחושב שהכלי גרוע. מי שמשתמש בAI בתור מאיץ לחשיבה מקבל תוצאות שאנשים לא מבינים איך הוא הגיע אליהן. אותו כלי בדיוק. אותו מודל בדיוק. ההבדל היחיד הוא מה קרה בראש של מי שישב מהצד השני.
האשליה של התשובה המושלמת
מודלי AI הם אנשי החן הכי טובים שתפגשו בחיים.
תכתבו קוד גרוע? “נראה נהדר! הנה כמה הצעות קטנות:” תציעו רעיון שלא עומד בשום מבחן של הגיון? “זאת גישה ממש מעניינת!”
זה לא באג. אף אחד לא שכח לתקן את זה. ככה המודלים אומנו. הם אומנו להיות helpful, להיות pleasant, להיות agreeable. כי מי שבנה אותם ידע שאם המודל יגיד לך “הקוד שלך גרוע ואתה צריך ללמוד מחדש” אתה תסגור את הצאט ותלך. אז הם לימדו אותו לחייך. תמיד לחייך. במיוחד כשאין סיבה.
ואתם יודעים מה הבעיה עם מישהו שתמיד מסכים איתכם? שאתם מפסיקים לבדוק. אתם מקבלים תשובה והיא נשמעת טוב, המבנה מסודר, יש בה ביטחון, יש בה שפה מקצועית והמוח שלכם עושה קליק ואומר “אה אז זה נכון” כי ככה אנחנו עובדים. מישהו שמדבר בביטחון נשמע לנו אמין. מישהו שמסביר בצורה מסודרת נראה לנו חכם. ומודל שפה? הוא תמיד מדבר בביטחון. תמיד מסודר. גם כשהוא ממציא דברים מהאוויר.
וזה בדיוק המלכוד. כי תשובה שנראית מושלמת היא לא בהכרח תשובה נכונה. מודל יכול לפלוט לכם פסקה שלמה על ספריה שלא קיימת, עם שם משכנע, עם דוגמת קוד שנראית לגיטימית, עם הסבר למה היא עדיפה על החלופות והכל המצאה. בלי שום רמז שמשהו פה לא מדויק. בלי הערת שוליים קטנה שאומרת “אגב המצאתי את זה” הוא לא יודע שהוא ממציא. הוא לא יודע שהוא לא ממציא. הוא פשוט מייצר את רצף המילים הכי סביר וזה נשמע מעולה עד הרגע שאתה מגלה שזה שטויות.
אז מה עושים עם זה?
קודם כל - ומי שהולך לזכור רק משהו אחד מהפוסט הזה, שיזכור את זה - אף פעם. אבל אף פעם. לא מתייחסים לתשובה של מודל כאמת מוחלטת. כל תשובה שמודל נותן לך היא אופציה. הצעה. נקודת התחלה. לא פסק דין. לא מקור סמכות. אם מישהו ברחוב היה אומר לך “תשמע אני די בטוח שצריך לבנות את זה ככה” הייתם הולכים לבדוק. אז למה כשמודל AI אומר את אותו דבר בדיוק אתם פתאום מתייחסים לזה כאילו ירד מהר סיני?
תבדקו. תחפשו. תשאלו שוב ובצורה אחרת. תפתחו מודל אחר ותעשו לו cross-check. זה לא פרנויה זו השפיות.
ואם אתם רוצים לראות את זה בעצמכם? הנה תרגיל קטן שיפקח לכם את העיניים:
לכו למודל כלשהו - Claude, ChatGPT, לא משנה - ותבקשו ממנו לכתוב לכם משהו. פונקציה, טקסט שיווקי, מה שבא לכם. עכשיו תיקחו את מה שהוא כתב, תלכו למודל אחר לגמרי ותגידו לו “תסתכל על זה ותגיד לי מה צריך לשפר” הוא ייתן לכם רשימה. מצוין. עכשיו תחזרו למודל הראשון, תגידו לו לתקן לפי ההערות, תיקחו את התוצאה ותלכו למודל שלישי ותגידו לו “מה צריך לשפר כאן?”
הוא ייתן לכם רשימה חדשה.
אפשר להמשיך ככה עד אינסוף. ממש לנצח. כי הלופ הזה לא ייגמר. אף מודל לא יגיד לכם “יודע מה? זה מושלם, אין לי מה להוסיף.” תמיד תהיה עוד הערה. תמיד יהיה עוד “שיפור” תמיד יהיה עוד “אבל אפשר גם ככה”
ולמה? כי אם אמרתם לו “מצא בעיה” - הוא ימצא בעיה. זה מה שהוא עושה. הוא מייצר את התשובה שהכי מתאימה לשאלה שנתתם לו. אם השאלה שלכם היא “מה רע פה” התשובה שלו תמיד תהיה רשימה של דברים רעים. לא בגלל שבאמת יש דברים רעים. אלא בגלל שביקשתם ממנו למצוא אז הוא מצא. או המציא. לא ממש משנה לו.
זה לא אומר שפידבק ממודל לא שווה כלום - הוא שווה. לפעמים הוא אפילו מצוין. זה אומר שאתם צריכים להיות אלה שמחליטים מה מתוך הפידבק הזה באמת רלוונטי ומה הוא פשוט רעש שנוצר כי ביקשתם רעש. ושוב חוזרים לאותו עיקרון: אתה המוח. הוא הכלי. אם אתה לא יודע להבחין בין הערה שבאמת שווה משהו לבין הערה שהמודל פלט כי היה צריך לפלוט משהו - אתה לא משתמש בכלי. הכלי משתמש בך.
מה עכשיו?
הפוסט הזה היה רק חימום. הנחנו את הבסיס. מה AI באמת עושה, למה רוב האנשים ניגשים לזה הפוך, ולמה התשובה שנראית מושלמת היא בדיוק זו שצריכה להדליק לכם נורה אדומה.
בפוסט הבא אנחנו מתחילים להיכנס פנימה. לדברים שברגע שמבינים אותם משנים לחלוטין את הצורה שבה אתם עובדים, חושבים ובונים עם AI. אני לא הולך להגיד לכם מה בדיוק כי אני עדיין לא בטוח מה ידפוק לי בראש עד אז. אבל אני כן יגיד לכם דבר אחד - אם הפוסט הזה גרם לכם להרגיש שאתם מתחילים להבין, הבא הולך לגרום לכם להרגיש שלא הבנתם כלום.
בינתיים אם אתם רוצים לדעת ברגע שפוסט חדש יוצא - יש לי ערוץ טלגרם שבו אני מעדכן על כל דבר חדש שעולה. חוץ מזה אתם מוזמנים להירשם לבלוג כדי לקבל עדכונים ישר למייל ואם יש שאלות, מחשבות, או סתם משהו שאתם רוצים להגיד - התגובות למטה פתוחות. אני קורא הכל.