אהלן, כאן אמיתי בונה עם הניוזלטר השבועי על AI ופרודוקטיביות.
השבוע בתוכנית:
מחשבות ראשונות על ההשקה של GPT-5
המודלים הפתוחים של OpenAI.
הפכתי את Comet ליזם סולו
האם פרוטוטייפ שנוצר ב-Vibe coding באמת יכול להחליף מסמך PRD?
עוד עדכונים מהשבוע.
אם המייל חתוך או לא מוצג טוב, ממליץ לעבור לגרסת הדפדפן בקישור הזה.
אחרי הרבה ציפייה ולא מעט טיזינג, אתמול סוף סוף קיבלנו את GPT-5, מודל הדגל החדש של OpenAI.
אז מה היה לנו שם?
נתחיל מהחלק הכי חשוב - נגמר עידן בחירת המודלים!
עד עכשיו היינו צריכים להיות חצי מומחים כדי לדעת איזה מודל לבחור GPT-4o? o3? GPT-4.1? כל אחד עם יכולות שונות.
בפועל רוב המשתמשים נשארו על ברירת המחדל, ואפילו לא נחשפו ליכולות של מודלי החשיבה שנכנסו לחיים שלנו בשנה האחרונה.
אז GPT-5 סוגר את הפער הזה - הוא מחליט לבד אם לרוץ מהר או להפעיל חשיבה מעמיקה.
שדרוג נוסף הוא הגדלת חלון ההקשר מ-128 אלף ל-400 אלף טוקנים, פי שלושה, מה שיאפשר לו לעבד יותר מידע בכל פרומפט,
זה חשוב במיוחד עכשיו כשהצ’אט מתחיל להשתלב באינטגרציות MCP למערכות בארגון שלנו.
חוץ מזה הוא פשוט אמור להיות יותר טוב כמעט בכל דבר: כותב בצורה אנושית יותר, פועל בצורה פרואקטיבית, השתפר משמעותית בכתיבת קוד, מפחית הזיות, משתפר במולטימודאליות ועוד.
כך הוא נראה בפעולה:
ועכשיו נעבור לשאלה שכולם שואלים כרגע: האם הוא עמד בציפיות?
אז קודם כל אתן דיסקליימר שעדיין לא ניסיתי אותו מספיק זמן בעצמי בשביל לחוות דעה מוצקה בנושא,
וכל מה שאני כותב כאן מתבסס על ההתרשמות שלי ועל ביקורות של אנשים שאני מעריך ועוקב אחריהם, שקיבלו גישה מוקדמת.
כך אני רואה את זה כרגע:
למשתמשים המנוסים, אמנם מדובר בשדרוג ברמת הביצועים, הנוחות, המהירות והיכולת להשתמש בו ליישומים חדשים - אבל לא מדובר בשדרוג משנה חיים כמו שאולי ציפינו לקבל.
ראיתי כבר כמה פוסטים של אנשים שהתאכזבו כי מרגישים שמדובר בשדרוג לא מאד משמעותי שקיבל יחסי ציבור מוגזמים, אבל לדעתי זה לא המצב, ואסביר למה:
מחוץ לבועת הלניקדאין, יש מאות מיליוני אנשים שמשתמשים בגרסה החינמית של ChatGPT, או בצ׳אט בעבודה דרך Copilot 365 של מיקרוסופט - שגם השתדרג אתמול בלילה לעבוד עם המודל החדש.
רובם הגדול לא השתמשו במודלי חשיבה כמו o3 עד היום ורק ההנגשה של מצב החשיבה תיהיה מאד משמעותית עבורם.
הם אולי עוד לא מודעים לזה, אבל בתקופה הקרובה הם יתחילו לגלות עוד ועוד דברים שהם מצליחים לעשות הצ׳אט וההשפעה על הפרודוקטיביות בעבודה תיהיה דרמטית,
וגם בתוך מוצרים - הרבה מוצרים יעברו שדרוג משמעותי כרגע פשוט כי הם יחליפו את המנוע מאחורי הקלעים.
חשוב להגיד - אנחנו בשלב מאד מוקדם ויש עוד הרבה שאלות פתוחות שיתבררו בימים הקרובים ואני מאד סקרן לגביהן, כמו:
1.האם הוא באמת יותר טוב מ-Sonnet בקוד?
יש סימנים ראשונים שכן, אבל עדיין לא ברור ויש דעות גם לצד השני. אם כן, זה יהיה מאד משמעותי ויכניס את אנתרופיק לצרות.
2. איזה יוס קייסים חדשים ומשמעותיים הוא יפתח לנו: וייב קודינג לרמת פרודקשן? יצירת מצגות שנראות טוב? משימות ניתוח דאטה מורכבות?
כל שימוש כזה יכול לחסוך לחברות המון זמן וכסף.
אז מה צריך לעשות עכשיו?
בשתי מילים: לנסות מחדש.
אחת הטעויות הכי גדולות שאנשים עושים היא לגבש דעה בשלב מוקדם על יכולות הצ׳אט ולהפסיק לנסות.
חשוב לזכור שכל שדרוג במודלים, ובמיוחד שדרוג גדול כזה, פותח המון Use Cases חדשים ואפשרות לשפר את תהליכי העבודה שלנו.
לכן, כדאי לבוא אליו בגישה של דף חלק ולהקדיש זמן לנסות שוב את הדברים שעד היום הוא לא ממש הצליח לעשות.
בשורה התחתונה, למרות שהשדרוג אולי לא מטורף כמו שציפינו, לתחושתי הוא מאוד משמעותי,
כמובן שאחרי שאשתמש בו תקופה - אכתוב על זה שוב עם דעה מגובשת יותר.
בתמונה - עידכנתי את טבלת בחירת המודלים באתר של Chatmatrix אחרי העדכון האחרון.
המודלים הפתוחים של OpenAI
יום לפני ההשקה של GPT5 חברת OpenAI סוף סוף הצדיקה את החלק הרשאון בשם שלה ושחררה שני מודלים פתוחים.
חשוב להגיד - הם לא הראשונים שעושים את זה, אבל מה שמעניין פה זה שמדובר במודלים מ-מ-ש טובים.
כמה טובים?
יותר מכל מודל פתוח אחר שזמין היום, כולל של Meta וכולל כל הסינים.
ומה שהופך את זה לעוד יותר מעניין?
המודלים האלה גם מאד חסכוניים - ברמה שאפשר להריץ מודל ברמה של o3-mini לוקאלית לגמרי על מקבוק יחסית חזק - בלי צורך בחיבור לאינטרנט וכל המידע נשאר לוקאלית על המחשב.
למה זה מעניין?
כי זה יאיץ את האימוץ של המודלים במקומות שבעבר היו כמעט בלתי אפשריים בגלל רגולציה, פרטיות או תלות בענן:
פיננסים, רפואה, משפט, ביטחון, מערכות מבודדותוגם יאפשר לכל מי שרוצה לעשות עליו fine tunning ולהתאים לתעשיה שלו.
ועכשיו לשאלה המעניינת באמת - למה הם עשו את זה?
הרי זה שובר להם את המודל העסקי ועושה קניבליזציה למודלים הסגורים שלהם.
זו התשובה שלי:
1. אם הם לא יעשו את זה - מישהו אחר יעשה. זה רק עניין של זמן. הסינים לאפ פראיירים וממש לאחרונה פורסם שמטא ״גנבה״ להם מהנדסים ואין ספק שבקרוב נשמע ממנה גם חדשות בתחום.
2. כפי שראינו בהמשך השבוע הם הוציאו את GPT 5 מה שהופך את המודלים האלה לקצת פחות רלוונטי.
בסופו של דבר מדובר במהלך שנותן להם הרבה נקודות ויחסי ציבור ולא פוגע להם במודל העסקי.
בגרף תוכלו לראות את הביצועים של שני המודלים הפתוחים (20b הקטן ו120b הגדול) ביחס למודלים הקיימים של OpenAI בבנצ׳מרקים המובילים -מרשים ביותר.
הפכתי את Comet ליזם סולו 🤯
בהמשך לניסיונות שלי Comet הדפדפן האייג׳נטי של Perplexity הפעם איתגרתי אותו במשימה קשה במיוחד - רציתי לבדוק האם הוא יכול לבצע לי תהליך שלם של:
חיפוש בעיה אמיתית של מנהלי מוצר ב-Reddit
מחקר שוק וחיפוש פתרונות דומים
אפיון מוצר וכתיבת PRD
פיתוח פרוטוטייפ לרעיון עם Base44
וכל זה בפרומפט אחד - וכמעט בלי התערבות שלי
ונחשו מה?
הוא הצליח!(עם קליק אחד שלי).
קח זה נראה:חשוב להגיד - למרות שאהבתי את הרעיון (כלי לתמיכה רגשית במנהלי מוצר), המוצר הזה רחוק מלהיות מוצר מוגמר והתהליך שהוא עשה לא מספיק מעמיק לולידציה אמיתית,
אבל זה עדיין מעיף את המוח שהוא עשה את הכל לגמרי לבד ובסוף קיבלתי מוצר עובד!
תחשבו על Agent שרץ כל היום ב-Reddit, מחפש רעיונות, בונה פרוטוטייפים, מפרסם אותם, אוסף פידבק ובסוף מביא לכם רק את הרעיונות שעבדו הכי טוב...
מוזמנים לראות את המוצר הסופי ואת הפרומפט בתגובות.
האם פרוטוטייפ שנוצר ב-Vibe coding באמת יכול להחליף מסמך PRD?
בהמשך לניוזלטר מהשבוע שעבר, קיבל לא מעט שאלות בנושא, אז אני רוצה לתת עוד קונטקסט ולחדד כמה דברים:
1. כשאני מדבר על שימוש ב-Vibe Coding לאפיון, הכוונה היא לא לדלג על שלבי החשיבה והתכנון - אלא על להוסיף להם מימד ויזואלי ואינטראקטיבי.
האם צריך לדבר עם לקוחות לפני?
לעשות מחקר שוק ומתחרים?
לקחת בחשבון מטרות עסקיות ו־Dependencies?
ברור שכן.
ולא פחות חשוב - להפעיל חשיבה מוצרית בכל שלב.
בסופו של דבר המלכודת של ״להפקיד את המוח״ שלנו ולתת לכלי AI לקבל החלטות במקומנו קיימת גם כשכותבים PRD עם הצ׳אט...
בנוסף - חשוב לזכור שהמגמה הזו לא הגיעה בוואקום, אלא כתגובה לסרבול שנוצר בתהליכים האלו בחברות.
זה לא דבר נדיר לשמוע שמנהל מוצר עבד על מסמך PRD במשך שבוע ובסוף אף אחד לא באמת קורא אותו לעומק.
אז מה הפתרון?
החלק היפה פה - הוא שלא באמת צריך לבחור ביניהם, אפשר לעשות גם וגם ויש פה עניין של איזונים,
כמובן שיש דברים שחייבים להיות מתועדים במסמך - אבל הרעיון הוא לנסות לצלמצם אותם למינימום ולשאוף להראות כמה שיותר.
2. לא כל לפיצ'ר מתאים פרוטוטייפ מסוג Vibe Coding -
לדוגמה, פיצ'רים של AI שרצים מאחורי הקלעים בלי UI - לא מצריכים פרוטוטייפ ויזואלי. במקרים כאלה, אפשר לבנות פרוטוטייפ ב-n8n שמדגים את הלוגיקה או התרחיש.
3. ביקשו שאפרט על סוגי הפרוטוטופיים -אז חשוב לי להגיד שאין פה אמת אחת, אבל זו החלוקה שלי נראית הכי הגיונית:
רמה ראשונה – פרוטוטייפ למטרת בריינסטורם:
המטרה היא "לשחק" עם הרעיונות, לזרוק אותם לתוך אחד הכלים אלה ולנסות כל מיני קונספטים, כדי לבדוק אם זה מתכנס למה שדמיינו.
למטרה הזו אפשר להשתמש בכל כלי שזמין לנו, אפילו ב-Claude או Gemini עם פיצ׳ר (ChatGPT פחות מומלץ למטרה הזו)
רמה שנייה – פרוטוטייפ למטרת קולבורציה:
כאן אנחנו רוצים להראות את הרעיון שלנו לצוות הפיתוח ולעיצוב כדי לקבל פידבק מוקדם ולזהות בעיות לפני שהן קורות.
חשוב להדגיש: העיצוב הסופי הוא לא המטרה כאן, אלא המחשה ברורה של הרעיון,
אני בגישה שהמעצבים הם אלה שאחראים על העיצוב והפרודקט צריך להתמקד יותר בקונספט הכללי ובחיבור לביזנס.
בשלב הזה רצוי להשתמש בכלי Vibe Coding ייעודיים בגרסאות ארגוניות. לדעתי, Base44, Lovable, Bolt, Magic Patterns ו-Figma Make הן אופציות מעולות, ולכל אחת מהן יתרונות שונים.
רמה שלישית – פרוטוטייפ למטרת User Testing:
זוהי רמה מאד גבוהה שרוב החברות עדיין לא מגיעות אליה.
ממה שאני שומע בשטח, רוב הלקוחות לא יהיו סבלניים למשהו שהוא ״בערך״ או עם עיצוב 90% דומה למוצר האמיתי וכלי ה-Vibe coding לא מגיעים לרמה מספיק טובה.
לכן, כדי לבנות פרוטוטייפ שמוכן למבחני משתמשים חיצוניים, לרוב צריך תשתית פנימית שכוללת Figma, MCP, Cursor וחיבור לקוד של מוצר.
רמה רביעית – מעבר לפרודקשן.
זה אכן הצעד המתבקש והוא עולה בכל פעם שמדברים על הנושא הזה.
ברמה העקרונית - זה אפשרי, אבל כמו שציינתי בפוסט הקודם, זה רחוק מלהיות פשוט.
יש כאן אתגרים גדולים ברמת התשתית, התאמת הקוד וגם ושאלות פתוחות כמו: מה גבול האחריות בין פרודקט, עיצוב ופיתוח, ואיך שומרים על רמת מקצועיות גבוהה כשמדלגים על שלבי ביניים.
אני מאמין שבסופו של דבר לשלב הזה וסקרן לראות איך התחום הזה יתעצב יתפתח בחודשים הקרובים.
עוד עדכונים מהשבוע:
בדיוק בזמן לאוגוסט - גוגל משיקה פיצ׳ר חדש ב-Gemini ליצירת סיפורי ילדים עם איורים. ניסיתי ועובד נחמד - רק תעשו לילדים שלכם טובה ואל תנסו את ההקראה הקולית בעברית, זה עוד לא שם.
איך משתמשים?
נכנסים ל-Gemini ובוחרים באופציה של Storybook בסרגל בצד שמאל.
גוגל משיקה את Genie, מוצר ליצירת עולמות וירטואליים. זה מאד מאד מרשים ועדיין לא יצא לנסות כל הפרטים כאן.
אנתרופיק משיקה את Claude Opus 4.1, גרסה משודרגת לדגם הדגל שלה. זמין כבר בקרסר ובקלוד קוד ולפי הדיווחים מהווה שדרוג משמעותי.
קורסים וסדנאות קרובים:
פתחנו שני מחזורים נוספים של סדנת AI Agents עם n8n בחודש ספטמבר! המקומות כבר כמעט מלאים אז אם זה מעניין אתכם ממליץ להירשם כאן.
המחזור הבא של קורס Vibe Coding למתחילים נפתח ב17.8 ואפשר להירשם כאן.
הבינה האמנותית: כש Star Wars פוגשים את Queen
עד כן להיום!
למצטרפים החדשים, אני מזכיר שתוכלו לקרוא את כל המהדורות הקודמות שפספסתם בבלוג.
כרגיל - אני מזמין אתכם לשתף עם חברים ועם אנשים שהתוכן הזה יכול לעניין אותם.
מוזמנים גם לשתף בקבוצות ווטסאפ מקצועיות ובערוץ הסלאק בעבודה.
שיהיה סופשבוע שקט,
אמיתי