מאחורי הקלעים של ננו בננה
וגם - רשמים ראשונים מווייקס וייב, חידושים בפיגמה, סלאק ועוד מלאאא עדכונים
שנה טובה! כאן אמיתי בונה עם הניוזלטר השבועי על AI ופרודוקטיביות.
השבוע בתוכנית:
מה למדתי מהשיחה עם הישראלי שהוביל את הפיתוח של Nano Banana ו-VEO3 בגוגל העולמית?
הכירו את Wix Vibe - הטוב משני העולמות
סוף סוף בשורה אמיתית בתחום עיצוב המוצר: פיגמה משיקה את Prompt to Edit
האייג׳נט החדש של Slack (ולמה אני עדיין לא מתהלב ממנו)
איך הפכתי להיות Voice First
עוד עדכונים מעניינים מהשבוע.
אם המייל חתוך בסוף או לא מוצג טוב, ממליץ לעבור לגרסת הדפדפן בקישור הזה.
מה למדתי מהשיחה עם הישראלי שהוביל את הפיתוח של Nano Banana ו-VEO3 בגוגל העולמית?
(ועוד כמה טיפים פרקטיים שלא תמצאו בשום מקום אחר)
ידעתם שמי שמוביל את קבוצת המוצר שמפתחת את מודלי התמונות והוידאו החדשים של גוגל הוא ישראלי?
בשבוע שעבר קיבלתי הזדמנות נדירה להשתתף בשיחה אינטימית עם David Sharon , שמוביל את תחום ה-multimodal generation באפליקציית Gemini ונמצא במשרדי Google בסיליקון ואלי,
ועם Yael Karov אחת החוקרות הבכירות בצוות, שתרמה לפריצות דרך המשמעותיות בתחום מהתקופה האחרונה.
היה מפגש מרתק ומעשיר שנתן הצצה למאחורי הקלעים של תהליך הפיתוח - וגם לא מעט טיפים פרקטיים.
הנה כמה דברים שלמדתי:אחד הגורמים המרכזיים שהובילו לפריצת הדרך במודל החדש וההצלחה שלו ומה שמבדל אותו ממודלים אחרים הוא היכולת לשמור על תווי הפנים מאד עקביים.
מהדאטה שהם אספו וממחקרי משתמשים הם הבינו שזו פונקציה קריטית להצלחה - בסוף המשתמשים רוצים לייצר גרסאות אמיתיות של עצמם כדי לשתף עם חברים ולא איזה אח תאום שהוא דומה אבל לא בדיוק.תחום נוסף שהם משקיעים בו הוא היכולת לזהות את התמונות שנוצרו במודל - כדי למנוע שימוש לא אחראי כמו הונאות ופייק ניוז.
הבעיה עם פתרון של סימן מים, כמו שקיים ברוב הכלים, היא שאפשר לערוך את התמונה ולהוציא אותו מאד בקלות,
ולכן גוגל פיתחה טכנולוגיה בשם SynthID - סימן מים בלתי נראה שמוטמע בכל תמונה או וידאו שנוצרו ב-Gemini ונשאר גם אחרי העריכות.
הנתון שהרשים אותי במיוחד הוא שעד היום לא ידוע להם אפילו על מקרה אחד בו הצליחו לעקוף את המנגנון הזה.
כרגע היכולת לבדוק תמונות זמינה לבודקים מהימנים (בעיקר חוקרים מהאקדמיה) אבל הם כבר בפיילוט מול גורמים נוספים ובהמשך הם מתכננים להנגיש אותו גם למשתמשים כדי שנוכל לבדוק בעצמנו.כמה טיפים פרקטיים לגבי עבודה נכונה עם המודל:
- לקבלת תוצאות אידיאליות מומלץ לכתוב פרומפטים יחסית ארוכים, מפורטים וכמה שיותר ספיציפיים - כולל התייחסות לקומפוזיציה ולסגנון. הדאטה שלהם מראה שפרומפטים קצרים של פחות מ-10 מילים נותנים תוצאות פחות טובות.
- כשמצרפים תמונות רפרנס, ה Sweet Spot הוא 2-3 תמונות. כמות גדולה יותר של תמונות תתחיל לפגוע באיכות.
- בטוויטר יש הרבה אינפלואנסרים שממליצים לכתוב את הפרומפטים בפורמט JSON - לפי הבדיקות שלהם אין לזה יתרון אמיתי. כנראה שזה עובד רק כי זה מאלץ את המשתמש להיות מפורט יותר.
- המודל עובד יותר טוב עם פרומפטים באנגלית מעברית. אם אתם רוצים לכתוב בעברית תוסיפו בפרומפט שלפני שהוא מייצר שיתרגם לאנגלית.
- כדי להבטיח שהתוצאה תישמר ברזולוציה מיטבית, ,תקפידו להשתמש בכפתור Download הייעודי באפליקציה. אם שומרים את התמונה דרך כפתור הSave של הטלפון או המחשב לפעמים מתקבלת תמונה באיכות נמוכה יותר.
מעבר למפגש עצמו, היה כיף להכיר יוצרי תוכן מובילים מפלטפורמות אחרות ולקבל אירוח מפנק כמו שגוגל יודעת.
תודה רבה ל Anat Paz Eliran Levy Hamutal Rozen מגוגל על ההזמנה!
ועוד משהו קטן לסיום: כדי לעשות לכם חיים קלים, יצרתי Gem שמאפשר לכם לשלוח לו את הפרומפט שלכם (גם בעברית) ולקבל פרומפט משודרג לפי ההמלצות האלה וגם ההמלצות בבלוג הרשמי של גוגל. החלק המגניב פה זה שGem חי בתוך Gemini ואתם לא צריכים לצאת מהצ׳אט כדי להשתמש בו.
הוא עדיין בשלבי בדיקות, אבל אתם רוצים לנסות אותו ראשונים ולתת לי פידבק תכתבו לי בתגובות ואשלח לכם בפרטי.
הכירו את Wix Vibe - הטוב משני העולמות
בזמן שכולנו התעסקנו ברכישה המתוקשרת של Base44,
מסתבר שבWIX בישלו בשקט בשקט משהו לא פחות מעניין 🤔
זה כבר ברור לכולם שבעידן הנוכחי לבנות אתרים בממשק של Drag & Drop זה נחלת העבר,
אבל מצד שני - גם לבנות אתר רציני ומקצועי ב-Vibe Coding זו לא משימה פשוטה בכלל.
אם יצא לכם לנסות לבנות בכלים כמו Lovable ובייס אתר עם מערכת ניהול, אבטחה, וCMS - בטח גיליתם שזה לוקח המון זמן וקרדיטים, וגם כרוך בסיכוני אבטחת מידע שצריך להכיר, לא אופטימלי מבחינת -SEO,
ובת׳כלס - פשוט אין הגיון בלבנות מערכת ניהול לכל אתר מ-0.
ופה בדיוק נכנס לתמונה המוצר החדש והמסקרן שלהם, עם השם המתבקש: Wix Vibe - שבא לגשר על הפער בין שני העולמות האלה.
איך זה עובד?
את האתר אתם בונים בממשק Vibe Coding, נהנים מהיתרונות של המהירות והעיצוב היפה, אבל מאחורי הקלעים כל מה שבניתם מתחבר למערכות של Wix כמו CMS, יכולות SEO, יכולות שליחת אימיילים ועוד.
בנוסף לעריכה באמצעות הצ׳אט, הוא מאפשר גם לבצע עריכה ויזואלית של כל הטקסטים באתר, שליטה בפלטת הצבעים, ואפילו מחיקה של חלקים שלמים מבלי לכתוב פרומפטים -
זה עדיין לא השילוב המושלם בין Vibe Coding לעריכה ידנית וDrag & Drop - אבל זה הכי קרוב שראיתי.
בגלל שהייתי קצת סקפטי הייתי חייב לנסות בעצמי,
והאמת? הופתעתי לטובה.
תוך שלוש שעות הצלחתי להרים לעצמי אתר שנראה לא רע בכלל. כך זה נראה:
יש לי עוד עבודה על התוכן וכמה דברים שאני רוצה לבדוק (כולל תמיכה בעברית שבכלל לא ניסיתי), אבל יצא כל כך טוב שאני אשכרה שוקל להפוך אותו לאתר שלי.
חשוב להגיד - כמו בכל כלי Vibe Coding זה לא הלך חלק לגמרי ונתקלתי בלא מעט בעיות ובאגים תוך כדי העבודה - אבל אני בטוח שזה ילך וישתפר,
וכבר עכשיו אין מה להשוות את החוויה הזו לחוויה של בניית אתר בבילדר הרגיל של WIX או של כל מערכת אחרת.
מה שהכי הרשים אותי זה שהוא הצליח להבין לבד איך לחבר את החלקים השונים באתר שלי ל-Backend של Wix ולהכניס אותם לתוך הCMS,
וכשחקרתי קצת - גילית שיש לזה סיבה טובה.
המוצר הזה מבוסס על מוצר קיים שהם עובדים עליו כבר כמה שנים שמאפשר למפתחים לכתוב את הקליינט שלהם על הבקנד של Wix
בקיצור, מבלי לתכנן - הם בנו את התשתית הכי טובה שיכולה להיות למוצר כזה - ועכשיו קוטפים את הפירות.
לסיכום - אני ממש התלהבתי, ולדעתי כך יראה העתיד של בניית אתרים בטווח הקרוב.
למה לטווח הקרוב? כי בעוד כמה שנים יש גם תסריט בו כמעט ולא נצטרך אתרים עם ממשקי משתמש, אבל זה כבר דיון לפוסט אחר…
אגב, למקרה שתהיתם - את הפוסט כתבתי על דעת עצמי וזה לא שת״פ או משהו כזה. נחשפתי ל Wix Vibe במקרה והחלטתי לנסות אותו כי אני באמת מחפש פתרון לבניית אתר לעצמי. אני מניח שהסיבה שעדיין לא שמענו עליו זה שהוא עדיין בבטא.
אז איך משתמשים?
נכון לעכשיו אתם יכולים להיכנס לאתר שלהם ולעצב לעצמכם את האתר לגמרי בחינם כולל דומיין שלהם - בדיוק כמו שבונים אתר רגיל בWix (אני מניח שיש מגבלת קרדיטים יומית מסויימת, אבל אני לא הגעתי אליה ועבדתי עליו כמה שעות)
ברגע שתרצו לחבר דומיין ולהשתמש בשירותי פרימיום, אז כן צריך לשדרג כמו על אתר רגיל ב-Wix.
סוף סוף בשורה אמיתית בתחום עיצוב המוצר: פיגמה משיקה את Prompt to Edit
למרות שיש הרבה כלים שיודעים להפוך עיצוב לקוד -
בתחום של Text to design עד עכשיו היו רק כלים שעשו בערך, ליד, כמעט וזה אף פעם לא באמת התחבר.
אז הנה סוף סוף הפתרון שבאמת חיכינו לו -
פיגמה משיקה בקרוב את Prompt to Edit - עריכת עיצובים באמצעות טקסט חופשי בתוך פיגמה!
כרגע הם פותחים את זה באלפא ללקוחות נבחרים, ובקרוב לכולם - אפשר להירשם לאלפא כאן.
סוף סוף Slack יוצאים עם הפיצ'ר שהם היו צריכים להוציא כבר לפני שנה - Agent שעונה על שאלות מתוך היסטוריית הצ'אטים ומחובר למסמכים ארגוניים.
כשאני מגיע לחברות לסדנאות ולהאקתונים ומדברים על איזה אייג'נטים לבנות - כמעט תמיד עולה הרעיון של בניית אייג'נט שחי בתוך הסלאק ופותר בעיות של Data Silos,
ובצדק - בסטארטאפים וחברות טק הכל קורה בסלאק, והרבה מהזמן של העובדים מתבזבז רק על להישאר מעודכנים ולחפש שם מידע.
אז הפיצ'ר החדש "Channel Expert" עושה בדיוק את זה - הוא יודע לגשת להיסטוריה של הערוץ, למאגרי מידע שהוגדרו לו - ולענות על שאלות, ממש כמו עובד דיגיטלי. כך זה נראה:
אני חושב שזה בדיוק הכיוון המתבקש ש-Slack (שבבעלות Salesforce) צריכה ללכת אליו.
בגלל שגם כך כולם נמצאים שם, סלאק היא המקום הטבעי והמתבקש ל אייג'נטים כאלה, ואם הייתי בנעליים שלהם לגמרי הייתי עושה דאבל דאון על זה.
אבל - למרות שהיכולת הזו היא בהחלט צעד בכיוון הנכון, אני לא בטוח שהפתרון הנוכחי שהם מציעים הוא הפתרון שארגונים יאמצו - מכמה סיבות:
המחיר - נכון לעכשיו הפיצ'ר הזה זמין רק למי שרוכש את חבילת AgentForce for Slack נמצאת בבנדל עם Agentforce בעלות של 125 דולר לחודש לכל משתמש, או בתמחור לפי שימוש של 2 דולר (!) לשיחה.
זה מחיר מאד גבוה, ואני לא חושב שרוב החברות יאמצו את זה, בטח שהם יכולים לבנות משהו כזה לבד. מקווה שהם מבינים את זה ועובדים על תמחור הגיוני יותר.
ערוץ אחד זה לא מספיק - סיכום של ערוץ אחד זו התחלה טובה, אבל הפתרון שהמשתמשים באמת צריכים הוא אייג'נט שירוץ על כל סלאק, או יותר נכון על כל הערוצים שיש לי הרשאות אליהם. אחד הכאבים הגדולים הוא לא רק למצוא מה נאמר בערוץ מסויים, אלא בכלל להבין באיזה ערוץ זה נאמר.
הוא עדיין פסיבי - מה שיהפוך את האייג'נט הזה לשימושי באמת יהיה להפוך אותו לפרואקטיבי. במקום שאצטרך לשאול אותו שאלות, שיאזין לשיחה ויציע בעצמו תשובות לשאלות שנשאלו שם, על סמך מידע מערוצים אחרים או ממערכות נוספות.
לסיכום - אני מניח שהדברים האלה נמצאים ברודמאפ שלהם,
אבל בינתיים צוותים לא מחכים להם ובונים לעצמם אייג'נטים Tailor Made עם כלים n8n במחירים הרבה הרבה יותר נוחים.
אם Salesforce לא תוריד מחירים ותעשה דאבל דאון על אימוץ של הפיצ' רים האלה, היא עלולה לפספס את הרכבת.
המעבר לעבוד ב-Voice First - זה אחד הדברים הכי טובים שעשיתי לעצמי.
בחודשים האחרונים השתנה משהו משמעותי בדרך בה אני עובד: אני הרבה פחות מקליד והרבה יותר מדבר למחשב.
זה התחיל בעיקר סביב וייב קודינג,
אבל לאט לאט התפשט גם לשיחות עם הצ׳אט, לאימיילים, למענה להודעות בלינקדאין ובווטסאפ, ולפעמים גם לכתיבה של טקסטים ארוכים.
רק כשהתחלתי לעבוד כך בצורה אינטנסיבית הבנתי כמה אני מדבר יותר מהר ממה שאני מקליד (ואני מקליד עיוור וממש ממש מהר).
זה נוח במיוחד בכל מה שקשור לעבודה עם מול צ׳אטים וLLMs -
כי החיסרון המכרזי בדיבור לעומת כתיבה הוא שיותר קשה להתנסח בצורה רהוטה - ובמקרה של עבודה עם הצ׳אטים זה פחות העניין כי הם יבינו אותנו בכל מקרה.
הקפיצה הגדולה היתה לפני חצי שנה בערך כשהתחלתי להשתמש באפליקציית מק בשםWhisper Flow .
לפני זה ניסיתי כל מיני פתרונות - אבל מה שמיוחד בWhipser ועשה את ההבדל בשבילי זה שהיא לא רק שהיא מתמללת - אלא גם מתקנת שגיאות, מסדרת פסקאות, מוסיפה סימני פיסוק במקומות הנכונים ובכללי כמעט תמיד קולעת בול גם בעברית וגם באנגלית.
בקיצור -ממליץ בחום, וגם בגרסה החינמית זה לגמרי שימושי (את הגרסה בתשלום אפשר לקבל בBundle שלי Lenny )
הקפיצה השניה הייתה כשהתחלתי להשתמש ב-Voice גם במובייל.
לפני כמה חודשים כשהצטרף אלינו עוד תינוק למשפחה,
מצאתי את עצמי שעות ארוכות עם תינוק בידיים / ישן עלי או פשוט בסוף היום מעוך על הספה עם הטלפון ורציתי לנצל זמנים מתים כדי להיות פרודקטיבי מהטלפון במקום לעשות Doom Scrolling.
חשוב לציין של- Whisperflow יש גם אפליקציית מובייל - אבל לצערי היא רק לאייפון ואני באנדרואיד (לא לשפוט) ולכן לצערי זו לא היתה אופציה.
אז אחרי לא מעט חיפושים מצאתי פתרון לאנדרואיד: המקלדת מובייל של מיקרוסופט SwiftKey הוסיפה לאחרונה פיצ’ר של Speech to text שעובד לא רע בכלל גם בעברית.
עוד הרגל חדש שהכנסתי ומאד עוזר לי: פשוט להקליט הכל.
מעבר לשימוש ב-Notetaker, אני מקליט פגישות פרונטליות (באישור כמובן), הרצאות, או רעיונות שעולים בדרך. לרוב אני מקליט באפליקציית הקלטה של הטלפון ואז שולח ל-Gemini שיתמלל.
אגב, ניסיתי כמה פעמים להשתמש במצב השיחה הקולי של ChatGPT לצרכי עבודה ולרמות ששמעתי שיש אנשים שממש עושים איתו שיחות עומק, אני חייב להודות שבינתיים זה פחות תפס אצלי - אבל אמשיך לנסות כי אני לגמרי רואה את הפוטנציאל.
עוד עדכונים מהשבוע שלא הספקתי לכתוב עליהם:
הדפדפן Comet של Perplexity נפתח לכולם -אפשר להוריד בקישור הזה. בנוסף הם משיקים עוזר אישי לאימייל שנראה מבטיח.
OpenAI משיקים פיצ׳ר חדש בשם ChatGPT Pulse שמאפשר לקבל עדכון יומי על נושאים שמעניינים אתכם - לפי מה שהצ׳אט יודע עליכם. אני עדיין לא קיבלתי גישה אז אעדכן לגבי זה בהמשך.
בנוסף, חברת OpenAI הוסיפה יכולת חדשה ומאד שימושית - שיתוף פרויקטים.
אתם יכולים להזמין את חברי הצוות לפרויקט משותף, להוסיף קבצים והנחיות, וביחד "לאמן" את ה-AI להבין את המטרות שלכם ולספק תשובות עקביות ובאותו הטון לכולם. כל המידע והקבצים נשארים נעולים בתוך הפרויקט הספציפי (project-only memory), מה שמבטיח שמידע רגיש לא "זולג" החוצה.
בשלב הראשון הפיצ'ר זמין למשתמשי התכניות העסקיות והחינוכיות (Business, Enterprise, Edu), אבל ב-OpenAI מבטיחים שהוא יגיע בקרוב גם למשתמשי הפרטיים והחינמיים.
גוגל השיקה את Chrome DevTools MCP Server שמאפשר לצ׳אט ולאייג׳נטים להתממשק ישירות אליו ולהשתמש בכלי המפתחים של כרום כדי לבדוק ביצועים, לנתח בקשות רשת ולקרוא לוגים כדי למצוא ולתקן באגים בצורה מדויקת.
מיקרוסופט קופיילוט מוסיפה אפשרות לבחור בין המודלים של OpenAI ואנתרופיק (קלוד) בתוך קופיילוט 365. כרגע אפשר לבחור בקלוד רק במצב Researcher ובCopilot Studio לבניית אייג׳טנים ובהמשך הוא צפוי להגיע גם לצ׳אט הרגיל ולאפליקציות Office 365.
קורסים וסדנאות קרובים:
בעקבות הביקוש פתחנו סדנת AI Agents עם n8n נוספת פרונטלית בחודש נובמבר אפשר להירשם כאן.
הפינה האמנותית: כך תזהו אם חבר שלכם במשרד הוא בעצם AI
עד כן להיום!
למצטרפים החדשים, אני מזכיר שתוכלו לקרוא את כל המהדורות הקודמות שפספסתם בבלוג.
כרגיל - אני מזמין אתכם לשתף עם חברים ועם אנשים שהתוכן הזה יכול לעניין אותם.
מוזמנים גם לשתף בקבוצות ווטסאפ מקצועיות ובערוץ הסלאק בעבודה.
שיהיה סופשבוע שקט,
אמיתי