הג׳יפיטי מומנט של הוידאו
כל מה שאתם צריכים לדעת על מודל הוידאו החדש של גוגל וגם: איך מגדירים אייג׳נט, ועוד עדכונים
אהלן, כאן אמיתי בונה עם הניוזלטר השבועי על AI ופרודוקטיביות.
השבוע בתוכנית:
כל מה שאתם צריכים לדעת על VEO 3 + מדריך איך לנסות אותו בעצמכם.
מעבר לBuzzwords: איך מגדירים מה זה AI Agent.
איך מטמיעים שימוש חכם בכלי AI בחברה עם מאות מנהלי מוצר?
עוד עדכונים והשקות.
השקות של כלי AI כבר הפכו לשגרה, וקשה להתרגש כמו פעם.
אבל מדי פעם מגיעה קפיצת מדרגה אמיתית - כזו שמשנה את כללי המשחק.
כשהושק מודל FLUX, הרגשנו את זה בתחום התמונות: בפעם הראשונה היה אפשר לייצר בקלות תמונות שנראות אמיתיות לגמרי.
והשבוע? גוגל עשו את זה שוב - הפעם בתחום הווידאו.
עוד מוקדם להבין את מלוא ההשפעה, אבל אחרי שצפיתי בעשרות סרטונים, ברור לי שמשהו גדול קורה כאן - ותעשיות כמו פרסום וקולנוע עומדות להשתנות מהיסוד בשנים הקרובות.
אבל במקום להסביר במילים - הנה כמה מהסרטונים הכי מרשימים שראיתי השבוע:
רוצים לנסות בעצמכם?
הנה כל מה שאתם צריכים לדעת:
רשמית, השירות זמין רק בארה״ב, אבל יש דרך להשתמש בו גם מישראל. בגדול אתם צריכים שני דברים: מנוי פרו / אולטה וחיבור VPN (כדי לשנות את המיקום שלכם לארה״ב).
מנוי פרו עולה 20 דולר, אבל אם עדיין לא נרשמתם אתם יכולים לקבל חודש ראשון בחינם.
טיפ של אלופים: אם עדיין לא נרשמתם, בקשו ממישהו שכן נרשם שיוציא לכם קוד Referral ואז במקום חודש חינם תקבלו 4 חודשים ראשונים בחינם.
כדי לעשות את זה צריכים ללחוץ על כפתור ״Invite a Friend״ בפינה הימינית למעלה:
ואז מקבלים קישור שאפשר לשלוח:
אז איך משתמשים?
אחרי ששידרגתם והפעלתם VPN תוכלו לייצר סרטונים באורך של 8 שניות - בתוך הצ׳אט הרגיל של Gemini, פשוט בחור בלשונית “Video” וכתבו את הפרומפט שלכם
הנה כמה טיפים מההתנסות שלי עד עכשיו:
הפרומפטים ב-VEO שונים מאד מכלי וידאו אחרים – הם דורשים הרבה יותר תכנון מוקדם. בגלל שניתן לשלב גם אודיו ודיבור, אתם צריכים לחשוב כמו במאים: לתכנן כל סצנה של 8 שניות מראש, כולל סדר האירועים, מי מדבר, מתי, ואיזו מוזיקה מתנגנת ברקע.
שילוב עם Gemini עוזר מאוד – הצ׳אט של Gemini מצוין גם בלנסח פרומפטים ל-VEO. לפני שמתחילים לייצר סרטון, שווה להריץ איתו סשן קצר כדי להגיע לגרסה הכי מדויקת של הפרומפט.
מגבלות – בגרסת ה-$20 יש הגבלה ל-10 סרטונים בכל 24 שעות. זה מעט מאוד, במיוחד אם אתם בתהליך ניסוי וטעייה. לכן חשוב לתכנן היטב את כל פרומפט מראש.
מי שמכוון ליצירת תוכן רצינית – כנראה יצטרך לשדרג לגרסת Ultra שעולה $250 (או $125 לחודש הראשון בהנחה זמנית). אחרת פשוט נתקעים.
אגב, למשתמשים בארה״ב יש גישה ל-Flow, ממשק נוח יותר ליצירת וידאו עם יכולות נוספות כמו Image to video. נקווה שיגיע גם לישראל בקרוב.
אפשר לייצר דיבוב גם בעברית -והתוצאה נשמעת לא רעה בכלל. עדיין יש לא מעט שיבושים מצחיקים, אז זה דורש הרבה ניסוי וטעייה. אבל ראיתי כבר תוצרים מרשימים.
טיפ חשוב לעברית – אי אפשר להזין טקסט ישירות בעברית. צריך להגיד למודל משהו כמו: “a man saying in Hebrew that…” ורק אז הוא יתרגם וידבב.
הנה שני ניסויים שאני עשיתי:
1.פרסומת ל-VEO עם VEO (לא סיימתי כי נגמרו לי הקרדיטים)
2. ניסיון בעברית - סרטון ״טסטימוניאלס״ :
אגב, את שני הסרטונים האלה יצרתי וערכתי מהטלפון וכל אחד לקח פחות מחצי שעה - איזו תקופה מטורפת!
לסיום - עם כל ההתפעלות מהיכולות האלה חשוב להגיד שיש פה גם לא מאט סכנות.
אנחנו נמצאים באחד המצבים בהם הטכנולוגיה הקדימה את הרגולציה ונכון להיום אין מנגנוני זיהוי מובנים ברשתות החברתיות - מה שמאפשר לאנשים לנצל את היכלות הזו להונאות ומניפולציות.
כצרכנים של תוכן - יותר מתמיד הכרחי להטיל ספק בסרטונים שאנחנו רואים ולהפעיל חשיבה ביקורתית.
אז איך בכלל מגדירים AI Agent?
המושג AI Agents הפך לבאזוורד הכי חם בעולם ה-AI ב-2025 וכולם משתמשים בו,
אבל האם עצרתם פעם לשאול אתם עצמכם - מה זה אומר בעצם?
כבר תקופה שאני מחפש אחרי הגדרה ברורה למה הופך מוצר ל-AI Agent,
אבל ככל שהעמקתי בנושא - הבנתי שזה מאד תלוי את מי שואלים ואין קונצנזוס רחב בנושא.
הנקודה שהכי הבהירה לי את עומק הבלבול - היתה כשצפיתי בפרק האחרון בפודקאסט של a16z שנקרא ״What is an ai agent״,
בו שלושה משקיעי הון סיכון מאחת הקרנות המובילות בעולם מנהלים דיון אינטליגנטי ומעמיק על השאלה הזו - ועדיין לא מצליחים להגיע להגדרה ברורה:
המסקנה? הדרך הכי טובה לחשוב על AI Agents היא כספקטרום,
אבל הבעיה שהוא כל כך רחב, שכבר אין למילה הזו משמעות בלי להסביר מה המערכת עושה בפועל.
לצורך ההמחשה - הנה שלוש רמות של מוצרים שכולם יכולים להיקרא אייג׳נטים:
1️⃣ רמה ראשונה: LLM + וורקפלו
לוקחים מודל שפה ומחברים אותו לסדרת פעולות באמצעות כלים.
דוגמה - אוטומציה ליצירת תוכן: וורקפלו כמו Make שלוקח נושא מתך טבלה ב-Google Sheet > שולח אותו ל-LLM שמחובר לאינטרנט > כותב טיוטת פוסט ואז שומר אותה בגוגל דרייב.
הרמה הזו נכללת בהרבה הגדרות כ-Agent, אבל בפועל מדובר באוטמציה פשוטה בתוספת יכולות LLM.
2️⃣ רמה שנייה: מערכת עם יכולת Reasoning ושימוש בכלים
כאן ה-LLM כבר מסוגל להבין את המשימה, לפרק אותה וגם להפעיל כלים דרך API או MCP כדי לבצע פעולות שונות.
דוגמה - צ׳אטבוט שירות לקוחות שמחובר למאגרי המידע של החברה ויכול להבין את שאלת המשתמש, לחפש במאגרי מידע, ואם צריך לבצע פעולות כמו לפתוח קריאת שירות ב-Jira, להעביר לנציג אנושי, וכו׳.
עוד דוגמה לאייג׳נטים מהסוג הזה היא כלים לכתיבת קוד כמו Cursor ו-Windsurf.
3️⃣ רמה שלישית: סוכנים אוטונומיים
זה החזון הגדול - מערכות שיכולות לקבל מטרה כללית בלי הוראות ברורות, לתכנן אסטרטגיה, לבצע פעולות מורכבת כמו גלישה בדפדפן באופן עצמאי, לייצר לעצמן כלים חדשים ולהבין לבד מה צריך לעשות בכל שלב.
הדוגמאות הכי קרובות למערכות כאלה הן Genspark, Manus ו-Operator של OpenAI - אבל בגדול אנחנו עוד בתחילת הדרך ויש להן עוד הרבה לאן להתקדם עד שיהיו באמת שימושיות.
זו כמובן חלוקה מאד גסה ואפשר למצוא קטגוריות, אבל המטרה היתה להראות את הקצוות של הספקטרום.
דרך נוספת ומאד אפקטיבית לדעתי להגדיר AI Agents - היא לפי היכולות שיש להם:
שימוש ב-Reasoning - האם המערכת רק עוקבת אחר הוראות או שהיא “חושבת” ובוחרת דרכי פעולה?
יכולת תכנון - האם היא יכולה לפרק מטרה גדולה לתתי משימות ולתכנן את סדר הביצוע?
שימוש בכלים - האם היא יכולה להפעיל APIs, לחפש באינטרנט, לגשת לקבצים, להריץ קוד? אילו כלים ובאיזו רמת מורכבות?
חיבור למידע - האם יש לה גישה לדאטה ממערכות אחרות בזמן אמת?
זיכרון - האם יש לה יכולת לזכור אינטראקציות קודמות ולהשתמש במידע הזה?
יכולת למידה - האם היא יכולה ללמוד מתוצאות הפעולות שלה כדי לשפר את הביצועים בעתיד?
פרואקטיביות -האם היא יכולה לפעול באופן פרואקטיבי על בסיס טריגרים אוטומטיים?
לסיכום: בפעם הבאה שאתם נתקלים במוצר או במערכת שמגדירה את עצמה כ-AI Agent - נסו לראות מעבר לבאזזוורד ולהבין איפה היא ממוקמת על הספקטרום הזה, ואיזה יכולות באמת קיימות בה.
איך מטמיעים שימוש חכם בכלי AI בחברה עם מאות מנהלי מוצר?
תלמדו מגילדת המוצר ב-Wix
כבר יצא לי להעביר סדנאות AI ללא מעט צוותי פרודקט, אבל השבוע ב-Wix זו הייתה חוויה אחרת לגמרי.
הוזמנתי להעביר סדנה לקבוצת ה-AI Multipliers, קבוצה פנימית שהקימה גילדת הפרודקט של וויקס - שהם כבר power users של כלי AI ומובילים בעצמם את ההטמעה בארגון.
המטרה היתה לפתוח את הראש לשימושים חדשים, וגם לפצח ביחד איך מעבירים את הידע העצום שהיה בחדר הזה הלאה ל-250 מנהלי ומנהלות מוצר נוספים בחברה.
אז מה היה שונה הפעם?
ברוב הסדנאות אני בא כד ללמד על היכולות של הכלים השונים וה Workflows ובעיקר להראות איך הם משתלבים בתהליכי העבודה הקיימים.
אבל אתמול, לא הייתי צריך “לשכנע” אף אחד.
כולם כבר היו שם, מכירים את הכלים וכבר משתמשים בהם בעבודה - וזה שינה את כל הדינמיקה.
אז מעבר לעובדה שהיה מאד כיף להיות מוקף באנשים כמוני,
מכורי AI אנונימיים שעושים וייב קודינג ב 2 בלילה עם עיניים אדומות ולא נרגעים עד שלא ניסו את כל מה שיצא בהכזרה האחרונה של גוגל - זה גם איפשר לנו לקחת את הסדנה לרמה הבאה.
רצתי על המצגת במהירות x5 ואז דילגנו ישר ליוס קייסים הכי מתקדמים, ולניואנסים שעושים את ההבדל.
דיברנו על השימושים המאד מעניינים שהם כבר עושים בכלים האלה בצוותים שלהם,
וגם צללנו לאתגרים שלרוב צפים רק אחרי שמשתמשים בכלים האלה באופן אינטנסיבי במשך תקופה, כמו למשל:
איך שומרים על סטנדרטים ואיכות תוצרים גבוהה שעובדים AI first?
איך בונים תהליך שיטתי של בדיקה, תיקוף ועריכה לתוצרים של AI?
איך משתמשים בכלי AI מבלי לפגוע ביצירתיות ונמנעים מה-Bias של הפתרונות שה-AI מציע
איך ייראו תהליכי העבודה בעוד שנה מהיום, ואילו יכולות מנהלי מוצר צריכים להתחיל ללמוד כבר עכשיו כדי להיות מוכנים אליהם?
אז נכון, אלו שאלות מורכבות ולא לכולן יש פתרונות קסם,
אבל עצם העיסוק בהן הוא צעד חשוב שעוזר לקחת את היישום וההטמעה של תרבות AI First בחברה לרמה הבאה.
המסקנה שלי מהסדנה: כל ארגון גדול שרוצה להוביל שינוי כזה, צריך לבנות לעצמו קבוצה פנימית של Multipliers כמו ב-Wix, זה פשוט מכפיל כוח מטורף ומעיף את כל הארגון קדימה.
תודה לגילדת המוצר של -Wix ול Keren Neuman ול Gili Givon על ההזמנה ועל הפתיחות, היה פשוט מרתק!
סיכום חדשות נוספות מהטוויטר:
Anthropic הוסיפה מצב קולי ל- Claude באפליקציה, עם חמישה קולות שונים לאינטראקציה ותמלול בזמן אמת.
ElevenLabs הציגה טכנולוגיה המאפשרת לדבר עם סוכני AI באמצעות קול וטקסט בו-זמנית.
DeepSeek משחרר מודל R1-0528: DeepSeek-R1-0528 משפר את ביצועי המודל הקודם, מפחית הזיות ותומך בפלט JSON וקריאות לפונקציות.
Opera הציגה את Opera Neon, דפדפן AI חדש שיכול לגלוש איתך או עבורך, לבצע פעולות ולסייע במשימות. הדפדפן כולל תמיכה בזיכרון מתמשך, הבנת מסמכים וציטוטים.
Perplexity משיקה את Perplexity Labs המאפשר לבצע משימות מורכבות כמו יצירת דוחות אנליטיים, מצגות ולוחות מחוונים דינמיים, עם נגישות לכלים כמו קידוד וגלישה.
מאנוס משיקים את Manus Slides, כלי ליצירת מצגות.
חברת Black Forest Labs משיקה את FLUX 1 Kontext, מודל לעריכה של תמונות קיימות תוך שמירה על עקביות בדומיות ודיוק גבוהה. זמין דרך Freepik, Fal, Leonardo ואפשר לנסות אותו גם בPlayground שלהם.
מחקר מגוגל מראה שמערכות RAG (Retrieval-Augmented Generation) שבירות יותר ממה שחשבנו, אפילו כשמסופק הקשר מספק.
תפיסת עתיד מבוסס-זיכרון: מאמר חדש מציע “אימון זיכרון” כחזית הבאה מעבר לאימון מקדים (pretraining) ואימון מדויק (fine-tuning), מאפשר למודלים ללמוד באופן רציף.
בפינה האמנותית (לא שהיה חסר השבוע):
אודי כגן ממשיך להיות גאון עם איה פלוטו והזחל הרעב.
עד כן להיום!
למצטרפים החדשים, אני מזכיר שתוכלו לקרוא את כל המהדורות הקודמות שפספסתם בבלוג.
כרגיל - אני מזמין אתכם לשתף עם חברים ועם אנשים שהתוכן הזה יכול לעניין אותם.
מוזמנים גם לשתף בקבוצות ווטסאפ מקצועיות ובערוץ הסלאק בעבודה.
שיהיה סופשבוע שקט,
אמיתי
הפרסומות בוידאו ממש ממש מרשים וממש ממש מפחיד. מקווה שיהיה לנו עתיד טוב.