עושים סדר בשבוע עמוס בהכרזות
וגם: התרשמות ראשונה מסורה, הקנבס החדש, המוצר שיהפוך פידבק לתובנות מוצריות ועוד עדכונים.
אהלן חברים,
וואו איזה שבוע! אני עוקב אחרי החדשות כבר מעל שנתיים ושבוע כזה עוד לא זכור לי.
השבוע בתוכנית:
התרשמות ראשונה מ-Sora ואיך לקבל גישה.
גוגל מכריזה על Gemini Flash 2.0 ושורה של עדכונים נוספים - כל מה שחשוב לדעת.
פיצ’ר ה-Canvas ב-ChatGPT משתדרג וזמין גם בגרסה החינמית.
הכירו את Kraftful - הכלי שיהפוך הרים של פידבק מלקוחות לתובנות מוצריות.
עוד עדכונים מהשבוע.
רגע לפני שצוללים - עדכון אישי:
השבוע אחרי 3 שנים סיימתי את התפקיד כמנהל מוצר ב-VOOM ויצאתי לדרך חדשה, כתבתי על זה בפוסט בלינקדאין.
סוף סוף: OpenAI השיקו את Sora – מודל הווידאו שלהם 📽️
הנה הדמו הרשמי שמדגים את המוצר והיכולות שלו:
האם הוא עמד בציפיות? התגובות מעורבות.
מצד אחד, יש הרבה אכזבה – ובצדק. אחרי כמעט שנה של המתנה, וציפיות גבוהות בעקבות ההייפ שהם יצרו סביב המוצר הזה, ההשקה הזו לא בדיוק סיפקה את "אפקט הוואו" שחיכינו לו.
בנוסף, יש קשיים טכניים: גם שלושה ימים אחרי ההשקה, עדיין קשה להירשם לאתר שלהם, ככל הנראה בגלל פתיחה וסגירה לסירוגין של ההרשמה במטרה למנוע עומס.
אבל אם נשים רגע בצד את האכזבה, איך הוא באמת?
אז מהדוגמאות הראשונות שראיתי, היה נראה שהוא מביא תוצאות מרשימות, אבל לא טובות יותר ממתחרים כמו Runway ו-Minimax שגם מגיעים לרמה גבוהה מאד.
כשקיבלתי גישה בעצמי ונכנסתי לפיד שלהם (שהוא גם פיצ’ר מעולה בפני עצמו), כן גיליתי לא מעט דוגמאות שממש הצליחו להרשים אותי.
המסקנה שלי כרגע?
Sora הוא כלי מרשים עם יכולות גבוהות, אבל כדי להפיק ממנו את המקסימום, צריך להתמקצע בו.
התוצאות הכי מרשימות שראיתי עד עכשיו היו בפרויקטים מסוג Video-to-Video כמו הוידאו הזה.
ייחודיות נוספת שלו היא פיצ’ר הStoryboard שמאפשר לתכנן עלילה ולחבר בין קטעים כדי ליצור מהם סיפור לפי תסריט. חשוב להגיד שגם זו יכולת שדיי מורכב להשתמש בה ומצריכה תכנון והתמקצעות או ניסיון קודם בתחום הוידאו. הנה סרטון באורך 4 דקות שנוצר כולו באמצעות היכולת הזו.
אז איך מנסים?
כעיקרון המודל זמין עכשיו גם בישראל דרך Sora.com, אבל כפי שכתבתי כדי להירשם צריך לרפרש ולנסות הרבה פעמים.
מבחינת עלויות ומגבלות שימוש:
למנויי ChatGPT Plus: 1,000 קרדיטים בחודש (שווה ערך ל-50 קטעי וידאו).
למנויי ChatGPT Pro ($200 לחודש): שימוש בלתי מוגבל במצב איטי ועד 500 קטעים במצב מהיר.
פיצ’ר Canvas ב-ChatGPT משתדרג וזמין לכולם - גם בגרסה החינמית.
השקה נוספת שקיבלנו השבוע מבית OpenAI היא ה-Canvas המשודרג הפתיחה שלו לכל המשתמשים - כולל בגרסה החינמית.
להזכירכם - Canvas זה מצב שמאפשר לערוך טקסט בתוך הצ'אט כאילו הוא מסמך וגם לסמן פסקאות ספיציפיות ולשנות אותן עם פרומפטים. הנה הסרטון שמדגים את היכולות שלו שפורסם בהשקה המקורית של הפיצ’ר לפני חודשיים:
אז מה הם השיקו עכשיו?
הם הוסיפו לו עכשיו עוד כמה יכולות מאד שימושיות לכתיבה וקוד:
אפשר לבקש ממנו שיכתוב לנו הערות והצעות לשיפור על הטקסט שכתבנו (כמו שמוסיפים Comments בגוגל docs)
נוספה היכולת להריץ קוד פייתון בתוך הצ'אט ולהציג את ה-Output - הופך אותו לסוג של IDE. כך זה נראה בפועל:
אפשר לשלב Canvas ביחד עם GPTs.
איך משתמשים?חפשו ליד הצ’אט את האייקון החדש של הכלים, לחצו עליו ובחרו במצב “Canvas”
גוגל משיקה את Gemini 2.0 ועוד שורה של השקות משמעותיות 🤯
אז באמצע פסטיבל ההשקות המתוקשר של OpenAI (שנמשך 12 יום), גוגל מפילה עלינו ביום בהיר אחד וללא הודעה מוקדמת כמה מ-א-ד משמעותיות.
מה שזמין כבר עכשיו:
1. מודל חדש - Gemini 2.0 Flash - מודל קטן שעוקף את Gemini Pro הנוכחי אבל פי 2 מהיר, מולטימודלי וזול משמעותית. כרגע זמין רק דרך Google AI studio.
חשוב לזכור שזה עדיין לא המודל הכי טוב שלהם. בקרוב אנחנו צפויים לקבל את Gemini Pro 2.0 שאמור להיות אפילו עוד יותר טוב.
מה שיפה פה זה שכבר עכשיו Gemini Flash 2 עוקף את Gemini Pro 1.5 ובעצם אנחנו מקבלים יכולות טובות יותר ממה שיש היום במחיר נמוך משמעותית ופי 2 מהיר.
הנה ההשוואה בין המודלים:
2. ההשקה הכי מעניינת - Realtime Multimodal API הוא הגרסה המולטימודלית של המודל הזה שמה שמיוחד בה זה שהיא מסוגל להבין תמונות, אודיו וגם וידאו וזמינה כבר עכשיו בGoogle AI Studio.
את היכולת להבין וידאו ראינו כבר בדמואים של כמה חברות אבל זו הפעם הראשונה שאפשר ממש לנסות אותה בעצמנו.
הנה סרטון שלי נותן לו לזהות חפצים:
הסרטון הזה הוא ממש קצה המזלג של היכולות ויש בטוויטר דוגמאות הרבה יותר מורכבות. בנוסף למצלמה הוא יכולת לראות ביחד איתנו את מה שאנחנו רואים במחשב ולמעשה להיות סוג של קופיילוט שלנו - אבל כזה שבאמת מבין ורואה איפה אנחנו גולשים ומה אנחנו עושים.
הנה כמה דוגמאות שכבר ראיתי:
הוא יכול ללמד אותנו איך להשתמש בתוכנה שאנחנו לא מכירים, לפתור לנו בעיות בקוד תוך כדי עבודה או לעזור לנו להבין מאמר מדעי מורכב תוך כדי שאנחנו קוראים.
היכולת הזו תכנס לעוזר הקולי שלהם בהמשך, אבל המשמעות לבינתיים היא שאפשר לבנות אפליקציות שמסוגלות לנתח וידאו ו"לראות" מה שאנחנו רואים - דרך ה-API שלהם! יהיה מאד מעניין לראות מאד מה אנשים יבנו עם היכולת הזו.
כאן תוכלו לנסות אותו בעצמכם.
3. יכולת נוספת של המודל החדש נקראת Native Image output והיא מאפשרת לערוך תמונות קיימות באמצעות טקסט בלבד. זה ממש מגניב ועוד לא צללתי לזה, בינתיים הנה הדמו.
4. הם הוציאו כלי חדש למחקר בשם Deep Research שנועד לבצע מחקר עומק בצורה עצמאית - התשובה של גוגל לכלים כמו Perplexity. הכלי זמין כרגע רק למשתמשי Gemini Advanced (הגרסה בתשלום). הנה הדמו שלו.
מה שהוכרז היום ויושק בהמשך:
במסגרת פרויקט בשם Astra הם ישיקו פלטפורמת Agent builder שתאפשר למשתמשים לבנות סוכני AI מותאמים אישית, כולל תמיכה בממשק ללא קוד. הבטא תיפתח בהדרגה לשימושים מסחריים בתחילת 2025.
פרויקט בשם Project Mariner שהוא סוכן שמסוגל לגלוש בדפדפן בצורה עצמאית (כמו Computer use של קלוד). הנה הדמו.
סוכן ייעודי לכתיבת קוד בשם Jules - כרגע בבטא סגורה שניתן להירשם אליה כאן.
לסיכום: גוגל לגמרי חזרה למשחק, ובגדול. בנוסף, אם כל היכולות האלה יעבדו טוב, זה יהרוג המון סטרטאפים, אבל כבר למדנו שבדברים האלה כדאי לחכות ולראות קודם.
איך להפוך הרים של פידבק מלקוחות לתובנות מוצריות בזמן אמת?
אחד האתגרים הכי הגדולים שלנו כמנהלי מוצר או מנהלי שיווק הוא להפיק תובנות מתוך כמויות עצומות של פידבק שאנחנו אוספים:
סיכומי ראיונות משתמשים.
שיחות עם לקוחות ב-Gong או Zoom.
טיקטים משירות הלקוחות ב-Zendesk.
ביקורות בחנויות האפליקציות של אפל וגוגל ובאתר -G2.
שיחות על המוצר בפורומים כמו Reddit.
והרשימה עוד ארוכה....
עכשיו בואו נניח שהצלחנו לרכז את כל המידע הזה במקום אחד (משימה לא פשוטה בפני עצמה) – איך מזקקים ממנו תובנות?
אז אפשר לשלוח את זה ל-ChatGPT או קלוד בחלקים ולבקש סיכום.
זה נחמד, ובטוח עדיף מכלום - אבל זה עדיין רחוק מלתת לנו את התמונה המלאה.
האתגר פה הוא מורכב יותר:
כדי להסיק תובנות אמיתיות אנחנו צריכים ניתוח מעמיק שגם יודע לסנתז מידע מהמקורות שונים וגם ינתח גם את ה-Magnitude - כמה פעמים כל נושא חוזר על עצמו באופן ישיר או עקיף.
הבעיה הזו יושבת לי בראש כבר תקופה ולאחרונה גיליתי מוצר שמצליח לפצח אותה בצורה מרשימה ביותר:
הכירו את Kraftful – סוכן AI שמזקק תובנות מפידבקים בזמן אמת.
איך זה עובד?
המערכת שלהם מתממשקת להמון מקורות פידבק ומאפשרת לנו להבין מה המשתמשים שלנו חושבים בזמן אמת.
יש להם אינטגרציות למקורות חיצוניים כמו חנויות האפליקציות של אפל וגוגל, G2 ו-Reddit, למקורות פנים ארגוניים כמו Zendesk, Slack, Gong, גליונות אקסל ועוד הרבה.
לאחר איסוף המידע המערכת מקבצת פידבקים דומים ביחד, מדרגת לפי תדירות, וגם מאפשרת drill down עד לרמת התגובה הספיצפית.
לא פחות חשוב - היא יודעת להבדיל בין עיקר לתפל ומסננת החוצה תוכן לא רלוונטי כמו למשל ביקורות פלאף או דיונים שלא קשורים למוצר.
את המידע שנאסף אפשר לראות לפי קטגוריות:
בקשות לפיצ’רים, הערות לשיפור, תלונות או אזכורי מתחרים מסודר לפי כמה פעמים כל נושא חוזר על עצמו.
אה, ואם זה לא מספיק - ממש לאחרונה הם הוסיפו קילר פיצ'ר שמאפשר ליצור User Stories ו-PRDs על בסיס התובנות האלה - פשוט מדהים!
אז איך משתמשים?
פשוט - נרשמים לגרסה החינמית שתאפשר לכם לחבר מידע ולקבל תובנות חלקיות באופן מיידי בלינק הזה.
אם תרצו לראות את התובנות המלאות - הם מציעים Free Trial לחודש בחינם.
היופי הוא שלא חייבים להתחיל עם האינטגרציות למערכות של הארגון שאולי יצריכו מכם לקבל הרשאות. אפשר להתחיל עם מקורות ציבוריים כמו חנויות אפליקציות, Reddit ו-G2, וכבר לקבל תובנות מעולות.
טיפ של אלופים: אפשר להריץ את המוצר גם על הביקורות של המתחרים כדי ללמוד על המוצר שלהם...
בסרטון, חיברתי את המוצר לביקורות של Fiverr (חנויות האפליקציות, הסאב-רדיט /r/Fiverr) ותוך כמה דקות המערכת שלהם אספה מעל 600 ביקורות ופידבקים -רק מהחודש האחרון- ואירגנה אותם לפי נושאים.
עכשיו דמיינו לאיזה רמה של תובנות אפשר להגיע כשמחברים לזה גם את המידע הפנים ארגוני של זנדסק, ראיונות משתמשים וכו'...
ועוד משהו נחמד לסיום:
אחרי שניסיתי את המוצר בעצמי, פנתה אלי בלינקדאין Yana Welinder הפאונדרית וה-CPO של החברה וביקשה פידבק על המוצר.
השיחה הפכה לדמו, בו היא הדגימה לי יכולות מתקדמות ופיצ'רים שלא הכרתי שגרמו לי להתלהב מהמוצר אפילו עוד יותר.
בסיום השיחה סיפרתי לה שאני מתכוון לכתוב עליהם פוסט פרגון והיא הציעה לי לתת הנחה לחברי הקהילה!
אז אם ניסיתם והחלטתם לשדרג או להתחיל את ה-Free trial - אתם מוזמנים להשתמש בקוד קופון TeamAmitay שיתן לכם 25% הנחה (ואז גם אני אקבל עמלה קטנה).
הנה הקישור למוצר.
עוד עדכונים:
OpenAI לא נשארת חייבת לגוגל ואתמול בערב היא הכריזה שתוסיף את יכולות הVision לעוזר הקולי שלה. היכולת צפויה להיות זמינה בימים הקרובים ואני ממש מחכה לנסות את אותה.
מטא הוציאה את Llama 3.3 מודל חדש וקטן עם ביצועים מרשימים, אפשר לקרוא עליו כאן.
השבוע השתתפתי בוובינר של צוות המוצר של OpenAI על איך הם עובדים עם ChatGPT לשיפור הפרודוקטיביות.
מאד חיכיתי לזה וגם חשבתי שאכתוב על זה משהו, אבל האמת היא שדיי התאכזבתי. הם הראו דברים מאד פשוטים שלא חידשו לי (וזה גם הפידבק ששמעתי גם מעוד כמה מנהלי מוצר). בכל מקרה, אם מעניין אתכם לראות הנה הקישור להקלטה.מידג’רני השיקה כלי חדש לבניית עולמות ויזואלים בשם Patchwork, לא התעמקתי אבל נשמע מעניין ומסקרן. הנה השרשור עם הפרטים.
בפינה האמנותית: השבוע מישהו העלה פוסט בפייסבוק עם התמונות שיצרתי מלפני כמה חודשים של “מונה ליזה מסביב לעולם” וזה שוב דיי התפוצץ.
זה הזכיר שהכנתי גם סרטון שלה שאף פעם לא פירסמתי כי הרגיש לי שהוא עוד לא מספיק טוב. אני מקווה שעוד אחוזר לזה אבל בינתיים קבלו את גרסת העורך:
עד כאן להיום!
כרגיל - אם קיבלתם ערך מהניוזלטר אני מזמין אתכם לשתף עם חברים.
שיהיה סופשבוע שקט, אמיתי