🕵️ ג'יפיטי > חוקר פרטי
וגם: המקף שחשף אתכם, לדבר עם האינטרנט, מוצר הכנה לראיונות פרודקט ועוד עדכונים.
אהלן, כאן אמיתי בונה עם הניוזלטר השבועי על AI ופרודוקטיביות.
השבוע בתוכנית:
הכירו את ChatMatrix - האתר שיעזור לכם לבחור את הצ׳אט הנכון למשימה הנכונה.
המקף שחשף אתכם ואיך להימנע ממנו.
לדבר עם האינטרנט - איך המודלים המולטימודאליים ישפיעו על ממשקי המשתמש?
לקחתי את יכולת זיהוי התמונה של o3 לבוחן פתע והתוצאות מפתיעות.
סימולציות לראיונות פרודקט עם AI
סיכום חדשות הטוויטר.
דיי, נמאס כבר
זה פשוט בלתי אפשרי לעקוב אחרי השינויים והעדכונים בצ׳אטים השונים בתדירות כזה גבוהה,
ליטרלי כל יום משהו משתנה, והפיד (כולל אותי) נשמע בערך כך:
אתמול OpenAI הוציאו את GPT-4.1 שהוא יותר טוב מ־4.5 (כן, זה מוזר), שבכלל הולך להיעלם בקרוב, אבל עדיין פחות טוב בקוד מג׳מיניי 2.5 שעקף את קלוד וגם נכנס לתוך -Deep Research אבל הוא זמין רק למנויים, ועקף את של OpenAI, אבל לא לכתיבה והם גם הוסיפו פיצ׳ר זיכרון משופר, שבדיוק היום נוסף גם לגרוק...
אז נכון, חשוב להישאר מעודכנים - אבל באמת שכבר בלתי אפשרי לעקוב אחרי הטירוף הזה.
כששיתפתי לא מזמן טבלה שמשווה בין הצ׳אטים - הנחתי שאצטרך לעדכן אותה בתדירות גבוהה,
אבל לא חשבתי שאצטרך לעשות את זה כל יום.
ואז הבנתי - טבלה זה לא מספיק
צריך להיות אתר שמרכז את כל המידע הזה, ומתעדכן בלייב.
אז הלכתי לפלטפורמת ה-Vibe coding החביבה עלי, Base44, ובניתי מוצר קטן שיעשה לכולנו סדר בבלאגן:
הכירו את ChatMatrix - אתר אחד שמשווה בין כל הצ׳אטים המובילים בזמן אמת.
בכל פעם שאתם לא בטוחים באיזה כלי לבחור - תוכלו להיכנס ולקבל מידע מעודכן שיעזור לכם לקבל החלטה, וגם סתם להוריד קצת את ה-FOMO.
הוא מבוסס על הטבלה, אבל תוך כדי העבודה הוספתי עוד הרבה שדרוגים כמו:
פיצ׳רים נוספים שהיו חסרים לי כמו: בניית צ׳אטבוטים , Projects, Artifacts.
הוספתי גם את הצ׳אט של Microsoft Copilot (הוא מאד נפוץ בארגונים ולגמרי צריך להיות שם).
אינדיקציה לכל פיצ׳ר – האם הוא בתשלום או לא.
הוספתי Change log שעוקב אחרי שינויים בטבלה, כך שתוכלו לדעת בקלות מה השתנה מאז הפעם האחרונה שנכנסתם - וכל עדכון מחובר לפוסט או בלוג המקורי של ההכרזה.
קישורים לעמודי ה-Release notes של כל אחד מהצ׳אטים.
אפשרות להירשם לעדכונים שבועיים על שינויים בטבלה (זה יכנס בקרוב, אבל אפשר כבר להירשם)
זו גרסה ראשונית, והמטרה היא להמשיך ולהוסיף עוד מידע, השוואות לקטגוריות נוספות (כלי AI coding, כלי Deep Research וכו׳), ועוד כמה רעיונות שאפרסם בהמשך.
מה שיפה בעידן ה-vibe coding ובשימוש ב Base44 בפרט, זה שדיי בקלות בניתי לאתר שלי גם מערכת Admin שמאפשרת לי לעשות שינויים מאחורי הקלעים בקלות, ללא פיתוח (אם מעניין אתכם לראות איך זה נראה, זה מופיע בסוף הסרטון).
אז איך משתמשים?
פשוט נכנסים ללינק: chatmatrix.live
*עובד גם במובייל, אבל מומלץ לצפות בדסקטופ.
טיפ של אלופים: תוסיפו את האתר ל-bookmarks וכך שתוכלו לחזור אליו בפעם הבאה שאתם מתלבטים באיזה מודל לבחור.
*קרדיט ל Peter Yang שנתן לי את ההשראה והרעיון לטבלת ההשוואה המקורית.
המקף שחשף אתכם
המקף הארוך "—" (או באנגלית: ״Em dash״) הפך להיות סימן ההיכר של פוסטים שנכתבו או נערכו על ידי מודל שפה.
למה? כי עד ש-ChatGPT נכנס לחיים שלנו, כמעט אף אחד לא השתמש בו, וגם מי שכן הכיר והתשמש בו - לרוב לא היה עושה את זה בתוך פוסטים.
אבל מסיבה לא מאד ברורה, מודלי השפה מכניסים אותו באופן קבוע לכל טקסט שהם כותבים.
האם זו בעיה? לא ממש.
להפך, זה אפילו חכם להשתמש בצ׳אט לניסוח, כל עוד עושים את זה נכון.
אבל, וזה אבל חשוב -
לא מעט אנשים (כולל אותי) כבר פיתחו רגישות למקף הזה. כשאני רואה אותו מופיע בפוסט בלינקדאין למשל, זה מדליק אצלי נורה.
גם אם התוכן מעולה, הספק שה-AI כתב את כולו פשוט מתגנב פנימה וישר מוריד לי קצת את החשק לקרוא אותו.
אז איך נמנעים מזה?
אפשרות אחת היא כמובן לערוך את הטקסט ולהחליף את כל המקפים אחד אחד. לא נורא, אבל די מציק ומבזבז זמן.
אם אתם רוצים להיות מקצוענים, תוכלו להמנע מזה אחת ולתמיד בעזרת פעולה פשוטה שלא תיקח לכם יותר משתי דקות מהחיים:
לחצו על Profile Image > Customize ChatGPT ותגיעו לאזור ה-Custom Instructions.
בשאלה הראשונה - What traits should ChatGPT have? - הדביקו את השורה הבאה:
**NEVER USE THIS SIGN "—" (EM DASH) YOU CAN USE THIS "-" INSTEAD**
וזהו.
נפטרתם מהמקף המסגיר.
לדבר עם האינטרנט
אני לא בטוח שהפנמנו עד הסוף את ההשלכות של המודלים המולטימודאליים שנכנסים עכשיו למיינסטרים.
אחד היתרונות הגדולים שלהם, הוא היכולת לחבר בין העולם הדיגיטלי לעולם הפיזי ו״לדבר״ עם אתרים ומוצרים.
הדמו המרשים הזה של Google שמסתובב עכשיו באינטרנט, ממחיש את היכולת הזו בצורה יפה:
משתמש מדבר עם מוכר וירטואלי, המערכת מבקשת שיפתח מצלמה ויראה איזה צמח הוא רוצה לקנות ואז מביאה לו בדיוק את מה שהוא רוצה.
במקום לגלוש באתר, לחפש, לסנן ולבחור – הוא פשוט מראה מה הוא רוצה - פשוט יותר, לא?
יוצא לי לחשוב ההשלכות של זה לא מעט.
מה זה אומר על העתיד אתרים ומוצרים?
האם יש הצדקה לחוויית קנייה מבוססת ממשק משתמש כשאפשר פשוט לדבר עם המערכת?
התחושה שלי היא שעדיין יהיה צורך, או שלפחות יקח הרבה מאד זמן עד שזה ישתנה וזה למה:
גם אם הטכנולוגיה תיהיה שם בקרוב - חינוך שוק עובד בסייקלים הרבה יותר ארוכים.
אני מעריך שבדיוק כמו שהיום יש את מי שמעדיפים ללכת לחנות ולבחור מוצרים בעצמם, ויש את אלה שקונים אונליין
וגם בתוך אלה שקונים אונליין - יש את מי שמעדיפים חיפוש חופשי וכאלה שמעדיפים ניווט בקטגוריות,
בקרוב נתחיל לראות סגמנט חדש - קונים שירצו "לדבר עם האתר".
בהתחלה הוא יהיה קטן ויורכב מearly adopter ומ Gen Z, וככל שיעבור הזמן הוא יגדל - בדיוק כמו שקרה במהפכות קודמות כמו המעבר מחנויות פיזיות לאיקומרס והמעבר למובייל.
ג'יפיטי > חוקר פרטי 🕵️
האינטרנט מתלהב מהיכולת החדשה של o3 לנתח תמונות ולזהות איפה הן צולמו,
אז החלטתי לעשות לו בוחן פתע וביקשתי שינחש את המיקום שלי לפי תמונה:
אמלק - הניתוח הצליח, החולה מת - אבל זה לא מה שבאמת חשוב.
ועכשיו קצת יותר מפורט:
בשורה התחתונה הוא נכשל. הוא ניחש שאני נמצא בצומת נמיר / ז'בוטניסקי כשבפועל הייתי בצומת נמיר / איינשטיין -
אבל התהליך שהוא עשה כדי לזהות את המיקום הוא החלק המעניין באמת:
הוא עשה Zoom in לחלקים בתוך התמונה כדי למצוא פרטי מידע חשובים.
ברגע שזיהה קו אוטובוס 501 הוא נכנס לאינטרנט וזיהה איפה הקו הזה עובר.
אחר כך זיהה עבודות בניה, הבין שזה הרכבת הקלה ונכנס לאתר העירייה ולאתר של נטע כדי להבין מיקום פוטנציאלים.
זיהה את סגנון הבניה של הבניינים.
ואת כל זה הצליב מול ההבנה שלו של תל אביב.
כך זה נראה:
אז למה אני לא מתרגש מהטעות? כי זה ייפתר בהמשך, עניין של עוד קצת דאטה.
מה שחשוב להבין זה שיש לנו בכף היד אייג'נט עוצמתי ומולטמודאלי - שיכול לנתח תמונות, (ובקרוב גם וידאו), לחפש באינטרנט ולהצליב את מידע כדי להסיק מסקנות ולתת לנו תובנות.
מצד אחד - דיי מפחיד.
מצד שני - יכולת שפותחת את הראש להרבה שימושים מעניינים בעבודה.
סימולציות לראיונות ניהול מוצר עם AI?!
כן, יש דבר כזה.
אם אתם שואפים להיכנס לתפקיד ניהול מוצר בחברה גדולה, כנראה שתצטרכו לעבור סדרה ארוכה של ראיונות פרודקט מסוגים שונים: Product Sense, Execution, Behavioral ועוד.
למקרה שאתם לא מכירים - מדובר בראיונות עם מבנה קבוע, שהתחילו בחברות הגדולות (מטא, אמאזון, גוגל, מיקרוסופט) ובשנים האחרונות הפכו להיות נפוצים בהרבה חברות נוספות.
האתגר? הם קשים ותחרותיים מאד.
לא משנה כמה ניסיון יש לכם - ללא הכנה מוקדמת מאד קשה לעבור אותם, בעיקר כי אתם מתמודדים מול אלפי מועמדים אחרים שכן התכוננו אליהם.
אני מכיר לא מעט אנשים שהקדישו כמה חודשים רק להכנה, והוציאו על זה הרבה כסף - כי בסוף, אם מתקבלים, זה כמובן משתלם בענק.
וכמו בכל תחום בחיים, אחד הגורמים המרכזיים להצלחה - הוא התרגול.
אז יש כבר תעשייה של אתרים לתרגול מול אנשים אחרים, וגם מנטורים ויועצים בתשלום - שהן אופציות טובות, אבל דיי מוגבלות וגם יקרות.
תארו לעצמכם שהיה לכם מורה פרטי שזמין 24/7, שמראיין אתכם, נותן לכם פידבק ואפילו דשבורד עם נתוני התקדמות בין ראיון לראיון,
בקיצור - אתם מבינים לאן הפוסט הזה הולך...
הכירו את PMF labs - מאמן AI אישי להכנה לראיונות שמבוסס על שאלות אמיתיות.
איך זה עובד?
בוחרים את סוג הראיון ורמת הקושי מתוך רשימה של ראיונות מסוגים שונים בחברות Big Tech.
כל השאלות הן שאלות אמיתיות שנלקחו ממקורות כמו Glassdoor או מעובדים לשעבר בחברות האלה.
כדי לדמות סיטואציה אמיתית, כל ראיון שונה לחלוטין - פעם אחת המראיין חברותי, פעם אחרת קשוח ומקשה, פעם אחרת אדיש לחלוטין או אפילו עם מבטא זר.
והנה החלק הכי טוב:בסוף כל ראיון תקבלו דשבורד מפורט עם ניתוח הביצועים שלכם, טיפים לשיפור ודוגמאות לתשובות “מושלמות״.
בנוסף, תוכלו גם לראות איך התוצאה שלכם ביחס לממוצע של אחרים ובסוף המערכת ממש תתן לכם ציון ״עבר״ או ״לא עבר״ לפי הקריטריונים המדויקים של החברה הספיציפית.
נשמע טוב מדי, נכון?
אז השאלה המתבקשת היא כמובן היא - עד כמה זה מציאותי?
מההתנסות הקצרה שלי, התרשמתי שמדובר בראיון ברמה גבוהה - אבל קשה לי להגיד בוודאות כי לא התראיינתי לחברות האלה,
מה שכן - אני מכיר את מי שעומד מאחורי המוצר הזה ואין לי ספק שהוא מבין את התחום לעומק.
את Assaf Yablon אני מכיר מקורס חובלים והשירות המשותף בחיל הים,
ומאז הוא הספיק לסיים MBA ב-MIT, ולעבוד כמנהל מוצר במיקרוסופט וגם באמזון בארה״ב. הוא היה גם בצד של המרואיין כשהתכונן לראיונות האלה וגם היה בצד המראיין בתוך החברות,
בקיצור - אם יש מישהו שמבין את העולם הזה לעומק ויש לו את הידע הנדרש להרים מוצר כזה, זה כנראה הוא.
חשוב להגיד - בשלב הזה, אני לא חושב שהמוצר הזה מחליף את הצורך בתרגול מול אנשים אמיתיים, אבל אני לגמרי רואה איך זה משתלב ביחד - גם חוסך חלק מהתרגולים וגם עוזר להעלות רמה מהר יותר.
יותר מזה, לדעתי לא רחוק היום בו החברות עצמן יכניסו ראיונות כאלה לתהליכי המיון שלהן - בהתחלה כשלב מקדים לסינון ראשוני ובהמשך גם לתהליך עצמו.
כל מי שנרשם מקבל 3 קרדיטים, כך שאתם יכולים להתנסות בעצמכם כבר עכשיו בקישור הזה.
ובמיוחד עבור קוראי הניוזלטר - יש גם קופון שיתן לכם 75% הנחה לקניית של 5 קרדיטים נוספים
זה הקוד: AIWITHAMITAY02מזינים אותו בדף ה-Checkout ואז המחיר יותר מ$20 ל$5.
עושים סדר ב-Memory של ChatGPT
בשבוע שעבר OpenAI הכריזו על שינוי “קטן” באופן שבו ChatGPT מתייחס להיסטוריית השיחות שלנו.
עד היום הזיכרון של הצ׳אט היה מאוד סלקטיבי - הוא בחר בעצמו מה לזכור, ולרוב לא עשה עבודה טובה במיוחד.
אם יצא לכם להיכנס ל- Memory ולבדוק מה הוא שמר עליכם שם, כנראה ששמתם לב שזה רחוק מלייצג את מי שאתם, ורוב גם די הזוי.
מעכשיו - לצ'אט יש גישה מלאה לכל היסטוריית השיחות שלנו.
בסדנאות, חלק משמעותי ממה שאנחנו מתעסקים בו, הוא בדיוק הנושא הזה:
איך לבנות את הקונטקסט שלו כך שיבין את התפקיד שלנו בעבודה - שכבה אחר שכבה, כדי להפוך אותו מכלי עבודה לעוזר אישי אמיתי.
מסתבר שזה סיפור הרבה יותר מורכב מאשר לתת לו כמה פרטים ותיאור תפקיד, וזו גם לא משימה חד פעמית של זבנג וגמרנו, אלא תהליך מתמשך והרגל שצריך לסגל לעצמנו.
בהקשר הזה, השינוי הוא ללא ספק פריצת דרך, במיוחד עבור משתמשים כבדים כמוני שמדברים עם הצ׳אט כמעט על הכל.
מצד אחד - בהנחה שזה עובד טוב, זו עשויה להיות קפיצה משמעותית מאוד ביכולת שלנו לקבל ממנו מהצ׳אט ערך משמעותי כעוזר אישי.
עם זאת, לתחושתי הפתרון הזה עדיין כללי מדי, ולא בהכרח יתן את הערך.
יותר מזה, הוא עשוי להיות בעייתי ומעלה לא מעט שאלות מטרידות:
בעיית עודף מידע:
נתחיל מהשאלה - כמה אחורה הוא ילך? יש לי היסטוריית צ׳אטים של יותר משנתיים, כולל צ׳אטים מהעבודה הקודמת שבכלל לא רלוונטיים.
גם אם הוא ידע לשלוף פרטים נכונים, עדיין יש פה המון רעשי רקע וקשה לי לראות איך הוא מצליח להבדיל בין העיקר לתפל.
אין למשתמשים שליטה או יכולת סינון:
כרגע אי אפשר להחליט אילו צ׳אטים יכללו בזכרון ואילו לא (יש אפשרות לעשות צ׳אט זמני, אבל זה לא תקף לצ׳אטים היסטוריים),
בתור מי שעושה המון סימולציות והדגמות, שחלקן בכלל לא קשורות לעבודה שלי, זה מאוד בעייתי ועשוי להטעות אותו עם מידע לא רלוונטי.
בעיית פרטיות:
הרבה פעמים אני עובד עם הצ׳אט באופן שבו עוד אנשים נחשפים לתשובות בזמן אמת, לפעמים עשרות משתתפים. איך אני יכול לוודא שהמודל לא יחליט פתאום לשלוף מידע פרטי או מידע שקשור ללקוח אחר מולם?
וגם למי שלא מעביר סדנאות – בסוף כולנו נמצאים בסביבות עבודה משותפות, והתחושה שהצ׳אט יכול לפלוט כל פריט מידע שנכתב לו אי פעם היא די מלחיצה.
לבעיית הפרטיות יש רובד נוסף והוא העובדה של-OpenAI יש עלינו המון מידע אישי והם יכולים להשתמש בו לצורך פרסום מטורגט ופרסונלי, גם באופן שעשוי לפגוע בנו בעתיד (ראו ערך פרשת קיימברידג׳ אנליטיקה).
זה אמנם לא משהו חדש, אבל הקלות בה ״מרימים את המתג״ ומפעילים את היכולת הזו היא תזכורת לרגישות של הנושא.
בקיצור, זה אמנם צעד משמעותי שישפר את החוויה שלנו – אבל לדעתי הסיפור של הקונטקסט הוא הרבה יותר מורכב ורחוק מלהיות פתור.
אני מקווה שהם יבנו בהמשך מנגנון קצת יותר מתוחכם, כזה שמאפשר לנו לנהל את הקונטקסט בצורה חכמה ולבצע עליו בקרה מתמשכת.
בינתיים - החלטתי להשאיר את האפשרות מופעלת כדי לבדוק אותה, ובהמשך אחליט אם לכבות אותה ולנהל את הקונטקסט בעצמי כמו שעשיתי עד היום - או להשאיר כך.
כדי להדליק או לכבות את הפיצ׳ר:
הולכים ל־Settings > Personalization.
סיכום חדשות הטוויטר
(נכתב אוטומטית על ידי אייג׳נט)
דמיס האסאביס, מנכ”ל גוגל דיפמיינד, הופיע בתכנית 60 דקות וחשף תחזיות מרתקות: בינה מלאכותית כללית (AGI) צפויה תוך 5-10 שנים, AI מאיץ גילוי תרופות עם פוטנציאל למיגור מחלות בעשור הקרוב.
גוגל השיקה את Gemini 2.5 Flash - מודל היברידי חדש עם “תקציב חשיבה“ לאופטימיזציה של עלויות, וגם גרסה חדשה של Gemma 3 המאפשרת הרצה על כרטיסי מחשב ביתיים.
אנתרופיק חשפה את מערכת הערכים של Claude במחקר מקיף שבחן מאות אלפי שיחות אמיתיות, והזהירה מפני שימושים זדוניים כמו מבצעי השפעה פוליטיים.
OpenAI השיקה את gpt-image-1 ל-API - המודל מאחורי יצירת התמונות הוויראלית של ChatGPT זמין כעת למפתחים במחיר של $10 למיליון טוקנים עבור תמונות קלט ו-$40 למיליון עבור פלט.
סם אלטמן הודיע על הכפלת מגבלות הקצב - עבור O3 ו-O4-mini-high למנויי ChatGPT פלוס.
מודל o3 של OpenAI סובל מהזיות משמעותיות יותר לעומת מודלים קודמים, לפי בדיקות צד שלישי וכרטיס המערכת של החברה עצמה.
Perplexity השיקה עוזר קולי לאייפון המאפשר גלישה באינטרנט ופעולות רב-אפליקטיביות כמו הזמנת מקומות, שליחת מיילים ויצירת אירועים ביומן.
xAI עדכנה את Grok עם יכולות ראייה במצב קולי, המאפשרות למשתמשים לשאול על כל דבר שנראה בפיד המצלמה.
Character AI חשפה פלטפורמה בשם AvatarFX ליצירת סרטוני אווטאר מדברים ארוכים מתמונת ייחוס אחת ובחירת קול.
ElevenLabs השיקה יכולת העברה בין סוכנים המאפשרת העברת שיחות והקשרן בין סוכנים מתמחים, בפרט לתרחישי תמיכה.
IDE חדש פתוח-קוד למערכות מרובות-סוכנים, דומה ל-Cursor אך מיועד ספציפית לבניית זרימות עבודה מרובות-סוכנים, המבוסס על OpenAI Agents SDK.
Kortix AI השיקה את Suna, סוכן AI כללי פתוח-קוד המסוגל לחשוב, לתכנן ולפעול במגוון תחומים באמצעות מחשב וירטואלי.
Genspark השיקה כלי להכנת מצגות באמצעות AI המאפשר להמיר נתונים גולמיים למצגות מובנות עם עיצוב ותוכן אוטומטיים.
Play AI השיקה משנה קול AI המאפשר למשתמשים לשנות את קולם לקול של כל אדם אחר עם 10 שניות בלבד של הקלטת קול.
AgentA/Bמציעה מסגרת לבדיקות A/B אוטומטיות המחליפה תנועת משתמשים אמיתית בסוכני LLM בקנה מידה גדול, המדמים התנהגויות משתמשים אמיתיות.
בפינה האמנותית: ריק ומורטי יוצאים ממצרים.
למצטרפים החדשים, אני מזכיר שתוכלו לקרוא את כל המהדורות הקודמות שפיספסתם בבלוג.
כרגיל - אני מזמין אתכם לשתף עם חברים ועם אנשים שהתוכן הזה יכול לעניין אותם.
מוזמנים גם לשתף בקבוצות ווטסאפ מקצועיות ובערוץ הסלאק בעבודה.
שיהיה סופשבוע שקט,
אמיתי