הקאמבק של גרוק
וגם: סוף עידן המחקר, קורס בינה מלאכותית של גוגל, ופינה חדשה עם סיכום חדשות הטוויטר
אהלן חברים,
ימים קשים ומאתגרים עוברים עלינו כמדינה וכעם,
מקווה שהניוזלטר יצליח לתת לכם קצת אסקפיזם מהחדשות הבלתי נסבלות של הימים האחרונים.
השבוע בתוכנית:
סוף עידן המחקר: איך מוצרי הDeep Research החדשים משנים את התעשיה.
גוגל מציעה קורס AI חדש בחינם.
הקמבאק של גרוק ואיך לנסות אותו בחינם.
מודל הבית של OpenAI משתדרג
עוד עדכונים והשקות מהשבוע
פינה חדשה: סיכום חדשות הטוויטר
סוף עידן המחקר
מוצרי ה-Deep Research החדשים הם ללא ספק הטרנד החם הבא - ובצדק.
זה באמת אחד השימושים הכי טוב שראינו לכלי AI עד היום.
כתבתי בניוזלטר לאחרונה על הכלי (המדהים) של OpenAI ומאז יצא לי לראות עוד הרבה דוגמאות לשימוש בו, שבאמת חוסכות המון זמן וכסף:
מחקרי שוק, סקירות ספרות, מחקרים בתחום הרפואה ועוד.
לאחרונה יצאו עוד כמה כלים כאלה,
והשבוע Perplexity הוציאה את הגרסה שלה ואף פרסמה ציונים דומים לאלו של OpenAI בבנצ'מרקים וזמן ריצה הרבה יותר קצר.
אבל כפי שכבר למדנו בתחום הזה - יש בנצ'מרקים ויש את המציאות.
בינתיים, מההתנסות שלי ושל רוב מי שדיברתי איתו עושה רשום שהכלי של Perplexity הוא כלי מעולה, אבל ברמה פחות טובה מהכלים של גוגל ו-OAI.
נראה שכל התחום של Deep Research הפך להיות קצת באזזוורד - ולמעשה ויש סקאלה שלמה של מוצרים תחת הטייטל הזה,
כולם שימושיים, אבל תזכרו שלמרות השם הזהה - לא מדובר באותם המוצרים.
בכל מקרה - הכלים האלה רק ימשיכו להשתפר ודבר אחד כבר די ברור:
איסוף מידע מרחבי האינטרנט הופך להיות קל ונגיש מאי פעם.
ומה המשמעות של זה?
ככל שהיכולת הזו משתפרת - הערך הכלכלי של ידע "ציבורי" שזמין באינטרנט הולך ויורד.
בן תומפסון, אחד האנליסטים הכי טובים בעולמות הטכנולוגיה, מנתח את התהליך הזה לעומק בבלוג האחרון שלו:
הוא משווה את הסיטואציה, לשינוי שקרה במעבר מעיתונות הכתובה לאינטרנט.
בעבר, חדשות היו מוצר נדיר ולכן עיתונים שלטו במונופול על שוק הפרסום.
בעידן האינטרנט, החדשות הפכו להיות זמינות לכולם, והערך הכלכלי שלהן קרס.
עכשיו אנחנו רואים את אותו תהליך קורה עם מחקר וניתוח מידע:
מחקר שפעם דרש שעות של עבודה , היום יכול להתבצע עם כלי AI תוך דקות,
ובעלות של 200 דולר לחודש אפשר להפיק דוחות עסקיים שחברות מחקר גובות עליהן עשרות אלפי דולרים.
אבל בקרוב - הכלי הזה (שרק ימשיך להשתפר) יהיה זמין לכולם ולדוחות האלה כמעט לא יהיה ערך - בדיוק כמו שהיום אף אחד לא מוכן לשלם בשביל לקרוא חדשות.
אז איך אפשר לבדל את עצמנו בעידן שבו כל אחד יכול לקבל סיכום מקיף של כל נושא באינטרנט בלחיצת כפתור?
בהקשר הזה, הוא מתייחס לשתי מגמות עיקריות:
ידע פרטי יהיה נדיר יותר:
אם הידע הציבורי הופך לחסר ערך כלכלי, המשמעות היא שהכוח עובר לידע הפרטי. מידע שלא קיים ברשת – מידע מחברות פרטיות, מידע פנימי, שיחות עם מומחים – יהיה הדבר הבא שיבדל את מי שבאמת יודע ממי שרק חוקר את מה שקיים באינטרנט.
ה-AI משרת בעיקר את המומחים:
כאן הוא נותן דוגמה מההתנסות שלו: הוא ביקש מ-Deep Research דו"ח מקיף על תעשייה מסוימת, וקיבל תשובה שנראתה מדויקת וברמה גבוהה – אבל כשהעמיק פנימה, גילה שהיא החמיצה שחקן מפתח בתעשייה, מכיוון שהוא לא מופיע באופן גלוי באינטרנט.
זה עיקרון שנכון באופן כללי לכלי AI: הם הכי משרתים את אלו שכבר יודעים מה לחפש וחשוב מכך - יודעים לאילו תוצאות לצפות.
אבל למי שלא מבין את התחום – הם עלולים ליצור אשליה של ידע, כשלמעשה חסרים בו חלקים קריטיים ו- Unknown unknowns.
אז אם עוד לא ניסיתם להשתמש ב-Deep Research,
הנה כמה אופציות לנסות בחינם:
גוגל Gemini- זמין במנוי של Gemini Advanced (יש חודש חינם).
Perplexity - בגרסה החינמית מקבלים 5 מחקרים ביום.
Genspark - מחקר אחד ביום בגרסה החינמית.
גוגל משיקה תוכנית הכשרה למוצרי ה-AI שלה - בחינם!
בשיתוף Google for Startups
בשבוע שעבר כתבתי פה על Deep Research של Gemini ועל השדרוגים במודלים ויכולות ניתוח הוידאו המרשימות שלהם - עכשיו יש לכם הזמנות להתעדכן כל כל מה שחדש ישירות מהמומחים שלהם!
Google for Startups ו- Google Cloud משיקים מחזור נוסף ועדכני של Startup School: Gen AI, תכנית הכשרה חינמית בת 4 שבועות המיועדת ליזמים, סטארטאפים, מפתחים ומנהלי מוצר המעוניינים לשכלל ולהגדיל את ארגז כלי ה-AI שלהם עם הכלים המתקדמים של Google.
התכנית, שתחל ב-25 בפברואר 2025, מציעה הזדמנות ללמוד איך לבנות אפליקציות המבוססות על טכנולוגיות ה-Gen AI החדשות של Google. ההדרכות יועברו אונליין בלייב על ידי מומחי AI של גוגל (באנגלית), וגם יוקלטו עבור מי שלא יצליחו להשתתף בזמן. כל שיעור יתקיים בשני מועדים על מנת להתאים לאזורי זמן שונים: בישראל הם יתקיימו בימים שלישי וחמישי, ב-10:00 וב-19:00 שעון ישראל.
במהלך התוכנית:
תרכשו ניסיון מעשי ותבנו prototype של יישום Gen AI
תגלו איך טכנולוגיות הענן והכלים מבוססי ה-AI של Google יכולים לעזור לכם לבנות את המוצר הבא שלכם ולעשות לו scaling
תלמדו כיצד לבנות מודלי LLM המותאמים לצרכי הסטאראפ הספציפי שלכם.
הקאמבק של גרוק
לפני יומיים, אילון מאסק והצוות שלו ב-X ai השיקו את המודל החדש שלהם Grok 3,
שלפי הנתונים היבשים מצליח לעקוף את כל המודלים המובילים ברוב הבנצ’מרקים.
בנוסף, הם העלו את המודל בעילום שם ל־Chatbot Arena – זירה שבה משתמשים מדרגים מודלים מבלי לדעת במי מדובר – וגם שם הוא הגיע למקום הראשון עם הציון הגבוה ביותר אי פעם.
אז למה לא כתבתי עליו עד עכשיו?
כי כבר למדנו שבנצ'מרקים זה טריקי ורציתי לראות קודם קצת תגובות מהשטח ולנסות אותו בעצמי.
ובאמת - אחרי שקראתי ביקורות של מומחים כמו אנדריי קרפת’י ואית’ן מוליק וגם ניסיתי אותו בעצמי, נראה שמדובר במודל חזק מאוד – בערך ברמת O1 – אבל לא מעבר לכך.
במילים אחרות, Grok 3 מצליח ליישר קו עם המודלים המובילים, אבל לא פורץ דרך דרמטית או מגיע לרמה חדשה של יכולות.
.
נכון לעכשיו, המודל גם לא זמין ב־API (ועדיין אין צפי לכך), מה שמגביל מאוד את השימוש בו. לכן קשה באמת להתייחס אליו ברצינות בעולם שבו רוב המפתחים וארגונים נשענים על גישה דרך API.
המשמעות האמיתית – חזרה לחוקי ה־Scaling:
הדבר הכי משמעותי שהקאמבק של גרוק מראה לנו - זה שחוקי ה־Scaling Laws, שטוענים שעוד כוח חישוב ישפר את המודלים - עדיין עובדים.
אילון מאסק הצטרף למרוץ בשלב מאוחר יחסית, רכש כמות פיסיכית של 200 אלף יחידות GPU NVIDIA H100 וחיבר אותן למחשב-העל Colossus שעזר לו לאמן את המודל הזה.
ההוכחה הזו קריטית לתעשייה, כי היא עונה (או לפחות מרגיעה) על השאלה הגדולה: האם הגענו לתקרת הזכוכית?
חוקי ה־Scaling אומרים שעדיין יש לאן לגדול - כל עוד משקיעים משאבים אדירים בכוח חישוב, אפשר לשפר את הביצועים גם בלי פריצות דרך אדירות בארכיטקטורה.
למעשה, אפשר להגיד שהמנצחת הכי גדולה מהמהלך הזה היא בכלל NVIDIA, שכן כל עוד המירוץ ממשיך, היא זו שמספקת את התשתית החומרתית.
וגם - כמה זמן Grok 3 יישאר בפסגה?
סביר להניח שלא הרבה.
בקרוב OpenAI צפויה להשיק את GPT-4.5, וגם Anthropic מתכוננת עם Sonnet 4 – מה שעשוי שוב להפוך את היוצרות,
כך שהמרוץ (ועמו מרדף החימוש בכרטיסי GPU) עוד רחוק מלהסתיים.
אז מה אפשר וכדאי לעשות עם גרוק בת'כלס?
בהשקה עם פרסמו שהוא יהיה זמין למנויי טוויטר פרימיום+ ב-40 דולר לחודש,
אבל לפני יומיים הוא נפתח בחינם לכולם (כנראה לזמן מוגבל).
כלומר - יש לנו מודל ברמת o1 בלי עלות - וזה כבר נחמד ושווה לנצל את זה.
יש לו גם פיצ'ר Deep Search (גם בחינם), שניסיתי ולא ממש התרשמתי ממנו מאד, אבל אני מתכוון עוד לנסות.
מה שלדעתי הכי מעניין ושימושי לעשות עם גרוק זה להשתמש ב-Deep Search בתוך טוויטר.
לדוגמה, אפשר לשאול שאלה כמו "מה משתמשי טוויטר כותבים על נושא X?" ולקבל תוצאות עדכניות ומקיפות, בגלל לחיבור הישיר שלו ל-API של הפלטפורמה ולמאגר העצום שלה. הנה דוגמה:
אז איך משתמשים?
👈באפליקציה / אתר של טוויטר - פשוט בוחרים בטאב של גרוק.
👈או באתר החדש שלהם grok(dot)com.
עוד עדכונים:
אתר Freepik הפתיעו את כולם ומציעים גישה למחולל התמונות VEO 2 של גוגל שכולנו חיכינו לו. להזכירכם זה מחולל הוידאו הכי טוב By far ומשאיר אבק לכל המתחרים כולל ל-Sora.
אפשר לנסות כאן: https://www.freepik.com/pikaso/ai-video-generator
*הם פתחו את זה גם למי שלא מנוי - אבל שימו לב שיש עומס אז זמני הריצה איטיים במיוחד. מקווה שבהמשך הסופ”ש זה ירגע קצת ונוכל באמת לנסות.
ללא קשר - אני מאמין שהם הסנונית הראשונה ובקרוב נקבל את המודל הזה בעוד פלפטורמות.
חברת Fiverr עם מהלך AI משמעותי ראשון ומתבקש: Fiverr GO הוא פיצ’ר חדש שמאשפר ליוצרים לאמן מודלים של עצמם ולמכור אותם.
למשל: אמן שיציע מודל תמונות שמאייר בסגנון שלו, או קריין שיציא מודל של הקול שלו.
כך זה נראה:
ממה שניסיתי בעצמי זה עדיין בחיתולים אבל אני חושב שזה מהלך חכם שיעזור להם להישאר רלוונטיים עם השינויים בשוק מבלי להתחרות ביוצרים שלהם.
המודל 4o של ChatGPT עבר שדרוג השבוע:
מה השתנה בדיוק? הם לא ציינו באופן מפורש.
אבל לפי התגובות של סם אלטמן ודיווחים ראשונים של משתמשים בטוויטר - אלה עיקרי השינויים: סגנון כתיבה שנשמע אנושי יותר, שיפור ברמת כתיבת קוד, פחות מסרב לבקשות,
יכולות חיפוש טובות יותר.
פינה חדשה: סיכום חדשות הטוויטר.
אני מוסיף לניוזלטר פינה ניסיונית חדשה!
בשביל כתיבת הפינה הזו הצטרף אלי לצוות Agent שיצרתי שאוסף, מסכם ומתרגם פוסטים חשובים מהטוויטר בשבוע האחרון.
כרגע היא מכילה רק עדכונים על השקות ומוצרים, בהמשך אני מתכוון להרחיב אותה לעוד נושאים כמו דיונים מעניינים ופוסטים של מובילי דעה בתחום ה-AI.
סיכום השבוע בטוויטר:
חברת Perplexity הנגישה לציבור את R1 1776 , גרסה של מודל DeepSeek R1 שנועדה לספק מידע לא מצונזר, חסר פניות ועובדתי עם יכולות הסקה ללא שינוי. מודל זה שואף לשמור על דיוק תוך טיפול בבעיות צנזורה. לקריאה.
חברת OpenAI השיקה את SWE-Lancer, מדד ביצועים מציאותי המעריך את ביצועי הקידוד של מודלי AI על פני יותר מ-1,400 משימות. המדד משקף ערכי שוק אמיתיים ומטרתו להעריך את המורכבות של הנדסת תוכנה מודרנית. לקריאה.
חברת Google הציגה מערכת AI מרובת סוכנים המשתמשת ב-Gemini 2.0 כדי לסייע בפריצות דרך מדעיות, ומדגימה את שנת 2025 כשנה של ריבוי סוכנים. לקריאה
המכון Arc Institute וחברת Nvidia השיקו את Evo 2, מודל AI עם דיוק של 90% בחיזוי מוטציות הקשורות לסרטן, המציג יתרון תחרותי ביישומי AI בביוטכנולוגיה. לקריאה.
מירה מוראטי שעד לא מזמן היתה הCTO של OpenAI השיקה את Thinking Machines Lab, המתמקדת במערכות AI הניתנות להתאמה אישית ומטפחת מדע פתוח כדי להתחרות ב-OpenAI ובמעבדות AI אחרות. לקריאה.
בסיס המשתמשים של ChatGPT הגיע ל-400 מיליון משתמשים פעילים שבועיים, מה שמציג אימוץ רחב ומעורבות משתמשים. לקריאה.
עד כאן להיום!
למצטרפים החדשים, אני מזכיר שתוכלו לקרוא את כל המהדורות הקודמות שפיספסתם בבלוג.
כרגיל - אם קיבלתם ערך מהניוזלטר אני מזמין אתכם לשתף עם חברים ועם אנשים שהתוכן הזה יכול לעניין אותם.
מוזמנים גם לשתף בקבוצות ווטסאפ מקצועיות ובערוץ הסלאק בעבודה.
שיהיה סופשבוע שקט,
אמיתי
רציתי להגיד שאני עוקב וקורא את הבלוג כבר תקופה והוא מאוד עוזר לי לעקוב אחרי אינספור ההתפתחויות ולעשות סדר בבלאגן, אז תודה :)