המרוץ לאימוץ הארגוני
וגם: טקסט לדיבור בעברית כמעט מושלמת, מחקר מתחרים הדור הבא, סיכום הכנס של מיקרוסופט, מודל תמונות חדש ועוד עדכונים
אהלן, כאן אמיתי בונה עם הניוזלטר השבועי על AI ופרודוקטיביות.
השבוע בתוכנית:
פריצת דרך: טקסט לדיבור בעברית כמעט מושלמת עם המודל החדש של Eleven Labs.
אינטגרציות, MCP והמרוץ לאימוץ הארגוני.
מחקר מתחרים - הדור הבא: עם קלוד, MCP ו-Browser use.
סיכום ה-AI Tour של מיקרוסופט.
הכירו את Flux Kontext - מודל תמונות חדש ועוצמתי.
עוד עדכונים ואירועים קרובים.
זה ניוזלטר ארוך במיוחד וייתכן שהטקסט נחתך בסופו. לחוויית קריאה מיטבית אני ממליץ לקרוא את הניוזלטר דרך הבלוג (בחרו בפוסט הנעוץ).
וואו, לזה לא ציפיתי.
אחר שגוגל שחררו את המודל הקולי שלהם בשבוע שעבר היה נראה שהם פתחו פער כל המתחרים, אבל היום Eleven Labs הוציאו מודל חדש, שככל הנראה, חצה את ה Uncanny Valley בדיבור בעברית!
יתרון נוסף של Eleven Labs הוא העובדה שהוא מאפשר לאמן אותו על הקול שלי. כך זה נשמע למשל עם הקול שלי (האיכות לא משהו, זה מודל שאימנתי מזמן):
מעבר לעברית, יש עוד כמה יכולות מאד מעניינות:
תומך ב70 שפות נוספות, תומך בשיחות עם כמה דוברים ומאפשר להוסיף תגיות כדי לקבוע את טון הדיבור של כל משפט! כך זה נראה:
מה אפשר לעשות איתו?
לייצר גרסת אודיו לכל תוכן שאתם יוצרים
להפוך את הבלוגים שלכם לפודקאסטים
לחבר אותו עם כלים כמו HeyGen כדי ליצור אווטאר מדבר
ליצור סוכן טלפוני למכירות או שירות לקוחות לעסק שלכם
לפרוץ את חתימת הקול של בנק הפועלים כמו שמיכאל לוגאסי עשה….
איך משתמשים?
המודל זמין לכולם בקישור הזה. כדי לאמן מודל שלכם תצטרכו לעשות את המנוי הזול ביותר (5 דולר בחודש).
טיפ: אם יש לכם טעויות הגיה, תנסו לשנות ניסוח או להחליף מילים מסויימות לאנגלית.
אינטגרציות, MCP והמירוץ לאימוץ הארגוני
רק סיימנו להבין איך להתקין MCP על קלוד כדי לחבר אותו לכלים אחרים, ופתאום - כבר לא ממש צריך את זה.
אתמול, בטיימינג מושלם, נוספה גם לקלוד וגם ל-ChatGPT בגרסאות בתשלום יכולת מאד משמעותית - אינטגרציית MCP מובנת למערכות אחרות בארגון.
מה המשעמות של זה?
נתחיל מהפרטים היבשים -
בקלוד:
כרגע יש 11 אינטגרציות מובנות, ואחת מהן היא Zapier, מה שפותח גישה ליותר מ-8,000 אפליקציות נוספות. המשמעות היא שלרוב המקרים כבר אין צורך בהתנקת MCP, והחיבור הפך להרבה יותר פשוט ונגיש.
זו יכולת שהם השיקו כבר לפני שבועיים לגרסה שלהם לצוותים, ועכשיו הפכה להיות זמינה לכל המשתמשים המשלמים.
ב-ChatGPT:
הבשורה הכי גדולה פה היא שהם סוף סוף הוסיפו יכולת MCP בממשק הצ׳אט! עד עכשיו יכולת זו הייתה קיימת רק בקלוד וב-Cursor, ועכשיו גם משתמשי הצ׳אט יוכלו ליהנות ממנה.
מבחינת האינטגרציות עצמן, בגרסת Plus יש אינטגרציות לכלים כמו Google Drive, Outlook, Gmail, Google Calendar, Linear, GitHub, HubSpot ו-Teams. (נכון להבוקר, אצלי זה עדיין לא מופיע, אבל ראיתי שאצל אחרים כן, אז כנראה שזה עניין של כמה ימים)
בגרסת Teams (גרסה לצוותים קטנים בעלות של 30 דולר למשתמש) יש אפשרות להוסיף אינטגרציות נוספות באמצעות חיבור MCP, וגם יכולת לבצע Deep Research דרך החיבורים האלה או בשילוב שלהם עם האינטרנט.
בנוסף - הם הכריזו גם על יכולת מעניינת נוספת, שכרגע זמינה רק בגרסת Teams באפליקציית המק: הצ׳אט יכול להצטרף לפגישות כ-Notetaker, להקליט, לסכם אותן ולהשתמש בקונטקסט שלהן בעבודה השוטפת.
כמה מחשבות שעלו לי בנושא:
מדהים לראות כמה מעט זמן עבר מאז השקת ה-MCP ועד שזה הפך לפיצ׳ר פשוט ונוח לשימוש. אני חושב שהלקח החשוב כאן הוא שלא צריך להתרגש יותר מדי מדברים שנראים מורכבים, ואפשר לצאת מנקודת הנחה שכל מה שהיום קצת מורכב, יהפוך לפשוט בהמשך.
לגבי האינטגרציות עצמן, מדובר במהלך מתבקש ומשמעותי מאוד, שבא לפתור את האתגר הגדול ביותר באימוץ כלי AI בארגונים – היכולת לספק לכלים האלה קונטקסט והבנה רחבה של עולם העבודה שלנו.
עם זאת, עדיין יש כמה אתגרים משמעותיים לפיצוח:
1. אבטחת המידע: מניסיוני, למרות ש-ChatGPT וקלוד מציגים סטנדרטים גבוהים של אבטחת מידע, רוב החברות עדיין חוששות לחשוף מידע של לקוחות. אינטגרציות, כמו זו של HubSpot למשל עשויות להיות עוצמתיות מאוד, אבל ייקח זמן עד שארגונים ירגישו מספיק בנוח לבצע חיבור כזה.
2. עודף המידע: במערכות האלו יש כמויות עצומות של מידע שרובן אינן מסוננות ואינן מאורגנות, ובפועל לכל עובד יש צורך במידע שונה ורלוונטי לו.
בשלב זה החיבור הוא לכל המידע, ולהבנתי עדיין אין למשתמשים דרך מדויקת מספיק להגדיר את המידע הספיציפי שרלוונטי אליהם. החיפוש העמוק נותן מענה חלקי לביה הזו, כי הוא לא יעיל מספיק ועלול לבזבז הרבה טוקנים ולהעמיס על הקונטקסט של המודל.
לסיכום: אנחנו נמצאים בתקופה מכרעת באימוץ כלי AI בארגונים. ממה שאני רואה בשטח, הגענו לנקודה בה החברות מבינות שהגיע הזמן ״לעשות סדר״ ולבחור פתרון אחיד לכל הארגון - אבל מתקשות להחליט כי לכל צ׳אט יש את היתרונות שלו.
לגוגל ומיקרוסופט יש יתרון מובנה בזכות האקוסיסטם, ולכן OpenAI ואנתרופיק דוחפות מאד חזק כדי לייצר לעצמן יתרון תחרותי וסטיקינס בתוך הארגונים - האינטגרציות החדשות הן הוכחה מצוינת לזה.
מחקר מתחרים - הדור הבא: עם קלוד, MCP ו-Browser use
לעשות Deep Research על המתחרים ולאסוף את מה שכתוב ברחבי האינטרנט זה מעולה,
אבל מה שעוד יותר מעניין זה מה שמגלים כשממש משתמשים במוצר שלהם.
אתמול החלטתי לעשות ניסוי שאני מתכנן כבר הרבה זמן:
חיברתי את קלוד עם MCP למוצר בשם Browser use (שכשמו כן הוא - כלי שמפעיל דפדפן), ורציתי לבדוק אם הוא מסוגל לבצע מחקר מתחרים באמצעות גלישה וניווט בתוך חשבון אמיתי של מוצר קיים.
לצורך הניסוי פתחתי חשבון Free Trial ב-Shopify, וביקשתי שיבצע שם פעולות שונות כ-Admin ויתעד אותן- ממש כמו משתמש שחוקר את הפיצ’רים והיכולות של המערכת.
למשל, בדמו ביקשתי שיבצע פלואו של יצירת קמפיין שיווקי ויתעד את כל שלבי הפעולה, כך זה נראה:
זה לא עבד חלק לגמרי - הייתי צריך לקחת שליטה בשלב האימות מול Cloudflare ולסמן את ה-Captcha בעצמי - אבל אחרי שהוא התחבר לחשבון, זה עבד לא רע בכלל.
אגב, גם ל-OpenAI יש כלי כזה בתוך ChatGPT בשם Operator, שזמין בתוכנית היקרה של 200 דולר בחודש,
ויש גם דרכים אחרות להפעיל את הדפדפן עם MCP דרך קלוד או קרסר, עם תוסף לכרום בשם browser mcp וMCP של Puppeteer ושל Playwright
אני בחרתי ב-Browser use בעיקר כי לא רציתי לתת לכלי שאני לא מכיר גישה לדפדפן האישי שלי, והמוצר הזה מאפשר עבודה דרך API בסביבה מבודדת. בנוסף קיבלתי 100 דולר בקרדיטים במסגרת הטבה, אז החלטתי לנצל אותם.
עוד אנקדוטה מעניינת: לא מצאתי MCP Server קיים עבור המוצר הזה, אז קלוד הציע לכתוב לי אחד… וזרמתי איתו.
באופן די מפתיע זה לקח פחות מ-20 דקות - פשוט עקבתי אחרי ההוראות שלו, העתקתי את הקוד שהוא יצר, וזה עבד - הכל לוקאלי לגמרי.
בכללי, אני חושב שכל הנושא של Browser use הולך לתפוס תאוצה בזמן הקרוב, ואנחנו ממש בתחילת הדרך שלו.
תחשבו על זה - כל חברה תוכל “להעסיק” צבא של אייג’נטים שיסתובבו באתרים של המתחרים, יאספו מידע ויזהו פיצ’רים חדשים בזמן אמת.
ומחקר מתחרים הוא רק ההתחלה- היכולת הזו מתאימה גם למשימות כמו:
בדיקות QA ידני על מוצרים
בדיקות שימושיות של מוצרים
אוטומציות למערכות שאין להן API
מילוי טפסים
ועוד…
סיכום ה-AI Tour של מיקרוסופט
השבוע השתתפתי בכנס AI Tour של מיקרוסופט וכפי שהבטחתי, הנה הסיכום והתובנות שלי מהאירוע:
קודם כל, זו היתה הפקה יוצאת דופן - באמת אחד הכנסים הכי מושקעים שהייתי בהם בישראל. מעל 2,000 משתתפים שהתכנסו בהיכל התרבות, הנחיה מעולה של גורי אלפי, עיצוב מרשים, סאונד מדויק ואפילו תזמורת.
אחרי פתיחה חגיגית עם סרטון AI מעולה של גורי עלה מנכ"ל מיקרוסופט ישראל, אלון חיימוביץ'.
הוא דיבר על הצורך שלנו להפוך מאומת הסטארטאפ, לאומת הבינה מלאכותית והציג את הנתונים המדהימים שמיקרוסופט השקיעה 80 מיליארד דולר בתשתיות בתחום ה-AI (מתוך 300 מיליארד דולר של חברות הביג טק במצטבר). לסיום הוא הדגיש את המטרה שלהם שלכל חברה ולכל מפתח יהיה את סט הכלים המתקדם ביותר בתעשייה כבר מחר בבוקר. מיד אחריו עלה נשיא המדינה, יצחק הרצוג, התמקד באיזון בין חדשנות לאחריות: מצד אחד, אנחנו חייבים לאמץ את החדשנות, ומצד שני הוא הדגיש את הצורך להיזהר מהתמכרות של צעירים לטכנולוגיות אלו.
מיכל ברוורמן-בלומנשטיק - מנכ"לית מיקרוסופט ישראל מחקר ופיתוח וה-CTO של חטיבת האבטחה העולמית של מיקרוסופט, הציגה תמונה מטרידה של עולם הסייבר החדש: אם פשיעת סייבר הייתה מדינה, היא הייתה הכלכלה השלישית בגודלה בעולם, עם GDP של 8 טריליון דולר, מתחת רק לארה"ב ולסין. היא הדגישה את שלושת תחומי האתגרים המרכזיים של ה-AI בעולם האבטחה: "AI for Security" "Security for AI ו-"AI vs AI"
הצוות של Copilot for VS Code הראו לנו דמו לייב של פיתוח משחק דונקי קונג ב vibe coding בזמן אמת ואז גם נתנו ל-AI לשחק בו.
עידו סגל, יזם מנוסה, הציג את המערכת של Napster AI ליצירת כפילים דיגיטליים, כולל הדגמה של כפיל דיגיטלי שהוא יצר למנכ"ל מיקרוסופט.
הצוות של Copilot 365 בישראל הדגים איך הם מתכננים תקציב בעזרת 4 אייג'נטים שונים כמו Researcher, Analyst, Project Manager -בעיקר היה מרתק לראות את השילוב בין הצוותי האנושי לAI Agents.
אחר כך היה פאנל מרתק עם עמרי כספי, ניר אלפנדרי ורון קמחי, שדנו בשאלה כיצד AI משנה סטארטאפים והשקעות VC.
אחרי ההפסקה התפצלנו לשלושה מסלולים. אני נכנסתי למסלול AI in Practice, שם ראינו איך AI כבר מוטמע באופן מעשי במערכות שכולנו משתמשים בהם: מגיוס מלש"בים לצה"ל, דרך בית החולים שיבא ועד למערכת הסייבר הלאומית.
בשורה התחתונה - הכנס הזה חיזק לי את ההבנה שאנחנו כבר לא בשלב שבו AI הוא גימיק או בגדר ניסוי. AI Agents כבר משתלבים בכל התעשיה, שותפים לעבודה והאחריות שלנו היא לדעת לעבוד איתם בצורה חכמה, אחראית ולמצות את הפוטנציאל שלהם.
הכירו את Flux Kontext
מודל חדש ועוצמתי במיוחד לעריכת תמונות ושמירה על דמות וסגנון עקבי.
מאז ש-OpenAI שחררו את מודל התמונות החדש של ChatGPT, די הפסקתי להשתמש במודלי תמונות אחרים.
גם אם Midjourney עדיין עדיף למטרות מסוימות - מצאתי שההבדל לא מספיק משמעותי בשבילי משתמש פשוט כמוני.
אבל השבוע - יצא מודל חדש שהצליח להפיל לי את הלסת.
חברת Black Forest Labs שחררה את Flux Kontext - מודל ייעודי לעריכה של תמונות, עם יכולת מדהימה לשמור על דמות עקבית לאורך סצנות שונות -
וכן, הוא יותר טוב גם מהמודל של OpenAI למטרה הזו.
הנה דוגמה:
מהדוגמאות שיצא לראות הוא טוב במיוחד לשימושים כמו:
החלפת אלמנטים בתמונות.
מיקום של דמות או מוצר במקומות ומצבים שונים (מעולה לאסטים שיווקיים).
העברת סגנון של תמונה לתמונות נוספות
עבודה עם דמות עקבית בסצנות, עם יכולת שליטה מדהימה בפרטים (מאד שימושי ליצירת וידאו).
והוא אפילו יכול לסדר לכם את החדר:
בנוסף, הוא הרבה יותר מהיר וזול מהמודל של ChatGPT.
איך משתמשים?
המודל כבר זמין ב Playground ו-API דרך Replicate ,Fal ו-Freepik, ואפשר להשתמש בו בחינם כאן: kontext-chat.replicate.dev
עוד עדכונים:
מודל חדש של גוגל: ללא הודעה מוקדמת, גוגל הוציאו גרסה חדשה של Gemini Pro 2.5 שמנצחת את כל המודלים האחרים בבנצ׳רמקים, במיוחד בתחום כתיבת הקוד. עוד לא ברור האם הוא באמת עוקף את קלוד Sonnet 4 גם ״בחיים האמייתיים״ אבל בינתיים התגובות מתלהבות ואפילו יקיר המערכת בייס 44 הודיעו שישתמשו במודל הזה כברירת מחדל מעכשיו.
קלוד עכשיו תומך ב-10x יותר תוכן בפרויקטים: כשתעלו קבצים מעבר לסף הרגיל, Claude יעבור אוטומטית ל"מצב שליפה" חדש שמאפשר לו להתמודד עם הרבה יותר מידע – בלי להתבלבל.
מודל VEO 3 זמין בפלפטורמות שונות, גם בלי VPN. המחירים לא זולים בכלל:
אירועים קרובים:
קורס GenAI למנהלות ומנהלי מוצר לקהל הרחב ביוני Sold Out ופתחנו הרשמה מוקדמת למחזור של חודש יולי שיתקיים בתאריכים 13.7 ו 20.7 בין השעות 09:30 - 13:30 בתל אביב. אפשר לקרוא עוד ולהירשם כאן.
סטרטאפיסטים / בילדרים - ב30.6 Google For Startups מקיימים יום שלם בקמפוס שלהם עם ליווי אישי של מומחי AI ואנשי גוגל, דוגמאות מהעולם האמיתי שיתנו השראה, וקרדיטים למוצרים שלהם. כאן אפשר לקרוא עוד פרטים ואפשר להירשם כאן.
הבינה האמנותית (תודה למור רגב ללוש על הרעיון לשם החדש לפינה)
שי פל המוכשר עם ״נכס צאן ברזל בחברה הישראלית״ (נוצר עם VEO 3)
עד כן להיום!
למצטרפים החדשים, אני מזכיר שתוכלו לקרוא את כל המהדורות הקודמות שפספסתם בבלוג.
כרגיל - אני מזמין אתכם לשתף עם חברים ועם אנשים שהתוכן הזה יכול לעניין אותם.
מוזמנים גם לשתף בקבוצות ווטסאפ מקצועיות ובערוץ הסלאק בעבודה.
שיהיה סופשבוע שקט,
אמיתי