כל מה שאתם צריכים לדעת על דיפסיק

וגם: כלי חדש לבניית אפליקציות ללא קוד בקלות, פיצ'רים חדשים לג'יפיטי ועוד המון עדכונים מהשבוע

Jan 31, 2025

אהלן חברים,

כאן אמיתי בונה עם הניוזלטר השבועי על AI ופרודוקטיביות.
השבוע בתוכנית:

כל מה שאתם צריכים לדעת על DeepSeek R1 - המודל הסיני שעושה בית ספר לחברות ה-AI הגדולות בעולם.
איך להשתמש בDeepSeek מבלי לחשוש לדליפת מידע לסינים.
לבנות אפליקציות AI בקלי קלות: הכירו את Party Rock.
פיצ’ר חדש ב-ChatGPT: יצירת Artifacts.
ניסיתי את ChatGPT כמדריך שלי בגן החיות.
האווטארים באים
*אם הטקסט בעברית לא מיושר תוכלו לקרוא אותו בגרסת הWeb דרך הבלוג בלינק הזה.

בשבוע האחרון קהילת ה-AI בסערה בעקבות מודל חדש בשם DeepSeek R1 – מודל סיני שמגיע לביצועים דומים למודל o1, המודל הכי חזק של OpenAI, אבל בעלות שימוש נמוכה ב־96.4% ממנו!

וזה לא הכל:
מה שעוד יותר מעניין ב־R1 זה שהוא מודל פתוח. למעשה, החברה פרסמה את כל הפרטים על האימון שלו, מה שמאפשר לכל מי שרוצה לאמן מודל כזה.

והנה הנתון המפתיע מכולם:
לטענתם, עלות האימון של המודל עמדה על 5.5 מיליון דולר בלבד(!)

הסכום הזה אמנם לא כולל עלויות כוח אדם וציוד, אבל גם אם נוסיף את כל ההוצאות הנלוות, מדובר בסדר גודל נמוך בלפחות פי 10 מהעלויות של ענקיות הטכנולוגיה.

איך זה צפוי להשפיע על התחום?

אז החברה שלכאורה צריכה לחשוש במיוחד מההתפתחות הזו Meta, שלהזכירכם - האסטרגיה שלה מתמקדת בליצור מודלים פתוחים.

במצב הנוכחי, יהיה לה קשה להצדיק את עשרות המיליארדים שהושקעו באימון המודלים שלה.
הדלפה (לא מאומתת) שרצה בטוייטר טוענת שהם קצת נכנסו לפאניקה מכל הסיפור:

אבל כחשובים על זה קצת יותר לעומק, אין באמת מה לדאוג למטא.
למרות שהיא ללא ספק חטפה פגיעה באגו, בסוף התזה שלה של מודלים פתוחים מתגשמת וזה משחק לטובתה בטווח הרחוק כי גם כך היא לא תיכנננה להרוויח מהם כסף.

וגם - מטא היא רק חלק קטן מהתמונה.

למעשה, מדובר באיום אפשרי על כל השחקניות הגדולות בתחום, כולל OpenAI וגוגל שכבר לא ברור עד כמה יש להן חפיר טכנולוגי כרגע,

וכמובן - זה עשוי להשפיע גם על תחזיות הצמיחה של אנבידיה ה"מלכה" שאיבדה מעל 17% אחוז ביום שני האחרון,

הרי אם באמת אפשר להגיע לאותה רמה של ביצועים בעשירית מהמחיר - גם אם יש ביקוש לGPUs, צריך לעדכן את האקסלים ותחזיות הרווח בהתאם...

מצד שני - לא הייתי ממהר להמר נגד אנבידיה או נגד הטרנד,
בכל זאת מדובר במהפכה טכנולוגית של פעם במאה שנה, עם פוטנציאל להחליף עובדים אנושיים - שהם (עדיין) הסעיף הכי גדול בהוצאות של חברות היום.

ועכשיו לשאלה המתבקשת: האם כדאי לעבור לעבוד עם DeepSeek?

אז זו שאלה מורכבת עם לא מעט כוכביות:

דבר ראשון - חשוב לזכור שמדובר בחברה סינית, והנחת היסוד צריכה להיות שכל מידע שיגיע אליה - יהיה חשוף לממשלת סין. לכן, לא מומלץ לעבוד עם המודל דרך ה-API הרשמי שלהם.

אבל זו לא הדרך היחידה להשתמש בו. מכיוון שמדובר במודל פתוח - יש אלטרטניבות. בגדול אפשר להריץ אוותו לוקאלית (עם חומרה מאד יקרה), או לעבוד עם חברת צד שלישי, כמו Nebius AI, וממש טרי מאתמול גם Azure ו-AWS מספקות גישה אליו.

אז הפתרון הזה אמנם מנטרל את הסיכון שהמידע יזלוג לסינים - אבל חשוב לדעת שעדיין יש פה אי ודאות. בעיקר כי לא ברור לגמרי איזה הנחיות נתנו לו באימון ויש כבר דיווחים שהוא מצנזר מידע לפי רגולציות סיניות,

אבל - יש מצב שכל זה יפתר בקרוב - חברת Hugging Face כבר הודיעה שהיא עובדת פרוייקט לאמן מודל זהה ב"גרסה מערבית", ואז בכלל יהיה שמח...

מעבר להיבטים המסחריים והטכניים, יש משהו נוסף שמאוד מסקרן ב־DeepSeek R1: אפשר ללמוד ממנו על תהליכי החשיבה של הדור החדש של המודלים.

המודלים החדשים, כמו o1 או מודל החשיבה של Gemini, מאומנים כך שיוכלו "לחשוב" (להתפלפל עם עצמם) לפני שהם מספקים תשובה.

אז המודלים הסגורים כמעט ולא חושפים את התהליך הפנימי הזה למשתמשים, בעיקר כדי לא לחשוף סודות תחרותיים.

לעומתם, DeepSeek R1 דווקא כן חושף את התהליך הלוגי-מחשבתי שהוא מבצע לפני שהוא עונה, וזה ממש מרתק לצפות בזה!

בסרטון שהכנתי, אפשר לראות את ה"מחשבות" של DeepSeek כשהוא מתמודד עם שאלת Product Sense שנתתי לו הכוללת תכנון מוצר חדש ללא הגדרות

עוד כמה הערות:

את הפוסט הזה כתבתי ביום שני שעבר ומאז קראתי עוד הרבה ניתוחים ותאוריות על אופן אימון המודל וגם חשדות שהסינים מזייפים הרבה דברים מאחורי התהליך (עד כדי מעורבות של הממשלה הסינית לצורך ריגול)

למיטה הבנתי, פריצת הדרך המשמעותית פה היא לא המודל עצמו, כי בקרוב יצאו מודלים טובים יותר, אלה שיטות האימון היצירתיות והחסכוניות בהן השתמשו כדי לאמן אותו. עכשיו, כשהן ידועות ומתועדות היטב, הן עשויות לאפשר לכל החברות לאמן מודלים שיהיו הרבה יותר זולים ולהאיץ את התעשיה הזו מאד (מה שדווקא עשוי לשחק לטובתה של אנבידיה).

לסיכום: אני חושב שאנחנו עדיין ב”אירוע מתגלגל” ואת ההשפעות שלו על התעשיה נבין רק בדיעבד. יש עדיין הרבה שאלות פתוחות לגבי היכולת לאמן מודלים נוספים בשיטות האלה, אבל אין ספק שמדובר באחד האירועים הכי משמעותיים שקרו בתעשיה בשנתיים האחרונות.

שני מקורות נופסים ששווה לקרוא למי שרוצה להעמיק:

הבלוג של בן תומפסון

הבלוג של דאריו אמודאי מנכ”ל אנתרופיק

ולסיום,
קבלו את מיטב ה-Memes והטוויטים על דיפסיק מהשבוע:

ואי אפשר בלי הגרסה הישראלית האקטואליות….

אה, והנה עוד סרטון גאוני מאינסטרגם עם הסיפור האמיתי על מאחורי הפיתוח של DeekSeek.

אז איך להשתמש בDeepSeek מבלי לחשוש לדליפת מידע לסינים?

בפוסט האחרון כתבתי על הבעייתיות בלהשתמש בDeepSeek דרך האתר הסיני,

אז הנה הדרך הכי טובה להשתמש בו היום עם מידע פרטי או עסקי ללא החשש שיעבור לסינים:

חברת Perplexity, שרק השבוע הוסיפה את o1 לפלטפורמה שלה, לא בזבזה רגע והכריזה שמעכשיו גם DeepSeek R1 זמין אצלהם.

בהכרזה היא מדגישה שהמודל רץ על שרתים אמרקיאים /אירופאים ואין חשש לדליפת מידע לסין - זה נקרא להגיב מהר!

כדי להשתמש במודל תצטרכו להיות במצב Pro (למשתמשים חינמיים יש 10 שימושים ביום) ואם תרצו להשתמש בו כמו מודל שפה רגיל ולא כמנוע החיפוש.

לבנות אפליקציות AI בקלי קלות: הכירו את Party Rock

הכלי הזה, מבית Amazon הושק ממש לאחרונה, ועם כל הבלאגן בשבוע האחרון דיי חמק מתחת לרדאר…

אז אתם בטח שואלים את עצמכם - למה אנחנו צריכים Yet-another-כלי-לבניית אפליקציות בלי קוד?

אבל האמת ש- Party Rock של אמאזון מביא פה גישה חדשה ומרעננת, ממשק נוח במיוחד וגם כמה יכולות שלא ראינו עד היום.

כך זה עובד:

האפליקציות מורכבות מ"בלוקים" שכל אחד מהם יכול להיות שדה של טקסט, תפריט Drop Down, קריאה למודל שפה, קריאה למודל תמונה, צ'אטבוט וכו'.
אפשר להוסיף בלוקים בממש Drag&Drop אבל מה שבאמת מגניב זה שאפשר לכתוב מה רוצים לבנות בטקסט חופשי והוא פשוט מחבר את הבלוקים בשבילנו.
בניגוד לרוב כלי הפיתוח שמצריכים מאיתנו להוסיף את מפתח ה-API שלנו כדי להתממשק למודלי שפה, פה ההתממשקות למודלי השפה או התמונות כבר מוטמעת בפנים - אפשר לבחור בין המודלים השונים (Claude, ChatGPT, Gemini וכו').
יתרון משמעותי נוסף שלה זה שהיא מאפשרת לנו לבנות Workflows שמורכבים מכמה קריאות LLMs, מודלי תמונה וכו'.

למשל בסרטון - יצרתי אפליקציה ליצירת תמונות בשילוב של "Magic Prompt" (כמו מה שיש באידאוגרם):

כך זה עובד:

שלב ראשון - המשתמש כותב תיאור פשוט של התמונה ובאיזה סגנון הוא רוצה לייצר אותה.

שלב שני - האפליקציה שולחת את התיאור והסגנון ל-Sonnet של קלוד שהופך את הטקסט של המשתמש לפרומפט מקוצועי.

שלב שלישי - האפליקציה שולחת את הפרומפט שהיא יצרה למודל תמונות שמחזיר תמונה.

ואת כל זה יצרתי בפרומפט אחד! אתם יכולים לנסות את האפליקציה שבניתי בעצמכם בקישור הזה.

הכלי הזה הוא הדרך הכי פשוטה שנתקלתי בה עד היום לבנות מוצרי GPT Wrapper והממשק שלו הוא ממש For Dummies ויכול להתאים גם למי שאין לו מושג ירוק בתכנות.

פשוט כותבים את הרעיון ומקבלים אפליקציה תוך דקה - וכל זה בחינם לחלוטין, כולל הקריאות למודלים ליצירת הטקסט והתמונות.

חשוב להגיד -למרות שהם מאפשרים לשתף וגם לפבלש את האפליקציות שיצרתם,

כרגע הכל בתוך הפלטפורמה הסגורה שלהם, ללא יכולת לייצא את הקוד.

כלומר - זה יכול להתאים לבניית כלים פנימיים או שימוש עצמי, אבל אי אפשר ממש לבנות עם זה מוצרים ולגבות עליהם כסף.

אז איך משתמשים?

1.נכנסים לאתר שלהם.
2.לוחצים על Generate App
3.מתארים מה הכלי שאתם רוצים לבנות ומה השלבים בדרך
4. בודקים את האפליקציה ובמידת הצורך עורכים / משנים.

פיצ’ר חדש ב-ChatGPT: יצירת Artifacts

השבוע OpenAI יצאו עוד שני שדרוגים משמעותיים ל-ChatGPT:

1.הם הוסיפו את היכולת לייצר Artifacts בתוך פיצ'ר ה-Canvas (כמו שיש בקלוד)
2 .הם חיברו את ה-Canvas למודל החזק ביותר שלהם - o1.

כל אחד מהם בפני עצמו הוא נחמד, אבל מה שגאוני פה- זה השילוב בין השניים.

בעצם, אנחנו מקבלים את היכולת ליצור Artifacts (מיני-מוצרים) עם המודל הכי טוב בעולם לכתיבת קוד בתוך ChatGPT.

אבל... עדיין יש פה קאצ'.

בגרסה של 20 דולר לחודש אנחנו מוגבלים ל-50 הודעות בשבוע עם o1, מה שיספיק למוצרים בודדים.

אם תרצו להינות משימוש בו ללא הגבלה, תצטרכו לשדרג למנוי Pro של 200 דולר לחודש.
אני חייב להודות - שכשמחברים את זה עם הגישה ל-Operator הסוכן החדש שגולש באינטרנט, גישה למודל o1 Pro (שהוא קצת יותר טוב מo1 הרגיל),
וגם גישה בלתי מוגבלת למצב המתקדם של Sora,

זה כבר מתחיל להישמע דיי מפתה (וזה עוד לפני שיצא O3-mini שמתחיל להתגלגל עכשיו...).

בסרטון לקחתי את הפיצ'ר החדש לסיבוב וניסיתי לייצר את המוצר הקבוע שלי - Dad Joke Generator.

הגרסה הראשונית שהוא יצר היתה פוקציונלית אבל דיי מכוערת, ואחרי עוד כמה פרומפטים הגעתי לגרסה שכבר נראתה סביר.

משהו נוסף מעניין שהוא עשה (ואף כלי אחר לא עשה עד היום) זה לקחת את הבדיחות מתוך אתר אינטרנט מוכר במקום לייצר מאגר או לג'נרט אותן בעצמו, לא פראייר ה-o1 הזה…

רוצים לנסות את הפי'צר החדש בעצמכם?
כך משתמשים בו (זמין למנוי פלוס ומעלה):

1.בוחרים במצב O1 בפינה השמאלית למעלה.
2. בשורת הטקסט לוחצים על כפתור סל הכלים ובוחרים ב-Canvas.
3. כותבים בפרומפט את מה שאתם רוצים ליצור
4. אחרי שהוא סיים לכתוב את הקוד, לוחצים על Preview בפינה הימנית העליונה.

כך תהפכו את ChatGPT למדריך הפרטי שלכם.

תזכורת: פיצ'ר ה-Vision החדש של ChatGPT מאפשר לכם להפוך אותו למדריך הפרטי שלכם בכל סיור או טיול.

בסופ”ש האחרון היינו בספארי, ובדקות הבודדות שלא רדפתי אחרי בת השנתיים וחצי, ניסיתי את היכולות שלו כמדריך הפרטי שלי, הנה קטע קטן:

הנה כמה תובנות:

1. בסך הכל הופתעתי לטובה, זה הרגיש מאד טבעי והוא ענה תשובות באמת מעניינות ורלוונטיות.

2. החסרון המרכזי שאני רואה בו כרגע לעומת מדריך אנושי זה שהוא לא פרואקטיבי.
כלומר - המשתמש צריך לדעת איזה שאלות לשאול וזו לא תמיד משימה פשוטה.
מצד שני, זה משהו שאפשר לפתור יחסית בקלות ברמה הפרומפט או ההנחיות.

3. כפי שכתבתי כבר בעבר - להסתובב עם טלפון כשהמצלמה פתוחה זה לא מאד פרקטי והדרך הנוחה להשתמש ביכולת הזו היא בעזרת טכנולוגיה לבישה כמו משקפיים חכמות.

האווטארים באים.

מנכ"ל Synthesia שיתף השבוע בטוויטר הצצה לדור הבא של ה "Emotion Model for AI Avatars" שלהם, כך זה נראה:

עם יד על הלב - אתם חושבים שהייתם מצליחים לזהות שמדובר בסרטון מג'ונרט?

עד כאן להיום!

למצטרפים החדשים, אני מזכיר שתוכלו לקרוא את כל המהדורות הקודמות שפיספסתם בבלוג.

כרגיל - אם קיבלתם ערך מהניוזלטר אני מזמין אתכם לשתף עם חברים ועם אנשים שהתוכן הזה יכול לעניין אותם.

מוזמנים גם לשתף בקבוצות ווטסאפ מקצועיות ובערוץ הסלאק בעבודה.

שיהיה סופשבוע שקט,

אמיתי