קלוד בתוך קלוד
וגם: 5 טכניקות הנדסת פרומפטים שבאמת עובדות, הפיצ׳ר שהכי חיכיתי לו בפיגמה ועוד עדכונים
אהלן, כאן אמיתי בונה עם הניוזלטר השבועי על AI ופרודוקטיביות.
השבוע בתוכנית:
5 טכניקות הנדסת פרומפטים שבאמת עובדות - ואחת שלא.
קלוד בתוך קלוד: יכולות חדשות בקלוד Artifacts
הפיצ׳ר שהכי חיכיתי לו מגיע ל-Figma Make
עוד עדכונים
אם המייל חתוך או לא מוצג טוב, ממליץ לעבור לגרסת הדפדפן בקישור הזה.
״ה-AI לא יחליף אתכם, אלא מישהו שמשתמש ב-AI יחליף אתכם״
זה אחד המשפטים שקראתי הכי הרבה פעמים במצגות ובפוסטים בשנתיים וחצי האחרונות,
ולכן ה-Meme הזה שרץ בטוויטר השבוע הצחיק אותי במיוחד:
אבל עד שזה יקרה - כדאי שנדע להשתמש בו הכי טוב שאנחנו יכולים, אז הנה
5 טכניקות הנדסת פרומפטים שבאמת עובדות
ואחת שלא עובדת - וכנראה תפתיע אתכם.
אתמול צפיתי בפרק בפודקאסט המעולה של לני רצ׳סקי עם Sander Schulhoff על הנדסת פרומפטים.
סאנדר נחשב לאחד המומחים בעולם בתחום הנדסת הפרומפטים,
הוא כתב את מדריך הפרומפטים הראשון באינטרנט עוד לפני ההשקה של ChatGPT,
והוביל את המחקר המקיף ביותר שנעשה בנושא - יחד עם OpenAI, גוגל, מיקרוסופט, סטנפורד ופרינסטון - שכלל ניתוח של מעל 1,500 מאמרים ויותר מ-200 שיטות פרומפטינג.
למרות שאני עוסק בתחום ומלמד אותו - אני חייב להודות שהוא הצליח לחדש לי כמה דברים ובעיקר לעשות לי סדר בתחום.
הנה עיקרי הדברים:
הנושא הראשון שהוא התייחס אליו, וזה משהו שאני גם מתייחס אליו בסדנאות
הוא שצריך לעשות הפרדה בין פרומפטים שכותבים לצ’אט ("Conversational prompting") לבין פרומפטים שכותבים כחלק ממוצר (Product Focused Prompting)
ההבדל המרכזי ביניהם הוא שבצ’אט אנחנו יכולים להמשיך את השיחה, או לחזור ולערוך את הצ’אט,
ולעומת זאת - אם זה פרומפט שנכתב עבור קריאת API כחלק ממוצר אנחנו חייבים שהפרומפט יעבוד תמיד, באופן אמין ובסקייל גבוה ויש הרבה יותר חשיבות לדיוק וחידוד שלו.
אחת הטעויות הנפוצות היא שמנסים ליישם טכניקות של מורכבות של הנדסת פרומפטים על הצ’אט וברוב המקרים זה אובר-קיל כי אפשר לעשות תהליך איטרטיבי יותר.
נושא נוסף שהוא דיבר עליו - זה הנושא של Role prompting, הקטע של לתת לצ׳אט תפקיד (למשל: ״אתה פרופסור מומחה למתמטיקה")
השורה התחתונה, והדיי מפתיעה, היא שהטכניקה הזו כבר לא רלוונטית עם המודלים שאנחנו עובדים איתם כיום.
בעבר, ב-GPT-3.5, זה אולי היה משמעותי, אבל במודלים הנוכחיים זה לא משפר את התוצאות, או לפחות אין מחקרים שמוכיחים את זה (צפו בקטע המלא בסרטון)
מתי זה כן רלוונטי? בכתיבה יצירתית. אם רוצים לכתוב בלוג או פוסט עם סגנון מסוים אז הגיוני לתת לו תפקיד.
אז איזה שיטות הנדסת פרומפטים כן עובדות?
לפי סאנדר, אלו 5 השיטות הכי אפקטיביות (כולן מגובות במחקרים):
1. Few-shot - להוסיף לפרומפט דוגמאות למשימה שהצ׳אט צריך לבצע, עדיף בפורמט של שאלות ותשובות (הסיבה היא שהמודלים אומנו באופן הזה מלכתחילה)
2. Decomposition - להוסיף שלב מקדים בו אנחנו מבקשים מהמודל לנסות להבין אילו בעיות הוא צריך לפתור *לפני* שהוא מבצע את המשימה. שימו לב שזה שונה מ-Chain of Thought שמתייחס לתיאור השלבים של הפתרון.
3. Self-criticism - אחרי שהמודל ביצע משימה, לבקש ממנו לעבור על התשובה שלו בצורה ביקורתית ולשפר אותה. אפשר לחזור על זה 1-3 פעמים, לא יותר מזה.
4.לתת ה-מ-ו-ן קונטקסט - זו לא בדיוק טכניקה, אבל ככל שתוסיפו יותר מידע רלוונטי על הנושא שאתם מנסים לפתור, ככה התשובה תשתפר.
הנקודה שהוא חידד לי זה שאי אפשר לדעת איזה חלק מהקונטקסט הכי משפיע, אז עדיף פשוט לתת כמה שיותר. הוא גם ממליץ להוסיף את הקונטקסט בתחילת הפרומפט ולא בסוף, כדי למנוע מצב שהמודל "ישכח" את השאלה המקורית.
5. Mixture of Experts - זו שיטה יחסית מתקדמת: שולחים את אותה השאלה לכמה צ׳אטים שונים (יכול להיות עם אותו המודל עם פרומפט שונה או מודלים שונים) ואז מבקשים ממנו למצוא מה חוזר על עצמו בכולם.
החלק השני של הפודקאסט גם מרתק ומדבר על Prompt Injection אבל זה כבר נשאיר לפוסט נפרד.
הנה הפרק - ממליץ לצפות ב-40 דקות הראשונות:
קלוד בתוך קלוד
Anthropic שדרגו אתמול את Artifacts עם שתי יכולות חדשות:
1. מרקטפלייס לשיתוף Artifacts שנבנים בתוך Claude - כולל אפשרות ל-Remix, כלומר לקחת אפליקציה קיימת ולהמשיך לפתח אותה.
2. הוספת יכולות AI בתוך האפליקציות שנבנות ב-Claude - ללא צורך במפתח API חיצוני (כמו שיש בבייס 44). הקרדיטים של השימוש יחושבו על חשבון קלוד של מי שמשתמש באפליקציה ולא מי שבנה אותה.
בסרטון - השתמשתי ביכולת הזו כדי ליצור את הצ׳אט של Claude בתוך Claude - כאשר המוצר שיצרתי משתמש ב-API מאחורי הקלעים ומייצר לי Dad Jokes.
כמה מחשבות שעלו לי בנושא:
1. גם השחרור ב-Claude Code לכל המשתמשים וגם המהלך הזה מראים שהם לא מתכוונים לוותר על ה-B2C בקלות.
להערכתי, השלב הבא יהיה השקת כלי Vibe Coding משלהם, שיכול להוות תחרות משמעותית לעשרות הכלים שקמו על ה-API שלהם כמו Lovable, Bolt וכו׳.
2. במובן מסוים, הם בונים חנות אפליקציות סגורה בתוך האקוסיסטם של Claude, וזה יכול להתפתח לכיוונים מעניינים.
הרעיון של מרקטפלייס שאפשר לשתף ולעשות Remix הוא מאד מעניין - מזכיר קצת את עולם הקוד הפתוח,
רוצים לבנות CRM לעצמכם? תמצאו Artifact שמישהו כבר בנה ורק תתאימו אותו אליכם.
אגב, גם Google הולכת בכיוון דומה עם Google AI Studio ויהיו מעניין לראות איך זה מתפתח והאם זה תופס.
שתי היכולות האלה כבר זמינות - גם בישראל.
הפיצ’ר שהכי חיכיתי לו מגיע לפיגמה
בשבוע שעבר כתבתי כאן על Magic Patterns, שמאפשרים ליצור קומפוננטות לשימוש חוזר כדי לשפר את תהליך הפרוטוטייפיניג - ובסיום הפוסט המלצתי לחכות ולראות מה פיגמה מתכננים,
אז הנה זה מתחיל לקרות.
אתמול פיגמה הוציאה את הצעד הראשון לפיצ’ר שהכי חיכיתי לו - חיבור הדיזיין סיסטם ל-Figma Make.
איך זה עובד?
בשונה מ-Magic Patterns שיוצרים ממש קומפוננטות, פיגמה הלכה (בינתיים) על גישה שונה:
הם הוסיפו תהליך שמנתח את הדיזיין סיסטם ומפיק ממנו ספריית קוד שמתארת את הפונטים, הצבעים והסטיילינג – במטרה לשחזר את ה־Look & Feel של המוצר.
בנוסף - אפשר להוסיף הנחיות וחוקים בקובץ נפרד, כדי להתאים את הספרייה לעיצוב הארגוני שלכם.
חשוב להגיד - זה עדיין לא הפתרון אידאלי כי הוא לא ממש מדוייק ברמת הפיקסל, אבל זה לגמרי Quick win וצעד חשוב בכיוון הנכון,
ממה שאני מבין, מדובר בפתרון ביניים לקראת מהלך רחב יותר שהם עובדים עליו - וכבר עכשיו הוא משדרג את תהליך העבודה ומאפשר לבנות פרוטוטייפים שנראים הרבה יותר דומים למוצר הסופי.
בסרטון: לקחתי את הפיצ’ר החדש לסיבוב עם דיזיין סיסטם לא רשמי של טוויטר מה-Community של פיגמה, ויצרתי עיצוב לפיצ’ר חדש של Twitter Marketplace
איך משתמשים:
1. בתפריט הראשי בוחרים Publish Library
2.אחרי הפרסום יופיע כפתור Export to Make
3.בתוך Figma Make: נפתח כפתור חדש לבחירת ספריית עיצוב - ברגע שיצרתם פעם אחת זה זמין לכל העובדים בארגון.
עוד עדכונים מהשבוע:
מנוע החיפוש Perplexity זמין גם בווטסאפ ומאפשר לייצר תמונות ומעכשיו גם להוסיף תזכורות. היכולת של תזכורות קיימת גם בממשק ה-Web וגם ב-ChatGPT אבל הם הראשונים שמוספים אותה בבוט בווסטאפ. תוכלו למשל לבקש ממנו שישלח לכם סיכום של החדשות רק מהאתרים שאתם אוהבים לקרוא בצורה מאורגנת ורלוונטית אליכם.
איך משתמשים?
מוסיפים את המספר שלהם בווטסאפ 1833436285+, שולחים הודעה ועוקבים אחרי ההנחיות לחיבור לחשבון שלכם.
חברת ElevenLabs משיקה עוזר קולי חדש בשם ai.11 - מה שמיוחד בו זה שהוא מחובר עם MCP לכל האפליקציות המובילות ותפקד כמו עוזר אישי. לא ניסיתי עדיין אבל קראתי ביקורות נלהבות.
גוגל משיקה את Gemini CLI - סוכן AI למפתחים בקוד פתוח. לעוד פרטים.
הבינה האמנותית: הקליפ הזה נוצר ב-100% בינה מלאכותית: מידג׳רני, Suno.
עד כן להיום!
למצטרפים החדשים, אני מזכיר שתוכלו לקרוא את כל המהדורות הקודמות שפספסתם בבלוג.
כרגיל - אני מזמין אתכם לשתף עם חברים ועם אנשים שהתוכן הזה יכול לעניין אותם.
מוזמנים גם לשתף בקבוצות ווטסאפ מקצועיות ובערוץ הסלאק בעבודה.
שיהיה סופשבוע שקט,
אמיתי
ואוו המים עם הסוס מעולה 😂
אתה יכול עוד כמה מילים על העריכה של הארטיפקד ומה שעשית שם? לא כל כך ברור לי המעבר מהמסך של הone pager שעשית לו customize לצ׳אט שכותב dad jokes