איך ומתי להשתמש במודל החדש

וגם: ליצור דיאגרמות עם קלוד בשניות, הזזת אובייקט בוידאו, אימון מודל של עצמכם ועוד עדכונים

Sep 19, 2024

אהלן חברים,

כאן אמיתי בונה עם הניוזלטר השבועי בנושא AI ופרודוקטיביות והשבוע בתוכנית:

איך ומתי להשתמש במודל החדש GPT-o1?
איך ליצור דיאגרמות ו-Wireframes שניתן להעתיק לפיגמה בשניות.
שווה להכיר: גרסה חדשה למחולל הוידאו Kling עם יכולות הזזת אובייקטים בתוך הוידאו.
נסו בעצמכם: לאמן מודל על תמונות שלכם או על המותג שלכם (עם הטבה שווה שתאפשר לכם לעשות את זה בחינם).
עוד עדכונים שלא הספקתי לכתוב עליהם.

*אם זו הפעם ראשונה שלכם פה תוכלו למצוא את כל הפרסומים הקודמים לקריאה כבלוג בקישור הזה.

**בחלק מהמכשירים הטקסט בעברית לא מיושר. במצב כזה אני ממליץ לקרוא בגרסת הWeb על ידי לחיצה על ה-Header בראש האימייל או דרך הבלוג.

איך ומתי להשתמש במודל החדש GPT-o1?

בשבוע שעבר עידכנתי על השקת מודל החדש והחכם o1. אם אתם מנויים ל-ChatGPT, בטח שמתם לב שביום חמישי נוספה לכם האפשרות לעבוד איתו בצ’אט.

נכון להיום, הוא המודל הטוב ביותר שקיים בשוק: פותר מבחנים של דוקטורנטים, חידות הגיון מורכבות אפילו מצליח לספור כמה פעמים האות "r" מופיעה במילה Strawberry.

אבל מתי כדאי להשתמש בו?

נתחיל מהסבר קצר אופן הפעולה שלו:

למרות שחוץ מהעובדים ב-OpenAI אף אחד לא יודע איך הוא עובד ואיך אימנו אותו, אנחנו כן יודעים שהסיבה שהוא מגיע לביצועים האלה היא שהוא "חושב" יותר זמן לפני שהוא עונה.

כלומר - הוא מפרק כל משימה לתתי משימות, (ניתן לראות את המשימות נכתבות בזמן אמת תוך כדי שהוא "חושב") ובסוף מחבר את הכל ביחד ונותן לנו תשובה יותר מקיפה, חכמה ומדוייקת.

הקונספט הזה מזכיר מאד את שיטת הנדסת הפרומפטים Chain of thoughts, בה אנחנו מתארים למודל את השלבים לפתרון הבעיה או פשוט מבקשים ממנו שיחשוב step by step. אבל הפעם העיקרון הזה ממומש ברמת המודל בצורה עמוקה יותר.

זו גם הסיבה ש-OpenAI הוציאו הנחיות מיוחדת לכתיבת פרומפטים למודל הזה שהן הפוכות לחלוטין הההנחיות שאנחנו מכירים לכתיבת פרומפטים:

לכתוב לו פרומפטים פשוטים וקצרים.
*לא* לבקש שיעשה Cot או שיחשוב step by step.
לא להעמיס עליו כמויות גדולות של מידע.

בנוסף, מכיוון שהמודל צורך המון כוח מחשוב הם הגבילו את השימוש בו. כל משתמש מוגבל ל-50 פרומפטים בשבוע ולעוד 50 פרומפטים ליום במודל o1-mini (שפועל באותו אופן אבל פחות חכם).

אני לא יודע מה איתכם, אבל אצלי 50 פרומפטים נגמרים עוד לפני ארוחת הבוקר ולכן אני מוצא את עצמי בהתלבטות תמידית האם להשתמש במודל החזק או שאולי מספיק לי מודל הרגיל של GPT4o.

למעשה, המגבלה הזו מצריכה מאיתנו כמשתמשים להתחיל להיות מתוכננים ולגבש אסטרטגיית שימוש במודל הזה.

לפי מה ש-OpenAI אומרים הוא טוב למשימות מורכבות,

אבל איך מחליטים האם המשימה שלנו מספיק מורכבת בשביל "לבזבז" עליה את הקרדיטים של o1?

למרות שחפרתי בטוויטר כדי למצוא רעיונות לשימושים פרקטיים ש-o1 מצליח לעשות טוב יותר מהמודלים האחרים, הדוגמאות שמצאתי היו חידות הגיון , בעיות מתמטיות, כתיבת קוד ובניית משחקים.

הדוגמאות האלה אמנם ממחישות את היכולות הגבוהות שלו, אבל לרוב המשתמשים הן לא פרקטיות.

בשורה התחתונה, עדיין לא מצאתי תשובה לשאלה שהכי מעסיקה אותי:

מהם ה-Superpowers החדשים שנוספו לסל הכלים שלנו בזכות המודל הזה?

בגלל מגבלת הפרומפטים, לא יכולתי לערוך השוואה או בחינה מעמיקה שלו ולכן לצערי אין לי תשובות מאד מבוססות או דאטה בנושא.

אני כן יכול לשתף בכמה תובנות אנקדוטליות למשימות שאני מצאתי שהוא טוב בהן:

סיעור מוחות ויצירתיות: לתת לו לחשוב על רעיונות חדשים: למוצרים, לפיצ'רים, לתוכן, קמפיינים שיווקיים וכו'.

התייעצות וחשיבה אסטרטגית: פתרון בעיות מורכבות הקשורות לאסטרטגיה כמו תכנון, תיעדוף, טרייד אופים, רעיונות לשיפור ועוד.

כתיבת קוד: זה השימוש הכי מוכח שבו יש לו יתרון ברור, אבל בגלל מגבלות השימוש כנראה שתצטרכו להשתמש בו רק למשימות המורכבות של הפרוייקט ובמקביל לעבוד גם עם קלוד.

אסטרטגיה מעניינית נוספת שאני מנסה ליישם היא להתחיל את השיחה עם GPT4o כדי להארגן את המחשבות ולתת קונקטסט ואז להחליף לo1 (באותה השיחה) כדי להגיע לתובנות מעמיקות יותר. זה מרגיש לי נכון, אבל אני עדיין מתנסה עם זה.

לסיום - אשמח מאד לשמוע מכם בתגובות: לאיזה משימות מצאתם את o1 שימושי במיוחד?

פיצ’ר ניסיוני: ביקשתי מNotebookLM להפוך את המאמר הזה לפודקאסט, אם בא לכם להקשיב ולתת פידבק אשמח לשמוע:

0:00

-7:57

איך ליצור דיאגרמות ו-Wireframes שניתן להעתיק לפיגמה בשניות.

בהמשך לבלוג מהשבוע שעבר בו הראיתי איך קלוד יכול ליצור קומפוננטות, מצאתי עוד דרך מעולה שאפשר להיעזר בו לתהליך האפיון והפעם כדי לייצר תרשימים של User flow ו-Wireframes שניתן להעתיק לפיגמה תוך שניות.

בשונה מהשיטה הקודמת, הפעם אין צורך בתוספים. ה"טריק" הוא שקלוד יודע לכתוב קוד svg שאותו ניתן להעתיק לפיגמה ב-copy-paste רגיל ולהמשיך לערוך שם.

בסרטון ביקשתי ממנו ליצור דיאגרמה של אפליקציה להחלפת בתים ולאחר מכן שיעצב wireframes ראשוני של המסכים ואת העיצובים שלו העתקתי לפיגמה.

זה אמנם רחוק מלהיות מושלם, אבל לגמרי חוסך זמן ופותר את בעיית ה-Cold Start שלפעמים נתקלים בה כשניגשים למשימות מהסוג הזה.

איך עושים? הכי פשוט בעולם.

פשוט מסבירים לקלוד את סוג המוצר, לתוצאה מדוייקת יותר מומלץ גם ממש להגיד לו את סדר המסכים ומה הם כוללים, ובסוף פרומפט תכתבו שיעשה את זה ב-svg או באופן שניתן להעתיק לפיגמה.

עוד טיפ קטן לסיום: את היכולת הזו גיליתי תוך כדי עבודה כשהייתי צריך ליצור Wireframes לאפליקציה חדשה. במקום להתחיל להסתבך בלחפש את הכלי הכי מתאים, פשוט הסברתי לקלוד מה אני צריך והוא הציע את הפתרון הזה.

בזכות היכולת שלו להציג קוד ב-Artifacts נוספו לו המון יכולות שאנחנו לא מודעים אליהם ולפעמים כל מה שצריך זה רק לבקש….

גרסה חדשה ל-Kling עם יכולות שליטה מרשימות באובייקטים בתוך הוידאו.

למרות שבתחום יצירת הוידאו Runway הפך להיות הכלי הפופולארי ביותר, בדרך כלל אני מעדיף לעבוד עם מחולל הוידאו Kling. הסיבה המרכזית היא שהוא מצליח לשמור על תווי פנים של דמויות ברמת דיוק גבוהה כשמתשמים במצב Professional וכך לשמור על רמת ריאליזם גבוהה.

אתמול הם השיקו את גרסה 1.5 שמייצרת וידאו באיכות עוד יותר גבוהה וגם פיצ’ר מאד שימושי שמאפשר לשלוט בתנועה של אובייקטים בתוך הוידאו.

כך זה נראה:

זו יכולת מאד מרשימה שתאפשר לעשות דברים הרבה יותר מדוייקים בסרטונים.

איך מנסים?

כדי לנסות את הפיצ’רים האלה תצטרכו לקנות את הגרסה בתשלום. כרגע יש להם מבצע של 4$ (במקום 10$) לחודש הראשון וזה אחלה דיל למי שרוצה להתנסות.
לינק: https://klingai.com/text-to-video/new

נסו בעצמכם: לאמן מודל על התמונות שלכם או על הלוגו /מוצר שלכם + הטבה.

מה, עוד לא אימנתם המודל על התמנות שלכם?

אני יודע, זה מרגיש קצת מגלומני, אבל אם לוקחים את זה בכיף זו אחלה דרך ללמוד ולהתנסות ביכולות המדהימות של מודלי התמונות הפתוחים.

הנה תמונה שלי בחיים אלטרנטיביים כנזיר בהרי ההימלאיה בנפאל:

יאללה, רוצים גם?

אז שחר גולן האלוף הכין מדריכים מעולים לשימוש בכלי Astria לאימון מודל על התמונות שלכם וגם ארגן קופון של 10$ שיאפשר לכם לעשות את התהליך הזה ללא עלות (הקופון בתוך הסרטון).

אבל חכו, זה לא הכל!

הנה מדריך נוסף שלו שמראה איך לאמן מודל על המוצר או הלוגו שלכם. למה זה שימושי? למשל כדי לשתול אותו בכל מיני מקומות מעניינים. זה יכול להיות מאד שימושי לסרטוני שיווק, הנה למשל סרטון מגניב שגיא אגא המוכשר הכין מתוך תמונות שיצר במודל שהוא אימן על המותג קליק.

עוד כמה דברים שלא הספקתי לכתוב עליהם:

כולם מתלהבים עכשיו מפיצ’ר הפודקאסטים של NotebookLM של גוגל, אבל האמת שיש בו הרבה יכולות לא פחות טובות. היכולת הכי משמעותית שלו לדעתי זה שהוא מאפשר לנו לזרוק לתוכו המון מידע של פרוייקט ואז להשתמש ביכולות AI כמו לדבר עם הדאטה שלנו בצ’אט, לסכם, להוציא תובנות ולהנות מהיתרונות של חלון הקונטקסט הגדול של Gemini.
אם אתם רוצים להעמיק ביכולות שלו ולקבל רעיונות לדברים שאפשר לעשות איתו אני ממליץ על הוידאו של Tiago Forte, גורו הפרוקודוקטיביות ומחבר הספר Building a second brain.
חדשות טובות למשתמשי Copilot של Office 365. השבוע מיקרוסופט השיקה גרסה חדשה עם המון פיצ’רים חדשים ומעניינים למוצרי אופיס. לא יצא לי עדיין לנסות בעצמי אבל מהדמואים זה נראה שיש שם כמה יכולות מאד שימושיות כמו: להריץ פייתון בשפה חופשית בתוך אקסל כדי לבצע ניתוחים מתקדמים, בניית נרטיב למצגות ב-PowerPoint, תיעדוף המיילים ב-Inbox באאוטלוק ופיצ’ר של Catch up לשיחות ב-Teams (הפיצ’ר האחרון פותח על ידי צוות הפיתו בארץ, כבוד!).

עד כאן להיום!

כרגיל אני מזמין אתכם לשתף את הניוזלטר עם חברים שיכולים לקבל ערך ממנו.

שיהיה סופשבוע שקט ובטוח

אמיתי