דבר אלי, ג'יפיטי
העוזר הקולי החדש, איך פיתחתי מחולל תמונות ב-4 שעות, ברקוני השתלט לי על הלינקדאין ועוד עדכונים
אהלן חברים,
כאן אמיתי בונה עם הניוזלטר השבועי בנושא AI ופרודוקטיביות. השבוע בתוכנית:
העוזר הקולי החדש של ChatGPT זמין לכל המנויים, מה אפשר לעשות איתו?
איך בניתי מחולל תמונות ב-4 שעות ומה למדתי מזה?
ברקוני השתלט לי על הלינקדאין.
עוד עדכונים.
* אם העברית לא מיושרת אצלכם אני ממליץ לכם לקרוא את הניוזלטר בגרסת ה- Web דרך הבלוג.
העוזר הקולי החדש של ChatGPT זמין למנויים, מה אפשר לעשות איתו?
סוף סוף הוא כאן! העוזר האישי החדש של ChatGPT זמין לכל המשתמשים בתשלום. אחרי שניסיתי אותו קצת בעצמי אתמול, אני חייב להודות שהוא פשוט מדהים!
הנה דמו קטן שהכנתי לכם:
לפני חודש כשהוא יצא בגרסת בטא כתבתי פוסט עם מחשבות על איך הוא צפוי להשפיע עלינו כמשתמשים.
עכשיו, אחרי שניסיתי אותו, אני משוכנע אפילו יותר שמדובר בגיים צ’יינג’ר.
מה אהבתי בו?
קודם כל - את זה שהוא הופך את התקשורת עם AI להרבה יותר כיפית ומעניינת.
העובדה שהוא נשמע כמעט אנושי ומסוגל לשנות טון, קצב וחיתוך דיבור מוסיפה רגש לשיחה והופכת אותה להרבה יותר מעניינת. אין מה להשוות בין חוויית השיחה איתו למוד הקולי הישן.
בנוסף, היכולת לקטוע אותו באמצע הדיבור משדרגת את החוויה משמעותית. מבוט שמקריא טקסט - לשיחה זורמת וכיפית.
אני לגמרי רואה איך אני משלב אותו במשימות בעבודה וגם בחיים. הוא יכול להיות מעולה ללימוד של נושאים ותחומים חדשים, לימוד שפות, תהליכי חשיבה, סיעור מוחות, קואוצינג ועוד.
עכשיו שהוא זמין לכולם, אין ספק שיתגלו לנו שימושים נוספים שאפילו לא חשבנו עליהם. הנה כמה דוגמאות לדברים מפתיעים שאנשים הצליחו לגרום לו לעשות:
לספר סיפורים ילדים (עם אפקטים של חיות)
ותזכרו שכל זה רק עם קול, עוד לפני שהוא קיבל עיניים לראות. ברגע שהפיצ’ר של המצלמה יעבוד זה יפתח עוד עולם שלם יוז קייסים מעניינים.
הנה הפרטים הטכניים שאתם צריכים לדעת:
זמין לכל משתמשי Pro ו-Temas, באפליקציה בלבד.
עובד מעולה באנגלית ולא רע בכלל בעברית.
משתמש במודל GPT4o, כרגע לא עובד עם המודל החדש o1.
שומר את התמלול של השיחה ביניכם כצ’אט שאפשר להמשיך להתכתב איתו וגם לשמוע מחדש קטעים מהשיחה.
הוא יודע לשנות את סגנון הדיבור, להחליף שפות ומבטאים.
איך מפעילים?
בפינה הימנית התחתונה למטה יופיע לכם אייקון לבן של מיקורופון.
בפעם הראשונה שתלחצו עליו יופיע לכם פופ אפ עם הסבר על הפיצ’ר ואז תוכלו לבחור איזה קול אתם רוצים לתת לו מבין 10 אופציות שונות (אפשר להחליף בהמשך). בפעמים הבאות פשוט לוחצים על האייקון של המיקרופון.
איך פיתחתי מחולל תמונות ב-4 שעות בלי לדעת לתכנת ומה למדתי מזה?
חברים, העולם השתנה, ואף אחד לא ישכנע אותי אחרת.
בסופש האחרון סוף סוף מצאתי זמן לשבת לנסות את Cursor וזה היה פשוט Mind blowing.
הצלחתי לבנות תוך 4 שעות MVP אפליקציה שמייצרת דמויות ריאליסטיות עם מודל Flux מבלי לכתוב שורת קוד אחת 🤯
מוזמנים לנסות אותה בעצמכם בלינק הזה.
כרגע יש בה את הפיצ'רים הבאים:
חיבור API למודל Flux realism (הדרך ליצור תמונות ריאליסטיות בטירוף שרוב האנשים לא מכירים).
לוגין מאובטח עם גוגל.
הגבלה ל-5 תמונות בחינם למשתמש (כי מישהו צריך לשלם על התמונות האלה...).
אפשרות להוריד תמונות.
אפשרות לראות את התמונות הקדמות שיצרתי.
איך עשיתי את זה?
רציתי להכין מדריך אבל לא הגעתי לזה השבוע, בגלל שהרבה ביקשו ניסיתי לכתוב הסבר קצר על תהליך העבודה:
התחלתי בלצפות בסרטון הזה שבו מסבירים איך לחבר את Cursor ל-Replit ואיך לעבוד עם Cursor. החיבור לא עבד לי חלק על הפעם הראשונה אבל אחרי כמה ניסינות הצלחתי לעשות את זה. נעזרתי גם בסרטון הזה.
למה זה חשוב בכלל? כי החיבור בין שני הכלים האלה מאפשר לכתוב קוד ולהעלות אותו לפרודקשן במהירות שיא ובלי התעסקות ומאפשר לעשות איטרציות ממש מהירות בזמן אמת במוצר.
בהתחלה השתמשתי בתבנית שהם סיפקו ועקבתי אחרי ההנחיות שלהם עד שבניתי אפליקציית To-Do List בסיסית בסגנון Trello. החלק היותר מורכב היה להוסיף את החיבור לדאטהבייס ולוגין, כי זה הצריך לפתוח חשבון ב-Firebase ולהעתיק את ה-Secrets משם (את כל זה הם מסבירים בסרטון).
אחרי שיצרתי את ה-Trello והבנתי איך עובדים עם Cursor, רציתי לבנות משהו שימושי באמת.
חשבתי על הרעיון של מחולל תמונות עם Flux Realism, כי ראיתי שהרבה אנשים מחפשים דרך לייצר תמונות ריאליסטיות ואין דרך נוחה להגיע למודל הזה.
כדי להתחיל את הפרוייקט פשוט כתבתי לו פרומפט ארוך שבו אני מבקש לשנות את המוצר לחלוטין (חוץ מהלוגין) מאפליקציית טרלו למחולל תמונות וגם צירפתי לו את התיעוד API של fal.ai.
באופן מפתיע, זה עבד על הפעם הראשונה!
אחר כך היתה עוד הרבה עבודה לשפר את העיצוב ולהוסיף את הפיצ’רים, אבל בניתי את זה שכבה אחרי שכבה. בשבילי, כמישהו שאף פעם לא תיכנת ולא יודע לכתוב קוד, זו היתה חוויה פשוט מטורפת.
הנה קטע של 5 דקות שהקלטתי תוך כדי התהליך שיתן לכם את התחושה של איך זה נראה בפועל:
אחרי בערך 4 שעות הגעתי לגרסה הנוכחית (השעה היתה כבר 12:30 בלילה) ולמחרת בבוקר פירסמתי פוסט עם המוצר בלינקדאין.
הפוסט מאד הצליח, אבל מה שיותר הפתיע אותי הוא שגם המוצר הצליח! בסך הכל נרשמו מעל 70 איש ואפילו קיבלתי כמה פניות מאנשים ששאלו איך קונים עוד קרדיטים :)
חשוב להבהיר - ברור לי שעד שאנשים לא הכניסו אשראי ושילמו אין כאן ולידציה אמיתית להיתכנות של המוצר ובכל מקרה זה לא הכיוון שאני מכוון אליו כרגע כי זה מצריך אינטגרציה לשירותי סליקה ודורש התעסקות.
מצד שני, אם חושבים על זה כמגנט לידים - זה מתחיל להיות הרבה יותר מעניין:
תוך פחות מ-24 שעות אספתי 70 לידים של מתעניינים סופר רלוונטיים למוצרי AI כמעט בחינם - תחשבו כמה היה עולה לי להביא לידים כאלה בערוצים אחרים כמו גוגל או פייסבוק.... אגב, העלות של יצירת כל התמונות שהמשתמשים יצרו היתה קצת יותר מ-5 דולר (שהספיקו למשהו כמו 120 תמונות). משתלם, לא?
בהמשך אני מקווה להמשיך לפתח את המוצר, יש לי כמה רעיונות כמו להוסיף כלי ליצירת פרומפטים, להוסיף מודלים נוספים.
ברקוני השתלט לי על הלינקדאין!
הכל התחיל ש-Ben Rotenberg (שהוא חבר מוכשר שגם מרצה ומלמד על AI) פיתח תוסף שמג'נרט תגובות לפוסטים בלינקדאין עם GPT.
הפיצ'ר שאהבתי במיוחד בתוסף שלו זה האפשרות להוסיף System prompt כדי להוסיף את הטאצ' האישי שלי בתגובות.
בגלל שאני עדיין מעדיף לכתוב את התגובות שלי בעצמי, ניסיתי לבדוק מה יקרה אם אהפוך אותו לברקוני... כך זה נראה:
איך עשיתי את זה?
כתבתי לו את הסיסטם פרומפט הבא:
אתה ברקוני, חייזר שהגיע מכוכב אחר ואוהב להסתלבט על בני אדם וספיצית על עובדיי הייטק.
התגובה שלך צריכה להיות צינית, מנתשאת ולהוציא את כותב התגובה טיפש על ידי להתייחס לדברים שהכותב אמר, לחכות אותם ולצחוק עליהם עם טיעונים מצחיקים.
אתה קורא לאנשים בכינוי "בני אנוש" או "חבורה של פגים" (למין זכר "פג" ולנקבה "פגית")
במקום המילה "כן" אתה אומר "באארור"
עוד ביטויים שאתה משתמש בהם:
"תסתום את הפה, למי אכפת?"
כל תגובה צריכה להסתיים ב"יום זוועה ביי"
לקראת סוף התגובה אתה מתיחס לאביתר שהוא בן אנוש שאתה יורד על כמה שהוא טיפש וסתום וגם מספר איך דברים קורים אחרת בכוכב שאתה מגיע ממנו
עוד עדכונים שלא הספקתי לכתוב עליהם:
אתמול התקיים כנס Meta Connect ומטא הצליחה להפתיע עם השקות ממש מעניינות: מודלים חדשים, עוזר אישי, פיצ’רים של AI לוידאו באינסטגרם, גרסה חדשה למשקפי Rayban וגולת הכותרת: משקפי AR חדשות בשם Orion עם יכולות פשוט מדהימות ופוטנציאל עצום. זה פורסם רק אתמול בלילה ועדיין לא הספקתי לצלול לזה לעומק אז כנראה שאכתוב על זה עוד בהמשך. בינתיים יכולים להתעדכן בשרשור הזה.
גל העזיבות בOpenAI פשוט לא נגמר. אתמול בלילה Mira Murati ה-CTO של החברה הודיעה שהיא עוזבת את החברה. אף אחד לא באמת מבין מה קורה שם מאחורי הקלעים, אבל אין ספק שיש דיסוננס עצום בין ההצלחה העסקית של החברה והחדשנות שהיא מביאה לבין הדרמות הפרסונליות שמתחשות שם וחוסר היציבות שהן משדרות כלפי חוץ.
גוגל שחררו גרסאות משודרגות של המודלים שלהם למפתחים. הם הגדילו את הזמינות של המודלים וגם הורידו את המחיר ב-50%. עוד פרטים בסרטון הזה.
סיפור מעניין מהטוויטר: עובד לשעבר של Uber הצליח לבנות אפליקציה שמכניסה 4 מיליון דולר ARR בשנה וכל זה בלי לדעת לתכנת. הנה הפוסט עם כל הסיפור והתובנות שלו.
בפינה האמנותית: אם אתם אוהבים שיווק ותוכן ויראלי, תום אורבך הוא הבן אדם לעקוב אחריו. השבוע הוא שוב שבר את האינטרנט עם הקליפ "The LinkedIn Song". פשוט תראו את הקליפ ותבינו לבד. ממליץ לכם גם לעקוב אחרי הניוזלטר שלו ב-Substack.
עד כאן להיום!
לסיום - אני מזמין אתכם לשתף את הניוזלטר עם חברים שיכולים לקבל ערך ממנו.
אמיתי
שמתי לב, שבכל המנועים ליצירת תמונות ריאליסטיות, בכל פעם שאני מבקש תמונה של גבר נאה, או יפה, הוא תמיד יהיה מזוקן. גם כשאני מוסיף במפורש מילים כמו "מגולח למשעי" או "ללא שיער פנים" תמיד הוא יהיה מזוקן
What gives ???