איך ChatGPT מוצא מקורות?
רוב הזמן תשובות “מהזיכרון” בלבד
- ברירת המחדל של ChatGPT היא לענות בלי להשתמש באינטרנט.
- הוא משתמש בידע שנלמד מראש (במהלך האימון).
- חיפוש באינטרנט מופעל רק בתנאים מאוד ברורים.
אם המידע קיים בזיכרון של המודל לא יתבצע חיפוש.
דוגמה:
אתה שואל: “מהי בירת צרפת?”
המודל לא יבדוק בגוגל, הוא יודע שזה פריז.
מתי ChatGPT כן מחפש באינטרנט?
המערכת תפעיל את כלי החיפוש (web) רק באחד מהמקרים האלו:
| תרחיש | דוגמה | הסבר |
| עובדות בזמן אמת | "מה התוצאה עכשיו?" | מידע שמשתנה מרגע לרגע – דורש חיפוש חי. |
| בקשות לפי מיקום | "בתי קפה ליד מגדל אייפל" | צריך מידע לוקאלי ו/או מיקום גאוגרפי. |
| נושאים נישתיים / נדירים | "מאמר מחקר חדש", "לוח משחקים של קבוצת נוער" | ייתכן שהמידע הזה לא הופיע כלל במהלך האימון. |
| מניעת נזק ממידע ישן | "איך מתקינים גרסה עדכנית של ספריית קוד?" | מידע לא עדכני עלול לגרום לתקלות. |
📌 כל דבר שלא נופל בקטגוריות האלה ייענה מתוך הזיכרון של המודל.
איך עובד כלי החיפוש (web)?
כאשר מופעל חיפוש – הוא פועל לפי סט כללים מדויק:
- עד 5 שאילתות שונות נשלחות במקביל (parallel queries).
- מילים חשובות מסומנות ב־+ כדי להדגיש אותן למנוע החיפוש.
- כל שאילתה מקבלת ציון של "Query Deserved Freshness" (QDF):
- –QDF=0: מידע שאינו רגיש לזמן (כמו רדיוס כדור הארץ)
- –QDF=5: מידע שדורש עדכניות (כמו תחזית מזג אוויר)
- –QDF=0: מידע שאינו רגיש לזמן (כמו רדיוס כדור הארץ)
חיפוש בשפות:
אם השאלה לא באנגלית, נשלחת שאילתה גם באנגלית וגם בשפת המשתמש כדי להגדיל את הסיכוי למצוא מקורות רלוונטיים.
למה כמעט אין קישורים בתשובות?
- אם ChatGPT לא ביצע חיפוש הוא פשוט ממציא את הקישור מתוך הזיכרון, סימבול אחר סימבול.
- לכן, קישורים כאלה לעיתים קרובות שגויים או מובילים ל־404.
- רק כאשר מופעל חיפוש חי יש סיכוי לקישור אמיתי.
מחקר עצמאי (SISTRIX) מצא:
- רק 6% מהתשובות של ChatGPT כוללות קישור אמיתי (לעומת 23% בג'מיני).
אופטימיזציה לחשיפה ב- AI (Generative AI SEO)
כדי להופיע בתשובות של ChatGPT (כשמתבצע חיפוש):
- ודא שהתוכן שלך מאונדקס בבינג, כי זה המנוע ש-ChatGPT משתמש בו.
- אם האתר שלך לא באנגלית, פרסם גם גרסה באנגלית כדי להופיע גם בשאילתות שתורגמו.
- בדוק אם ChatGPT “ממציא” קישורים לאתר שלך ואז הפנה אותם ב־301 לכתובות נכונות.
- שתול את שם המותג שלך במקורות שידועים שנכנסים לדאטה העתידי של מודלים (LLMs).