דירוג אתרים ע"י גוגל – המסמך המודלף

על מה הרעש?

לא בפעם הראשונה, ובאופן מעורר תמיהה ב 30 למרץ 2011 הודלף מסמך מפורט בן 125 עמודים בו מפורטות הנחיות לבדיקת איכות ידנית של דפי אינטרנט. המסמך נועד לצורך בקרת איכות על עבודת האלגוריתם של גוגל.

זה אמיתי?

ניתן היה לחשוב שמדובר באיזשהי מלכודת קישורים, או משהו בסגנון, אבל הרצינות והיסודיות של המסמך וכן העובדה שהוא נראה על הדומיין של גוגל נותנים לו אמינות גבוהה בעיני ובעיני אחרים.
מה שבהחלט יתכן הוא שגוגל הדליפו את הדף בכוונה מסיבות שונות…

מה במסמך?

1. קווים מנחים לדירוג
2. דירוג עבור חיפוש מקומי
3.דוגמאות לדירוג
4.הנחיות לסימון דפי ספ-אם
5.שימוש בכלי לדירוג
6-7. תקצירים

נקודות מעניינות:

1. דירוג דף

– הדירוג ניתן לכל דף בנפרד (ולא לאתר).
– הדירוג כולל אך ורק את התוכן שבשליטת הווב מסטר, ולא יכלול פרסומות.
– יש חשיבות לרלוונטיות לביטוי החיפוש ולשימושיות של הדף.
– נעשה מאמץ להבין את כוונת המחפש בגוגל, מה באמת הוא רוצה למצוא, לדוגמה עבור הביטוי פוטבול באנגלית, יש הבדל אם החיפוש נעשה בארצות הברית או באנגליה. בכלל יש משקל רב למיקום ולשפה.
– ביטויי חיפוש שונים יביאו לסוגים שונים של תוצאות, לדוגמה: עבור ביטוי קשה להבנה הגדרת מילון או אנציקלופדיה תקבל דירוג גבוה. ביטויים מסוימים דורשים תוצאות עדכניות (תוצאות משחקי ליגה), לעומת ביטויים אחרים בהם רק תוצאות ישנות הינן בעלות ערך (אוכלובית צרפת ב 1813)

2. מה זה ספאם

כל מה שנועד להונות את מנוע החיפוש מוגדר כספאם. דפי ספאם בד"כ כמעט ולא יכילו מידע שימושי

3. איך לגלות ספאם

שימוש ב ctrl-A לזיהוי טקסט חבוי
שימוש ב Firefox Addon שמנטרל CSS ו Java Scripts.
בדיקת הקוד של הדף

4. תוכן כפול

דף שמכיל RSS בלבד לא נחשב ספאם לעומת דף שמכיל תוכן מועתק מוויקיפדיה שהוא כן ספאם.
מתייחסים ומחפשים דפים שהתוכן זהה והשוני הוא רק בתבנית ובהטייה של מילת המפתח.

5. Expired Domains

יש התייחסות נרחבת לדומיינים וותיקים בעלי מערך קישורים נרחב, שעושים בהם שימוש לצורך קידום

דברים שנבדקים בהקשר זה הם: קישורים קנויים, חוסר קשר בין הדומיין המקורי לנושא האתר ובדיקת ה Archive של האתר.

אשמח לתובנות ותגובות שלכם!

9 תגובות בנושא “דירוג אתרים ע"י גוגל – המסמך המודלף

  1. הי אורי
    כל הכבוד על הפוסט
    לגבי דומיינים פגי תוקף – האם הכוונה היא שבאופן ידני יבדקו כל דומיין בכדי לדעת אם בעבר היה שם אתר בנושא אחר? זה נראה לא הגיוני.

    בכלל כל הרעיון של דירוג ידני ברשת של מיליארדי דפים נראה לא הגיוני

  2. תודה נדב,
    הכוונה כאן היא לא להחליף את האלגוריתם אלא לבצע בקרת איכות, כלומר להשוות את תוצאות האלגוריתם לדירוג האנושי עבור מספר דפים מצומצם ולפי תוצאות ההשוואה להעריך את איכות האלגוריתם

  3. גוגל לא "מדליפים" דברים בטעות, זה בטוח
    כל הבאזז המשוגע הזה על דברים שאנחנו יודעים ותמיד ידענו, אבל מה – בעל עסק שרוצה לקדם את האתר שלו, בטוח יתקל במסמך, ואולי הסיכוי שלו לעשות ספאם – קטן יותר:)
    בקרת איכות בהפוך על הפוך
    מבחינתי, גוגל סתם מתחילים להלחץ מול מאסות הספאם המטורפות – קשה להם להתמודד עם זה, וכל האמצעים כשרים:)
    סחתיין על עבודת התרגום + סיכום!

    1. תודה אופיר על התגובה ועל הפירגון 🙂
      תשמע, תמיד יש פרצות!
      זה לא גוגל שמדליפים, אלא איזה עובד זוטר בחוסר תשומת לב…
      יחד עם זה אני בהחלט לא שולל את האפשרות שזה ספין של גוגל

  4. אורי שלום 🙂 תודה על המידע

    עדיין לא קראתי את כל המסמך אך נראה לי שהוא לא הולך "לזעזע" ולהמציא את הגלגל. (ככה בכל אופן הוא נראה בתחילתו).

    לדעתי גוגל הדליפו את זה במכוון, מאותן הסיבות שאמר אופיר.

  5. וואו, איך אני מוריד את המסמך והאם יש תרגום מלא לעברית?
    נשמע שיש שם הרבה מידע איכותי

  6. נושא איכות האתרים בגוגל במיוחד לאור שינויי פנדה האחרונים הפך לאחד מעמודי התווך של קידום האתרים כיום, גוגל נלחם בכמות הזבל בעיקר על ידי גריעת אתרים שלמים של תוכן כמו בלוגים והסרתם מהתוצאות כליל.
    בחו"ל גוגל מגייסת אלפי עבודים שהמטרה שלהם הינה אחת לבדוק אתרים בצורה ידנית וזאת על מנת להגיע לתוצאות איכותיות יותר, המסמך הנ"ל הינו חלק מלימוד אותו כוח איך להעריך איכות של אתר.

    1. הי עמנואל,
      מסכים איתך, לפחות הרוב המכריע הוא זיהוי ספאם
      מסתבר שזה חלק מכריע מההתמודדות של מנוע חיפוש

להשאיר תגובה

הזינו את פרטיכם בטופס, או לחצו על אחד מהאייקונים כדי להשתמש בחשבון קיים:

הלוגו של WordPress.com

אתה מגיב באמצעות חשבון WordPress.com שלך. לצאת מהמערכת /  לשנות )

תמונת Twitter

אתה מגיב באמצעות חשבון Twitter שלך. לצאת מהמערכת /  לשנות )

תמונת Facebook

אתה מגיב באמצעות חשבון Facebook שלך. לצאת מהמערכת /  לשנות )

מתחבר ל-%s