عبارتی را در گوگل جستجو کنید، و بوم ، نتایج خیلی خوبی در کمتر از ۱-۲ ثانیه برای شما نمایش داده میشود! چنین سرعتی در جستجوی این همه مطلب که در وب موجوده، واقعا شگفتانگیزه؛ مخصوصا وقتی سرعت سایر اتفاقا در وب رو میبینیم.
گوگل چطور این قدر سریع تمام وب رو جستجو میکنه؟ الگوریتم پایهی این جستجو چی هست که بهش سرعت میده؟ قدرت و کیفیت این الگوریتم چطوری تامین میشه؟
وب قبل از جستجوی ما توسط گوگل جستجو شده(crawl)، صفحات ذخیره و رنک بندی شده. موقع جستجوی ما گوگل فقط به دیتابیس خودش مراجعه میکنه. حالت ساده شده داستان همینه. اگه جزئیات بیشتر میخواید (مثلا اینهمه صفحه تو وب چطور تو دیتابیس گوگل ذخیره شده؟!) باید مبحث تکست ماینینگ رو مطالعه کنید(تو کورس های خارجی Information retrieval).
بصورت خلاصه و ساده بخوام بگم اینه که یه دیکشنری از کلمات درست میشه و فایلها(صفحات وب) ایندکس میشن. و موتور جستجو یه جدول از کلمات_صفحات وب_ تعداد تکرار کلمات در صفحه ذخیره میکنه و رنک اولیه به صفحات میده. و رفته رفته براساس فیدبکی که از کاربرا میگیره رنک رو اصلاح میکنه.
(البته خیلی ساده توضیح دادم و مثلا رنک بندی بر اساس فقط تعداد تکرار کلمات تو صفحه نیست و فقط خواستم مفهوم رو برسونم)
من فکر میکنم وقتی در حال تایپ کلمات کلیدی داخل کادر جستجوی گوگل هستیم اون داره بین صفحات ایندکس شده میگرده و قبل از فشردن دکمهی Search اون کار خودشو کرده
و با زدن Search فقط اونارو نشون میده