فهم محركات البحث وأنواعها
يتردد مفهوم محرك البحث مع جوجل، وهي واحدة من أقوى وسائط البحث على الويب والأكثر استخدام، يعرض أي استعلام يتم كتابته في شريط بحث جوجل المئات من صفحات الويب ومع ذلك، فإن الحقيقة الأقل شهرة هي أن التكنولوجيا التي تدعم قدرة جوجل مُذهلة، ويتبع الأسلوب التقليدي للاستعلام في مربع البحث ما يلي:
- البحث من خلال قاعدة بيانات محرك البحث.
- تحديد صفحات الويب ذات الصلة.
- عرض صفحة نتائج محرك البحث (SERP).
تسعى جميع محركات البحث إلى تقديم خدمة توصيل الصفحات ذات الصلة من شبكة الويب العالمية، لكن الطريقة التي يتم بها إنشاء القوائم تختلف بناءاً على نوع محرك البحث والخوارزميات المستخدمة، إن الأنواع الرئيسية لمحركات البحث وكيفية عملها هي:
محرك البحث الزاحف:
وتحتوي محركات البحث هذه على ثلاثة مكونات أساسية بشكل عام:
- الزاحف أو العنكبوت: العناكب هي وكلاء برامج أو روبوتات يتم نشرها للتنقل عبر الويب وإنشاء قائمة من الكلمات كعبارات جنباً إلى جنب مع مكان حدوثها (URL) وهي عملية تسمى الزحف، تبدأ العناكب في الصفحات الشائعة أو الخوادم المستخدمة بكثرة وتتبع كل رابط متاح في الموقع بهذه الطريقة، تخترق العناكب الويب لتغمر قاعدة بيانات محرك البحث، وتعود العناكب إلى هذه المواقع على فترات منتظمة للبحث عن التحديثات، يتم الزحف باستمرار إلى العالم الديناميكي للويب من قبل هؤلاء للحفاظ على عمل المحركات بكفاءة.
- المفهرس: جميع المعلومات التي يتم استرجاعها من قبل العناكب في قاعدة البيانات يتم ترميز قائمة العبارات إلى جانب عنوان URL وتنظيمها في بنية مفهومة تسمى الفهرس، إن بنية البيانات المستخدمة بشكل عام هي جدول مُجزأ أو فهرس مقلوب، يتسم هيكل بيانات الفهرس المقلوب بكفاءة في الاستعلامات القائمة على الكلمات الرئيسية ويجعل استرجاع المعلومات مناسب، مثله مثل الفهرس الموجود في نهاية معظم الكتب المدرسية، وهكذا يقوم المفهرس بتخزين الكلمات مع حالة حدوثها في مواقع وأوزان مختلفة مخصصة (على سبيل المثال بناءاً على تكرار الحدوث) في هيكل منظم جاهز للاسترجاع.
- معالج الاستعلام: يقبل هذا المكون الأخير الاستعلام الخاص بالبحث ويبحث من خلال ملايين الإدخالات في الفهرس للعثور على التطابقات ذات الصلة، تستخدم محركات البحث تقنيات حسابية مختلفة لتحديد مدى ملاءمة الصفحات المختلفة التي يتم ترتيبها بعد ذلك استناداً إلى خوارزميات ترتيب الصفحة ويتم تقديمها في النهاية للمستخدم، يعتمد نظام الترتيب الذي تستخدمه الخوارزميات على عوامل مختلفة تعتمد على الاستعلام (مثل تكرار عدد الكلمات ولغة المستند والموقع الجغرافي) وعوامل مستقلة للاستعلام (مثل شعبية المستند وجودة المستند)، يتكون SERP النهائي من كل من نتائج البحث التي تمت معالجتها ونتائج البحث المدفوعة وتندرج محركات Bing وYahoo وBaidu وYandex وDuckDuckGo وAOL وAsk جميعها ضمن هذه الفئة من محركات البحث.
الدلائل التي تعمل بالطاقة البشرية:
بعد ذلك، لدينا عمليات قائمة على الدليل حيث يتم تنظيم روابط الويب في كتالوجات أو أدلة الموضوع، مثل الفهرس الأمامي في الكتاب المدرسي، على عكس الأتمتة التقليدية، يُسخّر هذا المحرك القوة البشرية لهذا التصنيف، يتم البحث في هذا الدليل، الذي تم إنشاؤه من مواقع الويب والأوصاف القصيرة، في مُعظم الحالات، يبحث الشخص الفعلي من خلال مواقع الويب الحالية ويراجعها ويضيفها إلى الدليل مع الوصف، يتم تصنيف الصفحات المختلفة في مواضيع لإنشاء هيكل هرمي مع تجميع صفحات متشابهة معاً تحت نفس الموضوع وتصنيفها بناءاً على العلاقة هذه، يتم إرجاع استعلام بحث المستخدم مع قائمة بالوصف الأكثر ملاءمة والمقصود من هذا الدليل، إلى جانب نتائج البحث في الدليل، تتضمن القائمة النهائية نتائج مدفوعة بالإضافة إلى تصنيفها مرة أخرى، يتم تجنب أي اختلافات في الصلة حيث تحدد فرقة العمل المخصصة القائمة على الإنسان نتائج الويب بدلاً من الخوارزميات المعقدة، ينصب التركيز هنا على أهمية الاستجابة حيث أن طلب البحث يقتصر على صفحات الويب بدلاً من المحركات التقليدية، التي تُرجع آلاف صفحات الويب لاستعلام معين وينتمي الدليل المفتوح وLookSmart وChacha وMahalo وحتى Yahoo في مرحلة ما إلى هذه المجموعة من محركات البحث.
محرك بحث هجين:
كلتا تقنيات محرك البحث الموصوفة أعلاه تتعارض في أدائها ولكل منها فوائده الخاصة، يعمل محرك البحث المعتمد على الزاحف بشكل جيد مع استعلامات مُحددة ولكنه ليس فعالاً في توفير النتائج ذات الصلة في حالة الاستعلامات العامة، ومع ذلك، يوفر الدليل البشري نتائج أفضل في حالة الاستعلامات العامة ولكنه غير قادر على تقديم نفس الكفاءة في حالة الاستعلامات المحددة، وبالتالي فإن محرك البحث المختلط (الهجين) كما يوحي الاسم يجمع بين كل من محرك البحث المستند إلى الزاحف ونتائج الدليل وتستخدم Yahoo وMSN وGoogle هذه التقنية لعرض نتائج البحث الخاصة بهم.
محرك بحث Meta:
تأخذ هذه النتائج جميع محركات البحث الأخرى وتدمجها لإنشاء قائمة أكبر من النتائج، من خلال جمع النتائج في وقت واحد من فهارس محركات البحث التابعة لجهات خارجية، تجمع هذه المحركات مجموعة كبيرة من الصفحات، تتم معالجة هذه النتائج وتصنيفها وتقديمها للمستخدم، ومع ذلك، فإن عدد النتائج لاستعلام معين بهذه الطريقة بعد إزالة التكرار قليل ولا يلبي تماماً متطلبات المستخدم وتعد Dogpile وMetaseek و Savvysearch أمثلة قليلة لمحركات البحث Meta.
إلى جانب محركات البحث المذكورة أعلاه، تحاول أنواع أخرى من تقنيات البحث جذب انتباه المستخدم مثل WolframAlpha “محرك البحث الحسابي” وSwoogle “محرك البحث الدلالي” مع النطاق الهائل لشبكة الويب العالمية، فإن محركات البحث تتجه باستمرار لتقديم استجابات فورية وخالية من المتاعب وذات صلة لاستفساراتنا المستمرة.