Το έργο των μηχανών αναζήτησης

Πολλοί webmasters και μόνο οπαδοί του surfing στο Διαδίκτυο ασχολούνται με την ερώτηση: πώς λειτουργούν οι μηχανές αναζήτησης; Βασικές αρχές των μηχανών αναζήτησης σήμερα θα εξετάσει τη Χώρα των Συμβουλίων.
Η σύγχρονη μηχανή αναζήτησης είναι ένα ολόκληρο συγκρότημα που αποτελείται από τα πιο περίπλοκα προγράμματα και αλγόριθμους που λειτουργούν με εκπληκτική ταχύτητα. Φανταστείτε, το νέο αλγόριθμος αναζήτησης Η καφεΐνη από την Google είναι σε θέση να επεξεργάζεται πληροφορίες ισοδύναμες με 3 χλμ. Φύλλων A4 σε μόλις 1 δευτερόλεπτο!
Σε όλες τις μηχανές αναζήτησης, τα συστατικά λογισμικού μπορούν να χωριστούν σε πέντε κύριες ομάδες:
- "Αράχνες"
- "Ταξιδεύοντας αράχνες"
- ευρετήρια
- βάσεων δεδομένων
- συστήματα αποτελεσμάτων
Αράχνες - αράχνες (αράχνες) - από τον αλγόριθμο της εργασίας τους μοιάζουν με προγράμματα περιήγησης, αλλά δεν έχουν οπτικά στοιχεία. Η αράχνη φορτώνει τον html κώδικα της σελίδας χρησιμοποιώντας πρωτόκολλα http.
Ένα αίτημα ρομπότ στον διακομιστή περιλαμβάνει μια εντολή"Get / path / document" και ορισμένες άλλες εντολές http request. Σε αυτό το αίτημα, η αράχνη λαμβάνει απάντηση από το διακομιστή ως ροή κειμένου που περιέχει τις πληροφορίες υπηρεσίας σχετικά με το έγγραφο και το ίδιο το έγγραφο. Η αράχνη είναι μέρος της ενότητας ευρετηρίασης για τις μηχανές αναζήτησης.
"Η Ταξιδιωτική Αράχνη" - crawler - είναι ένα άλλο στοιχείοευρετήριο. Ο ανιχνευτής περιηγείται αυτόματα σε όλους τους υπερσυνδέσμους που βρέθηκαν από την αράχνη στη σελίδα και έτσι αναζητούν έγγραφα που δεν είναι ακόμη γνωστά στη μηχανή αναζήτησης.
Ρομπότ-Ευρετήριο (indexer) λειτουργεί άμεσα με τα περιεχόμενα των σελίδων που φορτώνονται από ρομπότ αράχνης. Ο ευρετήριο κάνει μια μορφολογική, λεξικολογική ανάλυση των σελίδων, σπάζοντας τα σε ξεχωριστά τμήματα.
Βάσεις δεδομένων (βάση δεδομένων) είναι ένα ειδικό λογισμικό που έχει σχεδιαστεί για να αποθηκεύει τα ευρετήρια που συλλέγονται και ευρετηριάζονται από τα συστατικά στοιχεία.
Μηχανή αναζήτησης αποτελεσμάτων μηχανών αναζήτησης - το σύστημα για την έκδοση αποτελεσμάτων είναι ένα από τα πιο σημαντικάστοιχεία της μηχανής αναζήτησης. Είναι με το σύστημα εξόδου που αντιμετωπίζει ο τελικός χρήστης, το οποίο εισάγει το ερώτημα στη συμβολοσειρά αναζήτησης. Το σύστημα παραγωγής αποτελεσμάτων με βάση περισσότερα από διακόσια διαφορετικά κριτήρια εκτελεί την επιλογή των αποτελεσμάτων που ικανοποιούν περισσότερο τους στόχους αναζήτησης.
Ο αλγόριθμος μιας τέτοιας επιλογής ονομάζεται συνήθως αλγόριθμος ή μηχανισμό κατάταξης. Προκειμένου να αποφευχθεί η χειραγώγηση από τα webmasters να επηρεάσουν τα αποτελέσματα του θέματος, η ακριβής αλγόριθμος για την κατάταξη των μηχανών αναζήτησης φυλάσσονται με απόλυτη εχεμύθεια.
Παρ 'όλα αυτά, υπάρχουν ορισμένα γνωστά κριτήρια που λαμβάνονται υπόψη στο έργο των μηχανών αναζήτησης, βελτιστοποιώντας τις οποίες ο webmaster μπορεί να "επηρεάσει νόμιμα" τα αποτελέσματα αναζήτησης. Για παράδειγμα, Η μηχανή αναζήτησης κατά την ανάλυση της σελίδας λαμβάνει υπόψη:
- αν υπάρχει τίτλος της σελίδας (Τίτλος)
- Εμφανίζεται η λέξη-κλειδί στη διεύθυνση URL της σελίδας;
- αν υπάρχει μια λέξη-κλειδί στις κεφαλίδες H1-H6, ετικέτες STRONG, B, EM, I
- ποια είναι η πυκνότητα των λέξεων-κλειδιών στη σελίδα (Πυκνότητα)
- Η λέξη-κλειδί υπάρχει στις ετικέτες meta: λέξεις-κλειδιά, περιγραφή
- Υπάρχουν εσωτερικοί και εξωτερικοί σύνδεσμοι στη σελίδα;
Ο χρήστης αλληλεπιδρά με τη μηχανή αναζήτησης μέσω του διακομιστή αναζήτησης. Έλαβε το ερώτημα αναζήτησης από το χρήστηΟ διακομιστής επεξεργάζεται και διαβιβάζει τη μονάδα κατάταξης ως είσοδο στην παράμετρο. Με τη σειρά του, η ενότητα διεξάγει την επεξεργασία εγγράφων, πληροφορίες σχετικά με τα οποία αποθηκεύονται στη βάση δεδομένων του συστήματος αναζήτησης και βαθμολογεί τις σελίδες που αντιστοιχούν στο αίτημα του χρήστη.
Στη συνέχεια, το σύστημα δημιουργεί πληροφορίες κειμένου αποσπάσματος που εμφανίζονται στον χρήστη με τη μορφή SERP (σελίδα αποτελεσμάτων μηχανών αναζήτησης) - σελίδες αποτελεσμάτων αναζήτησης.
Έτσι, ακόμη και μια σύντομη περιγραφή του κύριουοι αρχές της εργασίας των συστημάτων αναζήτησης δείχνουν πόσο στενά όλα τα στοιχεία του λογισμικού του συστήματος αλληλοσυνδέονται μεταξύ τους και πόσο καλά θα πρέπει να λειτουργήσει η μηχανή αναζήτησης και να λειτουργήσει σαφώς ώστε να παρέχει στον χρήστη τις ταχύτερες και πιο αξιόπιστες πληροφορίες στο ερώτημα αναζήτησης.














