Google LocalRank

Google LocalRank

880 550 master
  • master
  • 0

Στις 25 Φεβρουαρίου 2003, η Google Company εφηύρε έναν νέο αλγόριθμο για ταξινόμηση σελίδων, με το όνομα LocalRank.
Βασίζεται στην ιδέα ότι οι σελίδες θα έπρεπε να ταξινομούνται όχι με βάση τους παγκόσμιους συνδέσμους αναφοράς τους, αλλά με βάση τον τρόπο που αναφέρονται μεταξύ σελίδων που ασχολούνται με θέματα σχετικά με το συγκεκριμένο αίτημα. Ο αλγόριθμος LocalRank δε χρησιμοποιείται στην πράξη (τουλάχιστον, όχι με τη μορφή που περιγράφεται στην ευρεσιτεχνία). Ωστόσο, η ευρεσιτεχνία περιέχει αρκετές ενδιαφέρουσες καινοτομίες, για τις οποίες πιστεύεται ότι πρέπει να γνωρίζει κάθε ειδικός του seo. Σχεδόν όλες οι μηχανές αναζήτησης λαμβάνουν ήδη υπόψιν τα θέματα στα οποία είναι αφιερωμένες οι αναφερόμενες σελίδες. Φαίνεται ότι διάφοροι αλγόριθμοι χρησιμοποιούνται για τον αλγόριθμο LocalRank, και η μελέτη της ευρεσιτεχνίας θα μας επιτρέψει να έχουμε μία γενική ιδέα σχετικά με τον τρόπο που μπορεί να εφαρμοστεί.

Καθώς διαβάζετε αυτή την ενότητα, παρακαλώ έχετε υπόψιν ότι περιέχει θεωρητικές πληροφορίες, και όχι πρακτικές οδηγίες.

Τα ακόλουθα τρία αντικείμενα περιλαμβάνουν την κεντρική ιδέα του αλγόριθμου LocalRank:

1. Ένας αλγόριθμος χρησιμοποιείται για να επιλέξει έναν συγκεκριμένο αριθμό εγγράφων σχετικών με το αίτημα αναζήτησης (έστω ότι είναι N). Αυτά τα έγγραφα αρχικά ταξινομούνται με κάποια κριτήρια (μπορεί να είναι το PageRank, η συνάφεια ή μία ομάδα άλλων κριτηρίων). Έστω ότι καλούμε την αριθμητική τιμή αυτού του κριτηρίου OldScore.

2. Καθεμία από τις N N επιλεγμένες σελίδες περνά από μία διαδικασία κατάταξης και παίρνει μία νέα σειρά στην κατάταξη. Έστω ότι την καλούμε LocalScore.

3. Οι τιμές OldScore και LocalScore για κάθε σελίδα πολλαπλασιάζονται, για να δώσουν μία νέα τιμή – NewScore. Οι σελίδες τελικά κατατάσσονται με βάση το NewScore.

Η διαδικασία κλειδί σε αυτό τον αλγόριθμο είναι η νέα διαδικασία κατάταξης, η οποία δίνει σε κάθε σελίδα μία νέα LocalScore σειρά στην κατάταξη. Ας εξετάσουμε αυτή τη νέα διαδικασία με περισσότερες λεπτομέρειες:

0. Ένας αρχικός αλγόριθμος κατάταξης χρησιμοποιείται για να επιλεγούν N σελίδες σχετικές με το αίτημα αναζήτησης. Σε καθεμία από τις N σελίδες αντιστοιχίζεται μία τιμή OldScore από αυτό τον αλγόριθμο. Ο νέος αλγόριθμος κατάταξης χρειάζεται μόνο να δουλέψει σε αυτές τις N επιλεγμένες σελίδες .

1. Κατά τον υπολογισμό του LocalScore για κάθε σελίδα, το σύστημα επιλέγει εκείνες τις σελίδες από τις N που έχουν εισερχόμενους συνδέσμους σε αυτή τη σελίδα. Έστω ότι αυτός ο αριθμός είναι M. Κατά την ίδια στιγμή, οποιεσδήποτε άλλες σελίδες από τον ίδιο κεντρικό υπολογιστή (προσδιορισμένες από τη διεύθυνση IP) και σελίδες που είναι καθρέφτες της δεδομένης σελίδας θα αποκλειστούν από τις M.

2. Η συλλογή M διαιρείται σε υποσυλλογές Li. Αυτές οι υποσυλλογές περιέχουν σελίδες ομαδοποιημένες με βάση τα ακόλουθα κριτήρια:
– Ανήκουν σε έναν (ή σε παρόμοιους) κεντρικούς υπολογιστές. Έτσι, σελίδες των οποίων οι τρεις πρώτες οκτάδες στις διευθύνσεις IP τους είναι ίδιες θα μπουν σε μία ομάδα. Αυτό σημαίνει ότι σελίδες των οποίων οι διευθύνσεις IP ανήκουν στην περιοχή xxx.xxx.xxx.0 έως xxx.xxx.xxx.255 θα πρέπει να θεωρηθεί ότι ανήκουν σε μία ομάδα.
– Σελίδες που έχουν το ίδιο ή παρόμοιο περιεχόμενο (καθρέφτες)
– Σελίδες στο ίδιο site (domain).

3. Κάθε σελίδα σε κάθε Li υποσυλλογή έχει σειρά κατάταξης OldScore. Μία σελίδα με τη μεγαλύτερη σειρά κατάταξης OldScore λαμβάνεται από κάθε υποσυλλογή, οι υπόλοιπες σελίδες αποκλείονται από την ανάλυση. Έτσι, παίρνουμε κάποια υποσυλλογή σελίδων K που αναφέρονται σε αυτή τη σελίδα.

4. Οι σελίδες στην υποσυλλογή K ταξινομούνται με βάση την παράμετρο OldScore, τότε μόνο οι πρώτες k σελίδες (το k είναι κάποιος προκαθορισμένος αριθμός) παραμένουν στη υποσυλλογή K. Οι υπόλοιπες σελίδες αποκλείονται από την ανάλυση.

5. Το LocalScore υπολογίζεται σε αυτό το βήμα. Οι παράμετροι OldScore συνδυάζονται μεταξύ τους για τις υπόλοιπες k σελίδες. Αυτό μπορεί να δειχθεί με τη βοήθεια της ακόλουθης φόρμουλας:

Εδώ το m είναι κάποια προκαθορισμένη παράμετρος που μπορεί να ποικίλει από ένα έως τρία. Δυστυχώς, η ευρεσιτεχνία για τον υπό εξέταση αλγόριθμο δεν περιγράφει λεπτομερώς αυτή την παράμετρο.

Αφότου το LocalScore υπολογιστεί για κάθε σελίδα από τη συλλογή N, οι τιμές NewScore υπολογίζονται και οι σελίδες ανα-ταξινομούνται με βάση το νέο κριτήριο. Ο ακόλουθος τύπος χρησιμοποιείται για τον υπολογισμό του NewScore:

NewScore(i)= (a+LocalScore(i)/MaxLS)*(b+OldScore(i)/MaxOS)

i είναι η σελίδα για την οποία υπολογίστηκε η νέα σειρά κατάταξης.

a και b – είναι αριθμητικές σταθερές (δεν υπάρχουν περισσότερες λεπτομερείς πληροφορίες στην ευρεσιτεχνία σχετικά με αυτές τις παραμέτρους).

MaxLS – είναι το μέγιστο LocalScore μεταξύ εκείνων που υπολογίστηκαν.

MaxOS – είναι η μέγιστη τιμή μεταξύ των τιμών OldScore.

Τώρα ας αφήσουμε τα μαθηματικά κατά μέρος και ας εξηγήσουμε αυτά τα βήματα με απλά λόγια.

Στο βήμα 0) επιλέγονται σελίδες σχετικές με το αίτημα. Αλγόριθμοι που δεν λαμβάνουν υπόψιν το κείμενο των συνδέσμων χρησιμοποιούνται για αυτό. Για παράδειγμα, χρησιμοποιούνται η συνάφεια και η συνολική δημοτικότητα των συνδέσμων. Τώρα έχουμε μία συλλογή τιμών OldScore. OldScore είναι η κατάταξη για κάθε σελίδα με βάση τη συνάφεια, τη συνολική δημοτικότητα των συνδέσμων και άλλους παράγοντες.

Στο βήμα 1) σελίδες με εισερχόμενους συνδέσμους στη σελίδα ενδιαφέροντος επιλέγονται από την ομάδα που δημιουργήθηκε στο βήμα 0). Η ομάδα μειώνεται αφαιρώντας τους καθρέφτες και άλλα site στα βήματα 2), 3) και 4) έτσι ώστε μας έχει απομείνει μία συλλογή πραγματικά μοναδικών site που όλα τους μοιράζονται ένα κοινό θέμα με τη σελίδα που είναι υπό ανάλυση. Αναλύοντας τους εισερχόμενους συνδέσμους από τις σελίδες σε αυτή την ομάδα (αγνοώντας όλες τις άλλες σελίδες στο Internet), παίρνουμε την τοπική (θεματική) δημοτικότητα των συνδέσμων.

Οι τιμές LocalScore τότε υπολογίζονται στο βήμα 5). LocalScore είναι η κατάταξη μίας σελίδας μεταξύ της ομάδας σελίδων που σχετίζονται με το θέμα. Τελικά, οι σελίδες εκτιμώνται και κατατάσσονται χρησιμοποιώντας έναν συνδυασμό των LocalScore και OldScore.