Η μέθοδος PageRank της Google και άλλα συστήματα κατάταξης
Η μέθοδος PageRank της Google και άλλα συστήματα κατάταξης Η επιστήμη των μεθόδων κατάταξης στις μηχανές αναζήτησης
Συγγραφείς: Amy N. Langville- Carl D. Meyer
Εκδότης: Πανεπιστημιακές Εκδόσεις Κρήτης
Μετάφραση: Παπαδόγγονας, Γιάννης
Αριθμός Σελίδων: 290
Έτος Έκδοσης: 10-2010
Γιατί η οικοσελίδα σας δεν εμφανίζεται πρώτη στα αποτελέσματα της αναζήτησης, ακόμη και όταν το ερώτημα που θέτετε είναι το όνομά σας; Πώς γίνεται κάποιες άλλες ιστοσελίδες να εμφανίζονται πάντοτε στην κορυφή; Τι είναι αυτό που δημιουργεί αυτές τις ισχυρές κατατάξεις; Και με ποιον τρόπο τις δημιουργεί; Το συγκεκριμένο βιβλίο, το πρώτο με αντικείμενο την επιστήμη της κατάταξης ιστοσελίδων, περιέχει τις απαντήσεις σε αυτές και σε άλλες ερωτήσεις.
Η έκδοση απευθύνεται τόσο στον φιλομαθή αναγνώστη θετικών επιστημών όσο και στον τεχνικά καταρτισμένο σε υπολογιστικά ζητήματα. Η μαθηματική θεμελίωση είναι απλούστερη στα αρχικά κεφάλαια, ενώ σταδιακά γίνεται πιο σύνθετη. Τα πρώτα πέντε κεφάλαια είναι προσιτά σε όλους τους αναγνώστες με κάποιο υπόβαθρο στις θετικές επιστήμες. Τα άλλα κεφάλαια, αν και πολύ πιο απαιτητικά από μαθηματικής πλευράς, περιέχουν όλα τους ύλη που θα ενδιαφέρει και τις δύο κατηγορίες αναγνωστών. Παραδείγματος χάριν, οι συγγραφείς έχουν συμπεριλάβει ένθετα κείμενα ψυχαγωγικού χαρακτήρα, που αφορούν π.χ. το πώς χρηματοδοτούνται οι μηχανές αναζήτησης, ή το πώς επηρεάζει την έρευνα το Μεγάλο Σινικό Τείχος Προστασίας.
Το βιβλίο περιλαμβάνει, σαν ξεχωριστό κεφάλαιο, έναν αναλυτικό μαθηματικό οδηγό, σκοπός του οποίου είναι να διευκολύνει τον αναγνώστη να γνωρίσει καλύτερα τις μαθηματικές έννοιες που αφορούν τις μηχανές αναζήτησης. Περιλαμβάνει επίσης αρκετά τμήματα κώδικα MATLAB, καθώς και διαδικτυακές διευθύνσεις για ενδεικτικά σύνολα δεδομένων του Ιστού. Η όλη φιλοσοφία του είναι να ενθαρρύνει τον αναγνώστη να πειραματιστεί με τις έννοιες και τους αλγορίθμους που παρουσιάζονται στο κείμενο.
Περιεχόμενα:
Κεφάλαιο 1. Εισαγωγή στις μηχανές ιστοαναζήτησης
1.1 Σύντομο χρονικό της ανάκτησης πληροφοριών 1.2 Επισκόπηση της παραδοσιακής ανάκτησης πληροφοριών 1.3 Ανάκτηση ιστοπληροφοριών
Κεφάλαιο 2. Ερπυσμός, ευρετηρίαση και επεξεργασία ερωτημάτων
2.1 Ερπυσμός 2.2 Το ευρετήριο περιεχομένου 2.3 Επεξεργασία ερωτημάτων
Κεφάλαιο 3. Κατάταξη ιστοσελίδων με βάση τη δημοφιλία
3.1 Η κατάσταση το 1998 3.2 Οι δύο αρχές λειτουργίας 3.3 Ερωτηματοανεξαρτησία
Κεφάλαιο 4. Τα μαθηματικά της μεθόδου PageRank της Google
4.1 Ο αρχικός τύπος άθροισης της μεθόδου PageRank 4.2 Πινακική αναπαράσταση των εξισώσεων άθροισης 4.3 Τα προβλήματα της επαναληπτικής διεργασίας 4.4 Λίγα στοιχεία από τη θεωρία των αλυσίδων Markov 4.5 Οι αρχικές προσαρμογές στο βασικό μοντέλο 4.6 Υπολογισμός του διανύσματος PageRank 4.7 Θεώρημα και απόδειξη για το φάσμα του πίνακα Google
Κεφάλαιο 5. Οι παράμετροι του μοντέλου PageRank
5.1 Ο παράγοντας α 5.2 Ο πίνακας υπερσυνδέσμων H 5.3 Ο πίνακας τηλεμεταφοράς E
Κεφάλαιο 6. Η ευαισθησία του μοντέλου PageRank
6.1 Ευαισθησία ως προς την παράμετρο α 6.2 Ευαισθησία ως προς τον πίνακα H 6.3 Ευαισθησία ως προς το διάνυσμα vT 6.4 Άλλοι τρόποι ανάλυσης της ευαισθησίας 6.5 Θεωρήματα ευαισθησίας και αποδείξεις
Κεφάλαιο 7. Το πρόβλημα PageRank ως γραμμικό σύστημα
7.1 Ιδιότητες του πίνακα (I ? αS) 7.2 Ιδιότητες του πίνακα (I ? αH) 7.3 Απόδειξη για τη μορφή αραιού γραμμικού συστήματος του προβλήματος PageRank
Κεφάλαιο 9. Επιτάχυνση του υπολογισμού του PageRank
9.1 Προσαρμοζόμενη δυναμομέθοδος 9.2 Προέκταση 9.3 Συσσωμάτωση 9.4 Άλλες αριθμητικές μέθοδοι
Κεφάλαιο 10. Ενημέρωση του διανύσματος PageRank
10.1 Τα δύο προβλήματα ενημέρωσης και η ιστορία τους 10.2 Επανεκκίνηση της δυναμομεθόδου 10.3 Προσεγγιστική ενημέρωση μέσω προσεγγιστικής συσσωμάτωσης 10.4 Ακριβής συσσωμάτωση 10.5 Ακριβής έναντι προσεγγιστικής συσσωμάτωσης 10.6 Ενημέρωση μέσω επαναληπτικής συσσωμάτωσης 10.7 Προσδιορισμός της διαμέρισης 10.8 Συμπεράσματα
Κεφάλαιο 11. Η μέθοδος κατάταξης ιστοσελίδων HITS
11.1 Ο αλγόριθμος HITS 11.2 Υλοποίηση του HITS 11.3 Σύγκλιση της μεθόδου HITS 11.4 Παράδειγμα εφαρμογής της μεθόδου HITS 11.5 Πλεονεκτήματα και μειονεκτήματα της μεθόδου HITS 11.6 Η σχέση του HITS με τη βιβλιομετρία 11.7 Ερωτηματοανεξάρτητη μέθοδος HITS 11.8 Επιτάχυνση του HITS 11.9 Η ευαισθησία του HITS
Κεφάλαιο 12. Άλλες συνδεσμικές μέθοδοι κατάταξης ιστοσελίδων
12.1 SALSA 12.2 Υβριδικές μέθοδοι κατάταξης 12.3 Κατάταξη με βάση την κυκλοφοριακή ροή
Κεφάλαιο 13. Το μέλλον της ανάκτησης ιστοπληροφοριών
13.1 Ρυποδιαφήμιση 13.2 Εξατομίκευση 13.3 Συσταδοποίηση 13.4 Νοήμονες πράκτορες 13.5 Τάσεις και χρονοευαίσθητες αναζητήσεις 13.6 Ιδιωτικότητα και λογοκρισία 13.7 Συστήματα ταξινόμησης για βιβλιοθήκες 13.8 Σύμμιξη δεδομένων
Κεφάλαιο 14. Πηγές για την ανάκτηση ιστοπληροφοριών
14.1 Βασικές πηγές 14.2 Πηγές για συστηματικότερη μελέτη
Δεν υπάρχουν σχόλια:
Δημοσίευση σχολίου