αρχική σελίδα(εκτυπώστε τη σελίδα αυτή ή αν δεν έχετε εκτυπωτή κάντε τη αποθήκευση στο σκληρό δίσκο του υπολογιστή σας)

Οι μηχανισμοί αναζήτησης πληροφοριών στο διαδίκτυο ( SEARCH ENGINES ).
Του Δημήτρη Παπαδάκη
Γ ε ν ι κ ά
Όπως είναι γνωστό το διαδίκτυο είναι μια τεράστια πηγή πληροφοριών. Εκατομμύρια αρχεία με πληροφορίες, προγράμματα, εικόνες, ήχους κ.α είναι αποθηκευμένα σε διακομιστές και περιμένουν κάποιους να τα διαβάσουν.Αν πάμε σε μια βιβλιοθήκη για να μπορέσουμε να βρούμε το βιβλίο που θέλουμε θα κοιτάξουμε την αρχειοθέτησή της για να βρούμε τις πληροφορίες που αφορούν στο ανάλογο βιβλίο. Όμως το ιντερνέτ, αυτή την τεράστια πηγή πληροφοριών, δεν έχει ταξινομημένες τις πληροφορίες της όπως μια βιβλιοθήκη. Έτσι καταρχήν φαίνεται αδύνατο να ψάξουμε σ' αυτήν και να βρούμε αυτό που θέλουμε.

Όμως υπάρχουν οι μηχανές αναζήτησης που μπορούν να βρούν αυτό που ψάχνουμε σχετικά εύκολα και γρήγορα. Η δουλειά που κάνουν αυτές είναι να ψάχνουν στο διαδίκτυο να βρουν κάποιες λέξεις κλειδιά που τους δίνουμε και να μας απαντήσουν πόσες και ποιες σελίδες βρήκαν στις οποίες αναφέρονται οι λέξεις κλειδιά που τους δώσαμε. Περιέχουν δηλαδή βάσεις δεδομένων με τα λινκς των ιστοσελίδων που υπάρχουν στο διαδίκτυο. Δεν περιέχουν όλο το περιεχόμενο ,αλλά τους συνδέσμους, μια μικρή περίληψη και ότι άλλο χρειάζεται για να μπορέσει να εξυπηρετήσει τους χρήστες. Στην πράξη ,η μηχανή αναζήτησης είναι ένα τεράστιο αρχείο με συνδέσμους μέσω των οποίων μπορούμε να μεταβούμε στην ανάλογη ιστοσελίδα που είναι αποθηκευμένη σε διάφορους εξυπηρετητές. Ομαδοποιούν τα αποτελέσματα ανάλογα με τις λέξεις κλειδιά που εισαγάγουμε καθώς και σύμφωνα με το περιεχόμενο , τη δημοτικότητα και το είδος των τόπων.

 

Ε ί δ η μ η χ α ν ι σ μ ώ ν α ν α ζ ή τ η σ η ς
Οι μηχανισμοί αναζήτησης είναι τεσσάρων ειδών:
Α .Μηχανές αναζήτησης
Με βάση τις λέξεις κλειδιά που δίνουμε στη μηχανή ψάχνει αυτόματα με ένα ειδικό πρόγραμμα και εντοπίζει σε πρώτη φάση σχετικές ιστοσελίδες που υπάρχουν στη βάση δεδομένων της ,αντιγράφει τα λινκς(συνδέσμους) και μας τα παρουσιάζει έτσι ώστε πατώντας πάνω στο λινκ που θέλουμε να μεταφερθούμε στην ανάλογη ιστοσελίδα.

Σκοπός της μηχανής αναζήτησης είναι να εντοπίσει όσο πιο πολλές ιστοσελίδες μπορέσει να βρει. Εκείνο που δεν μπορεί να κάνει είναι να τις ταξινομήσει σε καταλόγους σε θεματικές κατηγορίες.

Η σειρά που εμφανίζονται οι ιστοσελίδες που βρίσκει η μηχανή εξαρτάται από τον τρόπο ταξινόμησης που χρησιμοποιεί. Θα μπορούσε να είναι πρώτες αυτές που έχουν μεγάλη επισκεψιμότητα ή αυτές που συνδέονται με άλλες ιστοσελίδες κ.α.

Επίσης πρέπει να τονιστεί ότι αν ψάξουμε σε δυο διαφορετικές μηχανές το ίδιο λήμμα τα αποτελέσματα που θα πάρουμε θα είναι εντελώς διαφορετικά μεταξύ τους και αυτό συμβαίνει γιατί υπάρχει όπως προανέφερα διαφορετική βάση δεδομένων και διαφορετική αξιολόγηση για την κάθε ιστοσελίδα.

Πλεονεκτήματα – μειονεκτήματα

Το μεγάλο πλεονέκτημα των μηχανών αναζήτησης είναι η πληθώρα των συνδέσμων που μας παρέχουν σε μια αναζήτηση, ενώ το μεγάλο τους μειονέκτημα είναι η πιθανότητα να επιστρέψουν μεγάλο ποσοστό άσχετων συνδέσμων που δεν έχουν αξιολογηθεί και είναι δυνατόν να είναι παλιές και να περιέχουν ανακριβείς ή ελλιπείς πληροφορίες. Ακόμη σαν αρνητικά στοιχεία θεωρούνται :

Οι καλύτερες μηχανές αναζήτησης σήμερα θεωρούνται οι Google , altavista , alltheweb και Nothern Light .Αυτές στις γενικές αναζητήσεις. Γιατί υπάρχουν και μηχανές που εξειδικεύονται σε αναζήτηση αρχείων συγκεκριμένου τύπου. Πχ για εικόνες ή για βίντεο κα.

Β.Κατάλογοι

Οι θεματικές κατηγορίες που δημιουργούν διάφοροι διακομιστές ,κατηγοριοποιώντας τις ιστοσελίδες ανάλογα με το θέμα που περιέχουν (αθλητισμός, ταξίδια, τουρισμός κα).Οι κατάλογοι μπορούν να χωριστούν σε δύο κατηγορίες:

1.Κατάλογοι που δημιουργούνται από εμπορικές πύλες στο internet ( portal ) όπως είναι οι yahoo , in , pathfinder κα.

2.Οι κατάλογοι που δημιουργούνται από βιβλιοθήκες ή πανεπιστήμια. Αυτοί συνήθως δημιουργούνται από ειδικούς του χώρου και συντηρούνται από αυτούς. Σκοπό έχουν να βοηθήσουν τον ερευνητή να ανακαλύψει κυρίως βιβλία που συντηρούνται στα πανεπιστήμια και παίρνοντας κάποιο κωδικό αριθμό, προσερχόμενος στην ανάλογη βιβλιοθήκη να δανειστεί το βιβλίο. Άλλοτε πάλι μπορούν να εισέλθουν οι ερευνητές σε ψηφιοποιημένα βιβλία και να τα διαβάσουν από τον υπολογιστή τους ή να εκτυπώσουν κάποια σημεία που θα θελήσουν.

Γ. Μεικτού τύπου μηχανές
Είναι ένας συνδυασμός μηχανών αναζήτησης και καταλόγων.

Δ. Μετα-μηχανές .
Αυτές δεν διαθέτουν δική τους βάση δεδομένων αλλά το ερώτημα που θέτει ο χρήστης το αποστέλλουν σε διάφορους μηχανισμούς και έπειτα αφού συμψηφίσουν τα αποτελέσματα που παίρνουν τα παρουσιάζουν στο χρήστη .Όμως δεν θεωρούνται ιδιαίτερα αποτελεσματικές.

Π ώ ς γ ί ν ε τ α ι η α ν α ζ ή τ η σ η

Ο χρήστης αφού εμφανίσει με κάποιο πρόγραμμα περιήγησης τη σελίδα της μηχανής αναζήτησης , γράφει το λήμμα, τη λέξη κλειδί που θέλει στο ειδικό πλαίσιο και μετά πατάει το κουμπί αναζήτηση. Αν δεν την κάνει πιο ειδική , με τους όρους που θέλει να βρει, την αναζήτησή του, τότε η μηχανή θα του επιστρέψει εκατοντάδες ή και χιλιάδες σελίδες με το λήμμα , πράγμα που δεν θα τον βοηθήσει, γιατί είναι πρακτικά αδύνατο να ψάξει σε όλες τις σελίδες που του επιστρέφει.

Γι αυτό χρησιμοποιούνται ευρέως οι λεγόμενοι τελεστές αναζήτησης:

•  Ο Τελεστής AND , and match all , must contain , all of the words ή το σύμβολο + ,& .Χρησιμοποιώντας ένα από τα παραπάνω ζητάμε από τη μηχανή να μας επιστρέψει όσες σελίδες περιέχουν οπωσδήποτε τις λέξεις κλειδιά που της δίνουμε πχ

•  Ο τελεστής ΝΟΤ, not , AND NOT , and not , must not contain , should not contain , exclude ή το σύμβολο – ,! εξαιρεί από την αναζήτηση συγκεκριμένους όρους ή φράσεις.

•  OR , or match any , any of the words , should contain ή το σύμβολο | χρησιμοποιείται για να επεκτείνει την αναζήτηση και επιστρέφει αποτελέσματα στα οποία υπάρχει τουλάχιστον ο ένας όρος.

•  Ο τελεστής *,** πολλαπλασιάζει κατά κάποιον τρόπο τα αποτελέσματα. Αν λόγου χάρη γράψουμε παιδ* τότε θα μας επιστρέψει αποτελέσματα όπως παιδεία, παιδαγωγική, παιδιά κτλ

•  Οι τελεστές ? και % αντικαθιστούν οποιοδήποτε χαρακτήρα σε μια λέξη.

•  Ο τελεστής NEAR , near ή το σύμβολο ~ μπορεί να βρει κείμενα που περιέχουν τις καθορισμένες λέξεις-κλειδιά όχι μόνο δίπλα ή μια στην άλλη αλλά και σε κοντινή απόσταση μεταξύ τους μέχρι 10 λέξεις.

•  Το κενό ή το tab ανάμεσα στις λέξεις παίζουν τον ίδιο ρόλο με τους πρώτους τελεστές.

•  Τα διπλά εισαγωγικά εξειδικεύουν το ερώτημα που δίνουμε στη μηχανή. Για παράδειγμα αν θέσουμε τη φράση «παιδαγωγική επιστήμη» θα μας επιστρέψει σελίδες που περιέχουν αυτόν τον όρο μαζί. Εάν δεν τα χρησιμοποιήσουμε θα μας επιστρέψει σελίδες που περιέχουν τις λέξεις παιδαγωγική και της λέξης επιστήμη όπως και τυχόν εμφανίσεις σε σελίδες των δύο λέξεων μαζί.

•  Title ,μας επιτρέπει αναζητήσεις μέσα στον τίτλο της σελίδας όπως υπάρχει μέσα στο έγγραφο html

•  Domain , για αναζήτηση σε συγκεκριμένη τοποθεσία ( edu , gr , com κτλ)

•  Host ή site για ιστοσελίδες που υπάρχουν σε συγκεκριμένους διακομιστές.

•  url για αναζήτηση στο κείμενο της διεύθυνσης των ιστοσελίδων

•  link για συνδέσεις σε ιστοσελίδες

•  image για αναζήτηση και εντοπισμό γραφικών σε ιστοσελίδες

•  anchor , applet , object για αναζήτηση υπερσυνδέσμων, προγραμμάτων java και αντικειμένων αντίστοιχα

•  text , filetype για αναζήτηση στο κυρίως κείμενο της ιστοσελίδας ή εντοπισμού συγκεκριμένου τύπου αρχείων.

 

Είναι δυνατόν να συνδυάσουμε πολλούς τελεστές μαζί έτσι ώστε να περιορίσουμε το εύρος των σελίδων που θα μας εμφανίσουν. Πρέπει να τονιστεί ότι όλες οι μηχανές αναζήτησης δεν χρησιμοποιούν τους ίδιους τελεστές .Δηλαδή είναι δυνατόν σε κάποιες μηχανές να μην είναι δυνατή η αναζήτηση με κάποιους από τους παραπάνω τρόπους. Λόγου χάρη ο τελεστής * δεν χρησιμοποιείται στο in . gr ενώ χρησιμοποιείται στη μηχανή αναζήτησης forthnet . gr .

Επίσης πρέπει να τονιστεί ότι, η διάκριση πεζών και κεφαλαίων διαφέρει από μηχανή σε μηχανή. Δηλαδή άλλες μηχανές διακρίνουν τα πεζά από τα κεφαλαία και άλλες δεν κάνουν αυτή τη διάκριση.

Μ υ σ τ ι κ ά   τ η ς  α ν α ζ ή τ η σ η ς- Tips

Η πληθώρα των σελίδων που υπάρχουν αυτή τη στιγμή στο διαδίκτυο αυξάνεται συνεχώς και είναι αναγκαίο να έχουμε υπ' όψιν μας τα παρακάτω , έτσι ώστε η αναζήτησή μας να είναι εποικοδομητική:

•  Επιλέξτε τη σωστή μηχανή αναζήτησης ανάλογα με το τι ψάχνετε.

•  Στην αναζήτηση ονόματος χρησιμοποιείστε κεφαλαία γράμματα.

•  Χρησιμοποιείστε πολλές λέξεις για να αναζητήσετε αυτό που ψάχνετε.

•  Στα εμφανιζόμενα αποτελέσματα κάνετε δεύτερη αναζήτηση για να γίνει καλύτερο φιλτράρισμα των ιστοσελίδων που ήδη έχουν βρεθεί.

•  Χρησιμοποιείστε τελεστές για πιο συγκεκριμένα αποτελέσματα.

•  Προσθέστε δίπλα στις λέξεις κλειδιά και κάποιο χαρακτηριστικό αυτού που ψάχνετε(λχ φωτογραφία)

Bιβλιογραφία:
Περιοδικό «Σύγχρονη εκπαίδευση» τεύχος 132-133
cd - rom Σ.Παπαδάκης-Ν.Χατζηπερής (Κοινωνία της πληροφορίας)
Internet : http://www.google.com , http://www.pathfinder.gr

 

 

αρχή της σελίδας
αρχική σελίδαεπιστροφή στις ασκήσεις και άλλα