Suchmaschine

D. Schreiber dschreiber at gmx.de
Die Nov 18 17:42:15 CET 2003


-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Hallo,

ich möchte eine (Intranet-)Suchmaschine aufsetzen, die alle Dateien erfasst 
und indiziert, also auch Binaries u.ä. Sofern vorhanden soll ein 
entsprechender Filter zum Auslesen der Daten verwendet werden (wv, catdoc, 
xpdf, ...), ansonsten soll per 'strings' der Klartext der jeweiligen Datei 
erfasst werden. Ich habe auch schon mal mit ht:/dig gebastelt. Die 
Indizierung der üblichen Verdächtigen (html, pdf, doc, ...) hat auch 
geklappt. nur die Indizierung der sonstigen Dateien hat nicht gefunzt. Alle 
Dateien in den relevanten Verzeichnissen werden über ein Script ermittelt und 
über eine Html-Seite verlinkt, welche als Start-Url für ht:/dig dient. Hat 
jemand 'ne Idee, wie man das Problem gelöst kriegt. 
Vielleicht kennt jemand ja eine Suchmaschine, mit der das Problem besser 
gelöst werden kann. Bin für jeden Hinweis dankbar.

Gruß Dennis
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.2-rc1-SuSE (GNU/Linux)

iD8DBQE/ukvxzMUGXUPg28oRAtLeAJ9q0hzlOFK9u++KAHDCPy7h/VCH7gCgjXPa
nKK/WfjnQpmlAp1q0bcXbys=
=o6ZA
-----END PGP SIGNATURE-----