Suchmaschine
D. Schreiber
dschreiber at gmx.de
Die Nov 18 17:42:15 CET 2003
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1
Hallo,
ich möchte eine (Intranet-)Suchmaschine aufsetzen, die alle Dateien erfasst
und indiziert, also auch Binaries u.ä. Sofern vorhanden soll ein
entsprechender Filter zum Auslesen der Daten verwendet werden (wv, catdoc,
xpdf, ...), ansonsten soll per 'strings' der Klartext der jeweiligen Datei
erfasst werden. Ich habe auch schon mal mit ht:/dig gebastelt. Die
Indizierung der üblichen Verdächtigen (html, pdf, doc, ...) hat auch
geklappt. nur die Indizierung der sonstigen Dateien hat nicht gefunzt. Alle
Dateien in den relevanten Verzeichnissen werden über ein Script ermittelt und
über eine Html-Seite verlinkt, welche als Start-Url für ht:/dig dient. Hat
jemand 'ne Idee, wie man das Problem gelöst kriegt.
Vielleicht kennt jemand ja eine Suchmaschine, mit der das Problem besser
gelöst werden kann. Bin für jeden Hinweis dankbar.
Gruß Dennis
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.2-rc1-SuSE (GNU/Linux)
iD8DBQE/ukvxzMUGXUPg28oRAtLeAJ9q0hzlOFK9u++KAHDCPy7h/VCH7gCgjXPa
nKK/WfjnQpmlAp1q0bcXbys=
=o6ZA
-----END PGP SIGNATURE-----