Suchmaschine
Niels Dettenbach
linux at eichsfeld.net
Mit Nov 19 23:19:02 CET 2003
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1
...Harvest?
Wurde bei uns bereits mehrfach in solcherart gelagerten Projekten verwendet...
http://harvest.sourceforge.net/
Beste Grüße,
Niels
Am Dienstag, 18. November 2003 17:42 schrieb D. Schreiber:
> Hallo,
>
> ich möchte eine (Intranet-)Suchmaschine aufsetzen, die alle Dateien erfasst
> und indiziert, also auch Binaries u.ä. Sofern vorhanden soll ein
> entsprechender Filter zum Auslesen der Daten verwendet werden (wv, catdoc,
> xpdf, ...), ansonsten soll per 'strings' der Klartext der jeweiligen Datei
> erfasst werden. Ich habe auch schon mal mit ht:/dig gebastelt. Die
> Indizierung der üblichen Verdächtigen (html, pdf, doc, ...) hat auch
> geklappt. nur die Indizierung der sonstigen Dateien hat nicht gefunzt. Alle
> Dateien in den relevanten Verzeichnissen werden über ein Script ermittelt
> und über eine Html-Seite verlinkt, welche als Start-Url für ht:/dig dient.
> Hat jemand 'ne Idee, wie man das Problem gelöst kriegt.
> Vielleicht kennt jemand ja eine Suchmaschine, mit der das Problem besser
> gelöst werden kann. Bin für jeden Hinweis dankbar.
>
> Gruß Dennis
- --
- ---
WWW: http://linux.eichsfeld.net
PGP public key: http://linux.eichsfeld.net/nd_pub_key.asc
Key fingerprint = 6B96 F205 0F3E FC8C BD1F A8C2 BE0D 6B99 E07A 90B9
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.0.6 (GNU/Linux)
Comment: For info see http://www.gnupg.org
iD8DBQE/u+xWvg1rmeB6kLkRAmHKAJ9V7QX7YRo8BKKieAW11T7+Icqi9ACdEzZN
FW6LqyHAi1oBNrF4Gft+ny8=
=/TwL
-----END PGP SIGNATURE-----