Die Zeitschrift für Linux-Professionals |
Dieses Programm sucht in allen HTML- und PDF-Dateien des Jahrgangs 2004.
Geben Sie einfach oben den Suchtext ein und drücken [Enter]. Wenn Sie ein Wort
mit »-
« beginnen, findet das Tool nur Dokumente, in denen dieses
Wort nicht vorkommt. Wenn Sie nur einen Teil eines Worts kennen, benutzen Sie
die Wildcard »*
«, um Abschnitte auszulassen.
Das Suchergebnis listet alle gefundenen Files, erst die HTML-Version, danach
die PDF-Dokumente. Sie können (wie in einem Browser) auf die Dateien klicken.
Per Default startet »acroread
«, um die PDF-Dateien anzuzeigen, und
»mozilla
« für HTML-Dateien. Im Menü »Tools | Settings |
Document Settings« lässt sich diese Vorgabe ändern: den »Document Handler« für
»pdf« markieren und per »Edit« anpassen.
DocSearcher zeigt auf Wunsch die HTML-Dateien auch selbst an, ohne einen externen Browser zu bemühen: Einfach das Häkchen vor »Tools | Settings | Misc. Settings | Load Web Pages externally« entfernen.
Viel Spaß beim Lesen!
Ihre Linux-Magazin-Redaktion
Tel.: +49-(0)89 / 99 34 11 - 0
Fax: +49-(0)89 / 99 34 11 99
info@linux-magazin.de
www.linux-magazin.de
Copyright © 1999-2004 Linux New Media AG. Alle Rechte vorbehalten.
DocSearcher kann aber mehr: Es ist eine Suchmaschine, mit der Sie auch Ihre eigenen Dateien durchsuchen können. Es benutzt die Open-Source-Bibliotheken Lucene und POI Apache sowie PDF-Box. DocSearcher duchsucht HTML, MS Word, MS Excel, RTF, PDF, Open Office (und Star Office), sowie Textdokumente.
Mehr Informationen zu Lucene gibt es auf der Homepage jakarta.apache.org/lucene/docs/. Der Autor von DocSearcher is John Brown (E-Mail johnbrown1024 AT netscape.net).