Freitag, 16. April 2010

Durchsuchung verschiedener Arten von Dateien/Dokumenten

Durch einen Eintrag auf der deutschen openSUSE-User-Mailingliste bin ich auf eine Fragestellung bzgl. der Durchsuchung von Dokumenten verschiedenster Arten aufmerksam geworden.

Das ganze ist eine Problematik, die bei uns auch des öfteren mal autritt. Daher habe ich die beiden neben "Google Desktop" genannten Tools Recoll und DocFetcher einmal einer näheren Überprüfung unterzogen. Wichtig war hier neben der Tatsache, dass es nicht unbedingt das Google-Produkt sein sollte/musste, der Punkt, das es möglichst auf verschiedenen Plattformen (Linux, Solaris, Windows, etc.) lauffähig sein sollte.

Da Recoll ein Tool für Linux/Unix ist, fällt es daher eigentlich schon einmal raus. Angesehen habe ich es mir trotzdem einmal, da ich selbst eigentlich nur unter Linux bzw. Unix arbeite. Nach dem Start fängt das Tool dann auch gleich erst einmal an, das gesamte Homeverzeichnis zu indizieren. Neben der Tatsache, dass dies recht lange dauern kann, werden auch alle möglichen Cache-Dateien, Logdateien, usw. durchlaufen. Ist nicht so wirklich praktisch. Der "normale" Anwender will es sicherlich auf Office-Dokumente, PDF-dateien, etc. beschränken. Kann man aber auch entsprechend konfigurieren. Klickt man nach dem Start so allerdings erst einmal auf weiter, muss man die Indizierung entweder einmal komplett durchlaufen lassen oder aber abbrechen.

Komfortabler ist da schon das Tool DocFetcher. Auffällig hier: Es gibt auch eine portable Version, die sich zum Beispiel auch für USB-Stick o. ä. eignet. Nach dem Start sind auf der linken Seite alle Dokumenttypen ausgewählt. In der Spalte drunter kann man dann zum Beispiel das zu indizierende Verzeichnis festlegen. Die eigentliche Indizierung der Dateien dauert dann je nach Anzahl und Größe aber natürlich auch wieder seine Zeit. Anschließend kann man recht komfortabel in diesen Dateien suchen.

Fazit: Bei uns auf der Arbeit wird wohl DocFetcher bei den Kolleginnen und Kollegen einmal einen ausführlichen Test machen.

Keine Kommentare: