Muss es immer Begale sein? Welche Indexer kennt ihr?

tuxlover

tuxlover

Der den Tux knuddelt
Hallo alle zusammen;

da meine Rechner beide noch ein bischen betagt sind, habe ich gestern beagle von der platte verscheucht. Der Indiziert mir einfach mit zuviel cpu performence.

Dann habe ich mich mal nach anderen Desktopsuchmaschienen umgeschaut und bin dabei als erstes auf google.desktop gefallen. Wie effektiv das ist, wird sich nach ca. 35 stunden zeigen. solange dauert es nämlich noch, bis die indezierung abgeschlossen ist. Aber bisher gefällt mir das alles sehr gut.

Nun wollte ich mal wissen welche Desktopindizierungsdienste ihr so verwendet. Bzw. welche es noch so gibt und welche erfahrungen ihr damit gesammelt habt.

Also es darf gepostet werden.

gruß tuxlover
 
Zuletzt bearbeitet:
Keinen, weil locate, find und grep keine zig100MB großen Datenbanken brauchen, nicht ständig im Hintergrund rumrödeln und ich trotzdem damit alles finden kann, was ich suche.

Code:
l /var/lib/locatedb
-rw-r--r-- 1 root root 8677060 25. Jan 05:14 /var/lib/locatedb

8 MB statt irgendwas über 700MB, die Beagle angelegt hatte, bevor ich es vom System gepfeffert habe.

Greetz,

RM
 
Dann habe ich mich mal nach anderen Desktopsuchmaschienen umgeschaut und bin dabei als erstes auf google.desktop gefallen. Wie effektiv das ist, wird sich nach ca. 35 stunden zeigen. solange dauert es nämlich noch, bis die indezierung abgeschlossen ist. Aber bisher gefällt mir das alles sehr gut.
Ja, und wie effektiv er daten ins netz jagt *scnr

ich meinte "locate" könnte das...bin mir da aber nicht sicher.

Den als ich irgendwann mal nach nem Beagle howto gesucht habe, hab ich auch gelesen, das ein programm auf konsolen basis das auch kann...

bins grad am suchen....

...sonst hab grad noch das gefunden > http://www.linux-mag.de/heft_abo/ausgaben/2005/09/persoenlicher_spuerhund

Edit: argh, shit. RM war schneller :)
naja, jedenfalls lag ich dann richtig :)
 
Ich glaube mir würde eine Suche mit metadaten, die aber auf einer locate Datenbank basieren, reichen. Das ist wenigstens schön schnell.
 
@hermann4: ja habe ich mir auch schon überlegt und wäre für mich auch die beste lösung weißt du wie man sowas macht?
 
Tja, ich habe leider noch nicht so ein Prog gefunden. In dem Artikel den doc hier verlinkt hat wurde das Gnome Search Tool erwähnt, welches wohl locate als Grundlage benutzt. Aber allein der Name "Gnome Search Tool" klingt für mich schon wieder nach Ressourcenverbrauch.
 
Da setz ich doch glatt noch einen drauf ...

herrman4 schrieb:
Aber allein der Name "Gnome Search Tool" klingt für mich schon wieder nach Ressourcenverbrauch.

Da geht doch noch einer....

Alleine schon "GUI" bedeutet für so etwas wie locate unnötigen Ressourcenverbrauch.

Greetz,

RM
 
Code:
man find
Code:
man locate
Warum einfach, wenn es auch umständlich geht oder wie?

Und was zum Geier ist "Begale"? *g*
 
Aber allein der Name "Gnome Search Tool" klingt für mich schon wieder nach Ressourcenverbrauch.

Gratulation,

das ist das dämlichste Argument was ich seit langem gehört habe.
 
ok google-desktop getestet: ergebnis durchgefallen.

1) nachdem google meinen desktop ca 3 bis 4 tage bei voll ausgelasteter cpu indiziert hat, konnte ich einige wörter eingeben. er hat mir auch dokumente vorgeschlagen, hat diese aber nicht nach der häufigkeit der vorkommenden suchbegriffe bzw. relevanz sortier, sondern nach der reihenfolge des indizierungsvorgangs. was natürlich wenig bis gar nicht hilfreich ist.

2) hat man html seiten gespeichert ist es google-desktop nicht möglich diese auch im browser zu öffnen,- stattdessen wird konqueror geöffnet und wenn man hier auf einen link klickt, können diese nicht geöffnet werden.

3) der verbrauchte speicher für die datenbank ist wesentlich höher (knapp 2gb) als bei beagle (knapp 500 MB)

also wird es wohl den weg aus dem system finden.

ach ja, mal so n tipp an google. eine architektur mit dem namen currnent gibt es meiner meinung nach nicht. hier wurden einfach schon die pakete falsch bzw. schlampig zusammengebaut.

werde mir also mal den nächsten indizierungsdienst vornehmen und testen

grüße an alle die mich kennen

tuxlover
 
Zuletzt bearbeitet:
doch, naja istr halt ein p4 der ersten generation. vielleicht lags auch daran.

zu meinem desktop indizierungsordner haben /home und ne externe hdd sowie /usr/share/doc gehört.
 
Also ich hätte dem "Ding" (wenn überhaupt) nur ein paar Stunden gegeben.

Aber, wer braucht denn schon ein Indizierungs-Proggi ??
Ich meine, wenn Du anständig Dein(e) Verzeichnis(e) führst, und das muss man ja eh zwangsweise, dann findet man alles ja auch auf anhieb, oder ?
Ich habe hier nen Home-Ordner von ca. 350 GB und brauche kein Indizierungs-Tool.
Von daher wundert mich das scho a bissle ;).

Gruß
W.
 
stimmt schon, ich habe die meistens daten auf der externen hdd herumliegen. da gibts einen ordner lost+found, einen ordner shared, den ich in mein homeverzeichnis gelinkt habe und einen ordner unsorted. und machmal komme ich nicht so schnell hinterher den ordner unsorted zu sortieren, oder ich habe dokumentationen mit einem paket installiert. ja ja ich weiß dass das alles auch mit locate und find und regular expression geht.
aber das ist ja nicht die frage hier.

btw. schade dass das kat projekt so schnell wieder eingestampft wurde, aber naja probiere ich halt den nächsten mal aus
 
google-desktop?????????

Ohhggottooooooogootttooogott,

"google-desktop" - ist das nicht so eine Beta vom "Bundestrojaner"?

(Ironiemodus aus.)

Gruß.
 
Den nächsten indizierungsdienst denb ich getestet habe, ist recoll

Die indizierung geht recht flott von statten, was darin liegen mag, dass der indexer nur das indiziert, was wirklich sinnvoll ist, zu indizieren, nämlich dokumente die ihre informationen in form von lesbarem text bereitstellen, wie html, ps pdf und einige officeformate.

der index selber war nach der indizierung von /usr/share/doc /media/TREKSTOR/Shared/Ebooks (welche eine ganze reihe von pdf html und ps dateien entälht, knapp 200 MB groß. liefert also von der perfomence bisher das beste ergebnis.

Nachteile: man kann auf die texte von der suchmaschine aus icht direkt zugreifen sondern bekommt einen unformtierten text zu sehen, der sich teilweise gar nicht bis sehr schlecht lesen lässt.
Die vorkonfiguration gestaltet sich recht aufwendig.

Vorteile: man kann bestimmen, welche ordner überwacht werden sollen. man kann ein selbst definiertes indizierungsinbtervall (z.b einmal in der woche zwischen 4 und 10 uhr) angeben, was dazu führt dasa man einmalig indizieren kann und danach verhält sich die kiste ruhig und der auslastungsbalken schwebt gemächlich zwischen 5 und 10 prozent.
 
Zurück
Oben