R
r00ki3
Jungspund
Hi ihrs,
ich suche nach einer Möglichkeit, eine große PDF - Datei mittels bash in einzelne, teilweise zusammenhängende Seiten zu zerlegen. Dies soll unter Berücksichtigung best. Kriteria in der PDF geschen.
Ich kam auf die Idee, die Datei zunächst einmal mit [pdftotext] nach ASCII zu strippen, um ein ganzzahliges Eindeutigkeitsmerkmal auf einer jeden Seite isolieren zu können, welches innerhalb der einzelnen Seiten manchmal wechselt. Dieses steht in der ASCII - Datei immer in Zeile 15 alleine.
Sobald dieses sich ändert, möchte ich das PDF am vorigen ( ! ) Seitenumbruch
absägen ( Prinzip Klorolle ) , genauergesagt die Nummer der Seite in
eine Datei oder eine Variable schreiben, um anhand dieser Daten die Dateien
später trennen zu können ( gs oder pdftk ) und sie anhand des isoierten Eindeutigkeitsmerkmals benennen und weiterverabeiten zu können.
Kann mich mal jemand in die Richtige Richtung schubsen ?
Meine Idee wäre, die Seitenumbrüche zu extrahieren und mitzuzählen, aber ich weiß
nicht wie ich das in bash ausdrücke. Mit while read ... do ?
r00ki3
ich suche nach einer Möglichkeit, eine große PDF - Datei mittels bash in einzelne, teilweise zusammenhängende Seiten zu zerlegen. Dies soll unter Berücksichtigung best. Kriteria in der PDF geschen.
Ich kam auf die Idee, die Datei zunächst einmal mit [pdftotext] nach ASCII zu strippen, um ein ganzzahliges Eindeutigkeitsmerkmal auf einer jeden Seite isolieren zu können, welches innerhalb der einzelnen Seiten manchmal wechselt. Dieses steht in der ASCII - Datei immer in Zeile 15 alleine.
Sobald dieses sich ändert, möchte ich das PDF am vorigen ( ! ) Seitenumbruch
absägen ( Prinzip Klorolle ) , genauergesagt die Nummer der Seite in
eine Datei oder eine Variable schreiben, um anhand dieser Daten die Dateien
später trennen zu können ( gs oder pdftk ) und sie anhand des isoierten Eindeutigkeitsmerkmals benennen und weiterverabeiten zu können.
Kann mich mal jemand in die Richtige Richtung schubsen ?
Meine Idee wäre, die Seitenumbrüche zu extrahieren und mitzuzählen, aber ich weiß
nicht wie ich das in bash ausdrücke. Mit while read ... do ?
r00ki3
Zuletzt bearbeitet: