Autor Thema: Service-Tipp: OCR  (Gelesen 1444 mal)

Martin Lemke

  • Administrator
  • *****
  • Beiträge: 15531
Service-Tipp: OCR
« am: 2018-10-03 07:39:30 »
Kyrillische PDF-Dateien (z.B. vom WSC) sind manchmal ein Ärgernis, wenn sie nur aus Bilddateien bestehen. Dann kann auch translate.google.de nicht helfen. Eine OCR-Lösung muss her. Mal eben 100 € auszugeben, um Daten fürs Wiki zu gewinnen, finde ich nicht attraktiv.

Gerade fand ich folgenden Service: https://onlineocr.net/

Nach der Konvertierung fehlt zwar jede Textformatierung, aber für unsere Zwecke ist das egal. Der so gewonnene Text kann per Copy & Paste bei translate.google.de eingegeben und z.B. ins Deutsche übersetzt werden. Fürs Wiki ist das eine sehr große Hilfe.

Ob das auch für Chinesisch u.s.w. funktioniert, habe ich noch nicht ausprobiert. Falls es (oder eine andere Sprache) von Euch jemand ausprobiert hat, wäre hier ein Hinweis hilfreich.

Martin
Profil bei Researchgate.net – Spinnen-News aus SH

DAS waren noch Zeiten: Norwegen 2011.

Martin Lemke

  • Administrator
  • *****
  • Beiträge: 15531
Re: Service-Tipp: OCR
« Antwort #1 am: 2018-10-03 08:17:35 »
Ich sehe gerade: Wenn man das Pech hat, dass die gewünschte Info hinter der 15. Seite des Dokumentes liegt, muss man auch hier bezahlen. Registriert muss man hier nach 120 Tagen bezahlen oder die PDF-Datei mit irgend einem Tool vorher splitten.

:-(

Wenistens hat uns dieser Service für die Seite von Berlandina nabozhenkoi gute Dienste geleistet. Die kyrillische Beschreibung stand gleich am Anfang.

Martin
Profil bei Researchgate.net – Spinnen-News aus SH

DAS waren noch Zeiten: Norwegen 2011.