OCR

OCR (Optik Karakter Tanıma)

Basılı veya el yazısı metnin görüntülerini analiz eden ve bunları makine tarafından okunabilir, aranabilir ve düzenlenebilir metne dönüştüren bir teknoloji.

Teknik Detay

Modern OCR iş hatları görüntü ön işleme (düzeltme, ikili dönüşüm, gürültü giderme), metin bloklarını tanımlamak için düzen analizi, satır ve karakter segmentasyonu, konvolüsyonel sinir ağı (CNN) veya transformer modelleri kullanan özellik tanıma ve hata düzeltme için dil modelleriyle son işleme içerir. Başlıca motorlar: Tesseract (açık kaynak, LSTM), Google, AWS ve Azure'un bulut servisleri ve özel transformer tabanlı modeller. Doğruluk, Karakter Hata Oranı (CER) ve Kelime Hata Oranı (WER) ile ölçülür; modern sistemler yüksek kaliteli baskı metinlerinde >%99 doğruluk elde eder.

Ornek

```javascript
// OCR: PDF manipulation example
import { PDFDocument } from 'pdf-lib';

const pdfDoc = await PDFDocument.load(fileBytes);
const pages = pdfDoc.getPages();
console.log(`Pages: ${pages.length}`);
```

Ilgili Araclar

M Merge PDF S Split PDF C Compress PDF R Rotate PDF A Add Page Numbers P PDF to JPG W Watermark PDF R Reorder PDF Pages F Flatten PDF E Edit PDF Metadata S Sign PDF J JPG to PDF E Extract Text from PDF D Delete PDF Pages R Reverse PDF E Extract PDF Pages E Extract Odd/Even Pages R Resize PDF Pages C Crop PDF I Insert Blank Pages D Duplicate PDF Pages P PDF to PNG A Add Header & Footer A Add Text to PDF A Add Image to PDF

Ilgili Terimler

Cross-Reference Table Digital Signature Annotation Bookmark Bates Numbering Content Stream AcroForm Color Management (PDF)