OCR
OCR (Optik Karakter Tanıma)
Basılı veya el yazısı metnin görüntülerini analiz eden ve bunları makine tarafından okunabilir, aranabilir ve düzenlenebilir metne dönüştüren bir teknoloji.
Teknik Detay
Modern OCR iş hatları görüntü ön işleme (düzeltme, ikili dönüşüm, gürültü giderme), metin bloklarını tanımlamak için düzen analizi, satır ve karakter segmentasyonu, konvolüsyonel sinir ağı (CNN) veya transformer modelleri kullanan özellik tanıma ve hata düzeltme için dil modelleriyle son işleme içerir. Başlıca motorlar: Tesseract (açık kaynak, LSTM), Google, AWS ve Azure'un bulut servisleri ve özel transformer tabanlı modeller. Doğruluk, Karakter Hata Oranı (CER) ve Kelime Hata Oranı (WER) ile ölçülür; modern sistemler yüksek kaliteli baskı metinlerinde >%99 doğruluk elde eder.
Ornek
```javascript
// OCR: PDF manipulation example
import { PDFDocument } from 'pdf-lib';
const pdfDoc = await PDFDocument.load(fileBytes);
const pages = pdfDoc.getPages();
console.log(`Pages: ${pages.length}`);
```