OCR
Optical Character Recognition
Optical Character Recognition (OCR) คือเทคโนโลยีที่แปลงรูปภาพของข้อความ เช่น เอกสารที่สแกนหรือภาพถ่าย ให้เป็นข้อมูลข้อความที่เครื่องอ่านได้ OCR ทำให้ผู้ใช้สามารถค้นหา แก้ไข และคัดลอกข้อความจากเอกสารที่เดิมไม่มีเนื้อหาข้อความดิจิทัล
รายละเอียดทางเทคนิค
ระบบ OCR สมัยใหม่ใช้เครือข่ายประสาทเทียม (โดยเฉพาะ CNN และ LSTM) เพื่อรู้จำอักขระได้อย่างแม่นยำ กระบวนการมักเริ่มจากการประมวลผลภาพล่วงหน้า (การกำจัดความเอียง การลดสัญญาณรบกวน) ตามด้วยการแบ่งส่วน การรู้จำ และขั้นตอนหลังการประมวลผล
ตัวอย่าง
```javascript
// OCR: PDF manipulation example
import { PDFDocument } from 'pdf-lib';
const pdfDoc = await PDFDocument.load(fileBytes);
const pages = pdfDoc.getPages();
console.log(`Pages: ${pages.length}`);
```
เครื่องมือที่เกี่ยวข้อง
M
Merge PDF
S
Split PDF
C
Compress PDF
R
Rotate PDF
A
Add Page Numbers
P
PDF to JPG
W
Watermark PDF
R
Reorder PDF Pages
F
Flatten PDF
E
Edit PDF Metadata
S
Sign PDF
J
JPG to PDF
E
Extract Text from PDF
D
Delete PDF Pages
R
Reverse PDF
E
Extract PDF Pages
E
Extract Odd/Even Pages
R
Resize PDF Pages
C
Crop PDF
I
Insert Blank Pages
D
Duplicate PDF Pages
P
PDF to PNG
A
Add Header & Footer
A
Add Text to PDF
A
Add Image to PDF