Chuyển ảnh/PDF scan thành văn bản (OCR)

😫 Vấn đề (The Pain Point)

Sếp đưa cho bạn một tờ văn bản giấy (hoặc file scan PDF) và bảo: “Gõ lại cái này vào Word cho anh”. Ngồi gõ lại từng chữ? Thời đại nào rồi!

🚀 Giải pháp Agentic (The Solution)

Sử dụng công nghệ OCR (Optical Character Recognition) với engine Tesseract nổi tiếng của Google để đọc chữ từ ảnh.

Tính năng:

Vietnamese Support: Hỗ trợ tiếng Việt có dấu cực tốt (cần cài data tiếng Việt).
Layout Preservation: Cố gắng giữ nguyên đoạn văn.
Bulk OCR: Chuyển đổi cả xấp tài liệu cùng lúc.

🤖 Engineering Prompt (Copy & Paste)

**Role:** Python OCR Developer

**Task:** Create a "Vietnamese OCR Tool" (Image/PDF to Text).

**Requirements:**
1.  **Tech Stack:** Python, `tkinter`, `pytesseract`.
2.  **System Dependency:** Requires `Tesseract-OCR` installed and language data `vie` (Vietnamese).
3.  **GUI:**
    *   Select Input File (Image or PDF).
    *   Language Selection (eng, vie).
    *   "Convert to Text" button.
    *   Text Area to show result + "Copy" button.
    *   "Save as .txt" button.
4.  **Logic:**
    *   If PDF: convert to images first (using `pdf2image`).
    *   Run `pytesseract.image_to_string(img, lang='vie')`.
    *   Display output.
5.  **Deliverables:**
    *   `ocr_tool.py`
    *   `run.bat`
    *   `requirements.txt`

**Context:** Digitizing paper documents.

🧠 Giải mã Prompt

Tesseract & Data: Tesseract mặc định chỉ giỏi tiếng Anh. Để đọc tiếng Việt, bạn cần tải file vie.traineddata (Ebook sẽ hướng dẫn).
PDF Handling: Tesseract không đọc file PDF trực tiếp, nó đọc ảnh. Nên tool phải có bước trung gian “PDF -> Ảnh -> Chữ”.

🛠️ Hướng dẫn

Cài đặt Tesseract OCR và gói Tiếng Việt.
Copy Prompt -> Paste -> Chạy.
Chọn ảnh văn bản -> Convert -> Copy text sang Word.

Chuyển ảnh/PDF scan thành văn bản (OCR)

😫 Vấn đề (The Pain Point)

🚀 Giải pháp Agentic (The Solution)

Tính năng:

🤖 Engineering Prompt (Copy & Paste)

🧠 Giải mã Prompt

🛠️ Hướng dẫn

Workflows liên quan

Gộp file PDF (Kèm Mục Lục)

Chia tách file PDF

Chuyển đổi PDF sang Ảnh (JPG/PNG)

Đổi tên PDF theo nội dung

Phân tích File Log/Nhật ký

Trích xuất ảnh từ Video

Get Started with Agentic Working

😫 Vấn đề (The Pain Point)

🚀 Giải pháp Agentic (The Solution)

Tính năng:

🤖 Engineering Prompt (Copy & Paste)

🧠 Giải mã Prompt

🛠️ Hướng dẫn

Workflows liên quan

Gộp file PDF (Kèm Mục Lục)

Chia tách file PDF

Chuyển đổi PDF sang Ảnh (JPG/PNG)

Đổi tên PDF theo nội dung

Phân tích File Log/Nhật ký

Trích xuất ảnh từ Video

Get Started with Agentic Working

Get Your Free Starter Kit

Support Us