😫 Vấn đề (The Pain Point)
Bạn có 1 thư mục chứa 500 file hợp đồng cũ. Bạn cần tìm hợp đồng của “Công ty ABC” nhưng không nhớ tên file là gì. Windows Search đôi khi không index nội dung PDF. Mở từng file -> Ctrl+F thì bất khả thi.
🚀 Giải pháp Agentic (The Solution)
Tool “Google Search” cho folder PDF của bạn.
Tính năng:
- Deep Search: Đọc từng trang văn bản bên trong file PDF.
- Context Preview: Hiển thị đoạn văn chứa từ khóa (như Google) để bạn biết có đúng ngữ cảnh không.
- Open File: Click đúp để mở ngay file tìm thấy tại đúng trang đó.
🤖 Engineering Prompt (Copy & Paste)
**Role:** Python Search Engine Developer
**Task:** Create a "Local PDF Search Engine".
**Requirements:**
1. **Tech Stack:** Python, `tkinter`, `pypdf`.
2. **GUI:**
* Select Folder.
* Input "Search Keyword".
* Search Button.
* **Results List:** Columns [Filename | Page Number | Context Snippet].
3. **Logic:**
* Iterate all PDFs.
* Extract text page by page.
* Case-insensitive search.
* If found: Store match details.
* **Optimization:** Search is slow on large files. Use threading to keep GUI responsive. Stop scanning a file once match is found? (No, finding all pages is better).
4. **Deliverables:**
* `pdf_search.py`
* `run.bat`
* `requirements.txt`
**Context:** Legal or HR departments searching through archives.
🧠 Giải mã Prompt
- Threading: Việc đọc text từ 500 file rất nặng. Nếu không dùng đa luồng (Threading), app sẽ bị treo (Not Responding) trong lúc tìm kiếm. Prompt này yêu cầu rõ để AI xử lý kỹ thuật này.
🛠️ Hướng dẫn
- Copy Prompt -> Paste -> Chạy.
- Chọn Folder -> Gõ từ khóa -> Search.