😫 Vấn đề (The Pain Point)
Dữ liệu khách hàng nhập trên web thường rất lộn xộn: “nguyễn văn a”, “TRẦN THỊ B”, ” Lê Cường ”. Để in bằng khen hoặc gửi email trang trọng, bạn cần tên họ phải chuẩn đẹp: “Nguyễn Văn A”.
🚀 Giải pháp Agentic (The Solution)
Tool “Make Pretty”: Chuẩn hóa Proper Case (Viết hoa chữ cái đầu) cho tiếng Việt.
Tính năng:
- Title Case: Xử lý đúng cả tên tiếng Việt có dấu.
- Trim Space: Xóa sạch dấu cách thừa ở đầu, cuối và giữa các từ.
- Bulk: Xử lý cả cột Excel trong tích tắc.
🤖 Engineering Prompt (Copy & Paste)
**Role:** Python Data Developer
**Task:** Create a "Text Normalizer" for Excel columns.
**Requirements:**
1. **Tech Stack:** Python, `tkinter`, `pandas`.
2. **GUI:**
* Select Excel File.
* Select Column to Fix (e.g., "Full Name").
* "Normalize" button.
3. **Logic:**
* **Trim:** `vals.str.strip()`, replace double spaces with single space.
* **Title Case:** `vals.str.title()` works well for basic cases.
* *Advanced (Optional):* Handle specific Vietnamese edge cases if needed, but standard library is usually 99% fine.
* Save as new file.
4. **Deliverables:**
* `text_normalizer.py`
* `run.bat`
* `requirements.txt`
**Context:** Cleaning user-submitted form data.
🧠 Giải mã Prompt
- Trim Space: Lỗi phổ biến nhất khi người dùng gõ máy tính là thừa dấu cách. Hàm
.strip()và regex replace\s+->sẽ giải quyết triệt để.
🛠️ Hướng dẫn
- Copy Prompt -> Paste -> Chạy.
- Chọn File -> Chọn cột Tên -> Normalize.