Tiết Thanh Minh Hiếu
Xin chào! Tôi là Tiết Thanh Minh Hiếu
AI Security Researcher | Sinh viên CNTT K22, HUTECH
Trong 3 năm qua, tôi đã đi từ sinh viên CNTT thông thường đến Top 1 lớp Đồ án Cơ sở (9.0/10) và là 1 trong 10 đề tài được duyệt thẳng NCKH. Hành trình của tôi tập trung vào giao điểm giữa AI và Cybersecurity - nơi công nghệ tiên tiến gặp gỡ bảo mật thực tế.
Download CV
Tải CV (PDF) | Cập nhật: 10/2025
Tầm nhìn
Phát triển chuyên môn sâu về AI Security và chia sẻ kiến thức cho cộng đồng. Tôi tin rằng cách học tốt nhất là dạy lại cho người khác - blog này là nơi tôi thực hành triết lý đó.
Học vấn & Thành tích
Đại học Công nghệ TP.HCM (HUTECH) - Công nghệ Thông tin, K22 (2022-2026)
- GPA gần nhất: 3.83/4.0 | GPA tích lũy: 3.52/4.0
Thành tích nổi bật:
- Top 1 lớp Đồ án Cơ sở (2025) - Điểm 9.0/10
- Nghiên cứu Khoa học Sinh viên (NCKH) - Top 10/60+ đề tài được duyệt thẳng vòng sơ khảo
Chứng chỉ
- Networking Basics - Cisco Academy
- JavaScript Essentials 1 - Cisco Academy
- JavaScript Essentials 2 - Cisco Academy
- Coursera Certificate
- Đang theo học: Google Cybersecurity Certificate
- Dự định: IBM Cybersecurity Analyst, CompTIA Security+
Chuyên môn
Machine Learning & AI
- Transformer Networks, BERT, Deep Learning
- Training custom models (13,000+ samples)
- Android Malware Detection: 94.3% accuracy
Cybersecurity
- Malware Analysis, Anti-evasion, Static Analysis
- Tools: Androguard, YARA Rules, ProGuard
Lập trình
- Python (Advanced), Java (Intermediate)
- TensorFlow, PyTorch, Flask/FastAPI
- Git, Linux/Ubuntu
Hành trình Nghiên cứu
Mục tiêu nghiên cứu: Phát hiện mã độc Android bằng Transformer Networks, đối phó các kỹ thuật né tránh tinh vi.
🔬 Giai đoạn 1: Chứng minh khái niệm (Q2/2025) - Đồ án Cơ sở
Câu hỏi: BERT có phát hiện mã độc tốt hơn CNN/LSTM?
Full Implementation: BERT vs CNN/LSTM | +20% accuracy
Dataset: MH-100K (100K mẫu)
Kết quả:

BERT: 94% | CNN: 74% | LSTM: 69%
Insight: BERT hiểu ngữ cảnh kết hợp (INTERNET + READ_CONTACTS = rủi ro), CNN/LSTM chỉ nhìn từng feature riêng lẻ.
🚀 Giai đoạn 2: Ứng dụng thực tế (Q4/2025) - Đồ án Chuyên ngành
“BERT có thể phát hiện mã độc đã bị che giấu bằng obfuscation?”
Dataset: CICMalDroid 2020
- Malware: 13,205 APK từ 4 families
- Benign: ~48GB samples (đang trong quá trình xử lý)
- Quy mô tổng: 70GB+ dữ liệu thô
Tiến trình:
- 1/22 đề tài được duyệt thẳng không cần chỉnh sửa
- Tỷ lệ xử lý thành công: 94.3% (12,453/13,205 malware APK)
- Đang hoàn thiện obfuscation testing
Tech Stack: Python, Androguard, BERT/Transformer, ProGuard, Flask/FastAPI, YARA
🎯 Giai đoạn 3: Nghiên cứu Chuyên sâu (2025+) - NCKH
Câu hỏi: FCG/BCG có vượt qua static analysis?
Giải pháp đề xuất - Phân tích đồ thị gọi hàm (FCG/BCG):
Ý tưởng cốt lõi: Malware có thể che giấu tên hàm, nhưng khó che giấu luồng thực thi!
Ưu thế: Malware phải thực thi để hoạt động, và khi thực thi sẽ để lại dấu vết trong call graph - rất khó che giấu hoàn toàn.
Mục tiêu:
- Cải thiện độ chính xác
- Tool phân tích FCG/BCG cho Android APK
- Research paper với phương pháp và dataset đóng góp
Giảng viên hướng dẫn: Cô Đinh Huỳnh Tuệ Tuệ
Thách thức & Bài học
Bẫy số liệu ảo
Model ban đầu đạt 88% accuracy - nghe tốt đấy! Nhưng thực tế chỉ phát hiện được 5% mã độc - gần như vô dụng.
Giải pháp: Cân bằng dữ liệu → cải thiện lên 89% khả năng bắt malware.
Bài học: Độ chính xác cao ≠ model hoạt động tốt trong thực tế.
Dữ liệu thực tế không như sách vở
Xử lý 13,000+ file APK gặp: file lỗi, hết RAM với 70GB dữ liệu, tool báo lỗi liên tục.
Giải pháp: Xử lý từng phần, tự động bỏ qua file lỗi, quản lý bộ nhớ cẩn thận.
Bài học: Dữ liệu thật phức tạp gấp 10 lần dataset mẫu. Kỹ năng code quan trọng không kém AI.
Timeline Tổng quan
| Giai đoạn | Câu hỏi nghiên cứu | Kết quả chính |
|---|---|---|
| 🎯 ĐACS (Q2/2025) | BERT có tốt hơn CNN/LSTM? | ✅ +20% accuracy |
| 🚀 ĐACN (Q4/2025) | BERT có chống được obfuscation? | ✅ 94.3% success |
| 🔬 NCKH (2025+) | FCG/BCG có vượt static analysis? | 🔄 In progress |
Tại sao tôi tạo blog này?
Blog này là bước đầu rèn luyện kỹ năng truyền đạt - một phần quan trọng nếu muốn chia sẻ kiến thức trong tương lai.
Bạn sẽ tìm thấy ở đây:
- Kinh nghiệm thực tế từ các project AI Security
- Cách tiếp cận thực tế thay vì lý thuyết khô khan
- Tips & tricks học được qua quá trình “vấp ngã”
- Kiến thức phức tạp được giải thích dễ hiểu
Mục tiêu của tôi là biến những khái niệm về Cybersecurity, AI và Machine Learning thành những câu chuyện thú vị mà bất kỳ ai cũng có thể hiểu được.
Blog này dành cho bạn nếu
Bạn đang học về Cybersecurity, Java, JavaScript hoặc AI và muốn hiểu cách áp dụng kiến thức vào thực tế. Bạn thích học thông qua kinh nghiệm thực tế hơn là lý thuyết suông.
Hãy cùng học, cùng phát triển và cùng tạo nên một cộng đồng tech Việt Nam mạnh mẽ!
“The best way to learn is to teach others” - Triết lý tôi theo đuổi trong mỗi bài viết
