Trang chủ >> Ðào tạo >> Nghiên cứu sinh

NCS Võ Đức Quang. - Luận án bảo vệ cấp Đại học Bách khoa Hà Nội

- Đề tài: Cải tiến thuật toán phân lớp cho dữ liệu không cân bằng và ứng dụng trong dự đoán đồng tác giả
- Ngành: Hệ thống thông tin.
- Mã số: 9480104.
- Người hướng dẫn khoa học:
                                                   1. PGS.TS. Trần Đình Khang
 
- Cơ sở đào tạo: Đại học Bách khoa Hà Nội
- Ngày đăng: 06/03/2024
 
TÓM TẮT KẾT LUẬN MỚI CỦA LUẬN ÁN
 
Với mục tiêu cải tiến các thuật toán phân lớp hiệu quả cho dữ liệu không cân bằng và ứng dụng trong bài toán dự đoán đồng tác giả, luận án đưa đến hai đóng góp chính:

  1. Xây dựng thuật toán cải tiến dựa trên AdaBoost có tên Im.AdaBoost.WSVM cho bài toán phân lớp với dữ liệu không cân bằng và ứng dụng trong dự đoán đồng tác giả. Cụ thể hai cải tiến gồm: (i) phương pháp khởi tạo tập các trọng số lỗi thích nghi với tỷ lệ không cân bằng của tập dữ liệu; (ii) phương pháp tính toán trọng số độ tin cậy của các bộ phân lớp thành viên trong AdaBoost nhạy cảm đối với tổng lỗi gây ra trên các mẫu nhãn dương.
  2. Đề xuất một thuật toán điều chỉnh trọng số mờ thích nghi dựa trên FSVM-CIL gọi là AFW-CIL cho bài toán phân lớp với dữ liệu không cân bằng và ứng dụng trong dự đoán đồng tác giả. Cụ thể hai cải tiến gồm: (i) xây dựng một hàm thuộc mờ mới cho các mẫu dữ liệu dựa trên khoảng cách từ mỗi mẫu đến tâm của cả lớp thiểu số và lớp đa số; (ii) đề xuất phương pháp điều chỉnh thích nghi trọng số mờ của các mẫu nhạy cảm được định vị dựa trên các cặp Tomek link trong không gian lề phân lớp SVM hoặc mẫu là nhiễu.
Các kết quả thử nghiệm chỉ ra rằng các thuật toán đề xuất phù hợp cho phân lớp với bộ dữ liệu không cân bằng.
 
- Nội dung: Luận án bảo vệ cấp Đại học Bách khoa Hà Nội (xem tại đây)


Điện thoại: 02438692115
Ban đào tạo- Bộ phận quản lý đào tạo sau đại học - P315 - C1 - Đại học Bách khoa Hà Nội, Số 1 Đại Cồ Việt - Hà Nội - Việt Nam