- SĐT liên hệ: (+84) 926 397 972 | (+84) 333 371 116
[PE2025105] NGHIÊN CỨU CÁC PHƯƠNG PHÁP PHÁT HIỆN TIN NHẮN RÁC TIẾNG VIỆT -20%
Upload bởi:
Trong thế giới phẳng ngày nay, ứng dụng công nghệ thông tin để có thể giao tiếp nhanh chóng, thuận tiện và hiệu quả là điều tất yếu. Cùng với điện thoại và thư điện tử, tin nhắn (SMS) đã tạo nên một cuộc cách mạng về trao đổi thông tin. Mặc dù ra đời sau thư điện tử nhưng tin nhắn SMS lại đang phát triển rất nhanh và đang có xu hướng chiếm ưu thế do một số đặc điểm đặc thù.
-
Chức năng đầy đủ và giống demo 100%
-
Hỗ trợ lắp đặt nếu cần
-
Hỗ trợ trả lời người mua sau khi tải
Đóng góp bộ dữ liệu tin nhắn rác và tin nhắn thường tiếng Việt được thu thập từ các nguồn khác nhau, phục vụ cho nghiên cứu các phương pháp phát hiện tin nhắn rác tiếng Việt trong bối cảnh chưa có một công bố chính thức đối với tập dữ liệu tin nhắn tiếng Việt.
Phân tích mức độ ảnh hưởng của độ dài tin nhắn tới hiệu quả của mô hình phát hiện tin nhắn rác. Trong quá trình xây dựng mô hình và thực hiện thử nghiệm, luận án đã so sánh và đánh giá hiệu quả giữa các thuật toán học máy truyền thống, học sâu, bộ luật thống kê trên 3 tập dữ liệu bao gồm tin nhắn có độ dài khác nhau. Qua đó, chứng minh mức độ ảnh hưởng của điều kiện tin nhắn giới hạn nội dung tới hiệu quả của các mô hình.
Đề xuất 2 phương án tiếp cận để giải quyết bài toán phát hiện tin nhắn rác với đặc điểm đa biến thể của tiếng Việt. Hai hướng tiếp cận đều được chứng minh tính khả thi bằng mô hình thực nghiệm dựa trên tập dữ liệu thu thập được. Hướng tiếp cận thứ nhất cho thấy mô hình sử dụng mạng CNN sẽ hiệu quả hơn khi biến đổi dữ liệu về dạng đơn thể đầy đủ dấu thanh. Hướng tiếp cận thứ hai đề xuất mô hình sử dụng mạng LSTM và PhoBERT để phát hiện tin nhắn rác, đồng thời giảm chi phí cho việc chuyển đổi dữ liệu từ dạng hỗn hợp/đa biến thể sang dạng đơn biến thể.
