Luận văn ThS: Phát hiện bất thường bằng phân tích Tensor để nhận biết xung động kinh trong dữ liệu điện não

434 1

Miễn phí

Tải về máy để xem đầy đủ hơn, bản xem trước là bản PDF

Tags: #luận văn thạc sĩ#luận án#đồ án#báo cáo thực tập

Mô tả chi tiết

Tài liệu tham khảo

B. Arindam, C. Varun and K. Vipin (2009),  “Anomaly detection: A survey”, ACM Computing Surveys , 31(3), pp. 1-72

M. Augusteijn and B.  Folkert (2002),  “Neural network classification and novelty detection”, International Journal on Remote Sensing,  23(14), pp.2891–2902

K. Das and J. Schneider (2007), “Detecting anomalous records in categorical datasets”, In Proceedings of the 13th ACM SIGKDD  international conference on Knowledge discovery and data mining. ACM Press

M.  Davy  and  S.  Godsill  (2002),  Detection  of  abrupt  spectral  changes  using support vector machines. An application to audio signal segmentation,  In Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing

T. Ide and H. Kashima (2004),  Eigenspace-based  anomaly  detection  in computer systems, In Proceedings of the 10th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM Press, pp. 440–449....

Nội dung

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ LÊ HOÀNG ANH PHÁT HIỆN BẤT THƯỜNG BẰNG PHÂN TÍCH TENSOR ĐỂ NHẬN BIẾT XUNG ĐỘNG KINH TRONG DỮ LIỆU ĐIỆN NÃO Ngành: Công nghệ thông tin Chuyên ngành: Hệ thống thông tin Mã số: 8480104.01 LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS. NGUYỄN LINH TRUNG Hà Nội – 11/2018i LỜI CAM ĐOAN Tôi xin cam đoan các kết quả nghiên cứu trong luận văn là của riêng tôi và chưa được công bố trong bất kì công trình nghiên cứu nào. Hà nội, ngày 15 tháng 11 năm 2018 Học viên Lê Hoàng Anhii MỤC LỤC LỜI CAM ĐOAN .......................................................................................... i Danh mục các ký hiệu, các chữ viết tắt ...................................................... iv Danh mục các bảng ...................................................................................... v Danh mục các hình vẽ, đồ thị ..................................................................... vi MỞ ĐẦU .................................................................................................... vii LỜI CẢM ƠN ............................................................................................. ix CHƯƠNG 1. TỔNG QUAN VỀ LUẬN VĂN ...................................... 1 1.1. Bất thường và các phương pháp phát hiện bất thường phổ biến ... 1 1.1.1. Bất thường ............................................................................. 1 1.1.2. Các phương pháp phát hiện bất thường phổ biến ................... 3 1.2. Phát hiện xung động kinh trong dữ liệu EEG ............................... 4 1.2.1. Bệnh động kinh và xung động kinh ........................................ 4 1.2.2. Các phương pháp phát hiện xung động kinh .......................... 7 1.3. Phân tích ten-xơ ........................................................................... 8 1.4. Khái quát nội dung luận văn .......................................................... 10 CHƯƠNG 2. NGHIÊN CỨU CƠ SỞ ................................................. 12 2.1. Các khái niệm về ten-xơ................................................................. 12 2.2. Thuật toán phân tích HOSVD ........................................................ 15 2.3. Biến đổi sóng con liên tục - CWT .................................................. 17 CHƯƠNG 3. HỆ THỐNG PHÁT HIỆN XUNG ĐỘNG KINH SỬ DỤNG HOSVD ....................................................................................... 19 3.1. Biểu diễn dữ liệu EEG ................................................................... 19iii 3.2. Trích trọn đặc trưng ....................................................................... 21 3.3. Phân loại ........................................................................................ 23 CHƯƠNG 4. KẾT QUẢ THỰC NGHIỆM VÀ KẾT LUẬN ............ 25 4.1. Tập dữ liệu ..................................................................................... 25 4.2. Đánh giá thuật toán ....................................................................... 28 4.3. Kết quả .......................................................................................... 30 4.4. Kết luận ......................................................................................... 36 TÀI LIỆU THAM KHẢO ......................................................................... 38iv Danh mục các ký hiệu, các chữ viết tắt STT Ký hiệu, viết tắt Tên đầy đủ Giải thích 1 EEG Electroencephalography Điện não đồ 2 CP/PARAFAC Paralel Factor Analysis Phân tích các hệ số song song 3 PCA Principal component analysis Phân tích thành phần chính 4 Tucker Tucker Phân tích Tucker 5 HOSVD Higher-order singular value decomposition Phân tích trị riêng bậc cao 6 CWT Continueous Wavelet Transform Biến đổi sóng con liên tục 7 DWT Discrete Wavelet Transform Biến đổi sóng con rời rạc 8 SVM Support Vector Machine Máy vec-tơ hỗ trợ 9 KNN K-Nearest Neighbors K láng giềng gần nhất 10 ROC Receiver Operating Charateristic Đường cong ROC 11 TPR True Positive Rate Tỉ lệ phát hiện đúng 12 FPR False Positive Rate Tỉ lệ phát hiện nhầm 13 AUC Area Under the Curve Diện tích nằm dưới đường cong ROCv Danh mục các bảng Bảng 4-1. Đánh giá chất lượng mô hình ............................................. 34 Bảng 4-2. So sánh SVM với KNN ...................................................... 35 Bảng 4-3. So sánh HOSVD với CP .................................................... 36vi Danh mục các hình vẽ, đồ thị Hình 1.1: Ví dụ về điểm bất thường trong không gian hai chiều [2]. .... 2 Hình 1.2 Ví dụ về bối cảnh bất thường [2]. .......................................... 2 Hình 1.3. Ví dụ về bất thường tập hợp trong tín hiệu điện tim. ............. 3 Hình 1.4. Mô hình thu thập dữ liệu EEG. ............................................. 5 Hình 1.5. Ví dụ về xung động kinh cục bộ [10] .................................... 6 Hình 1.6. Ví dụ về xung động kinh toàn bộ [5]. .................................... 7 Hình 1.7 Mô hình hệ thống phát hiện xung động kinh trong dữ liệu EEG sử dụng phân tích ten-xơ ............................................................ 10 Hình 2.1. Ten-xơ ba chiều. ................................................................. 12 Hình 2.2. Các lát cắt của một ten-xơ bậc 3 [21] .................................. 13 Hình 2.3. Các chế độ của một ten-xơ bậc ba [21] ............................... 13 Hình 2.4.Phân tích SVD ..................................................................... 15 Hình 2.5. Phân tích HOSVD cho ten-xơ bậc 3. ................................... 16 Hình 2.6. Thuật toán HOSVD ............................................................ 17 Hình 3.1. Mô tả hệ thống phát hiện xung động kinh ........................... 19 Hình 3.2. Quá trình tạo ten-xơ bậc 3 ................................................... 20 Hình 3.3. Hàm Mexican hat................................................................ 21 Hình 3.4. Mô tả quá trình trích chọn đặc trưng. .................................. 22 Hình 4.1. Tín hiệu EEG trên một số kênh trong dữ liệu EEG ............. 25 Hình 4.2. Đoạn dữ liệu kiểm thử chứa dữ liệu dẫn tới co giật ............. 26 Hình 4.3. Phân tích Fourier của tín hiệu EEG. .................................... 27vii MỞ ĐẦU Động kinh là một loại rối loạn thần kinh, được đặc trưng bởi những xung động kinh xuất hiện lặp đi lặp lại nhiều lần. Theo nghiên cứu của tổ chức WHO vào tháng 2 năm 2018, trên thế giới có khoảng 50 triệu người mắc bệnh động kinh, hầu hết những người mắc bệnh động kinh nằm trong các nước nghèo hoặc đang phát triển [1], trong khi đó máy móc để phục vụ cho việc chuẩn đoán bệnh lại rất tốn kém. Trong việc chẩn đoán bệnh động kinh sử dụng dữ liệu điện não (EEG), thì một hệ thống phát hiện xung động kinh tự động chính xác là rất hữu ích và có ý nghĩa, đặc biệt trong những trường hợp việc đọc dữ liệu EEG và phát hiện những xung động kinh trên các bản ghi này là tốn thời gian, công sức, trong khi tính hiệu quả lại phụ thuộc vào trình độ của bác sĩ chẩn đoán. Nhận thức được vấn đề này, chúng tôi đặt ra bài toán là xây dựng một hệ thống phát hiện xung động kinh trong dữ liệu điện não EEG. Trong nghiên cứu này, được truyền cảm hứng từ những thành công của việc áp dụng phân tích ten-xơ vào các ứng dụng thực tế nói chung và y học nói riêng, chúng tôi đã áp dụng phân tích HOSVD, là một loại phân tích ten-xơ, để nhận biết xung động kinh trong dữ liệu EEG. Cụ thể hơn, trước tiên, biến đổi sóng con liên tục (CWT) được sử dung để chuyển đổi các đoạn dữ liệu điện não đồ EEG hai chiều thành những ten-xơ bậc 3 với các chiều về mặt thời gian, không gian và tần số. Tiếp theo đó, chúng tôi xếp chồng những ten-xơ đại diện cho các xung động kinh trong dữ liệu thành một ten-xơ bậc 4, trước khi đi nó được phân tích HOSVD để thu được các ma trận tải thành phần. Các ma trận này sau được sử dụng để xây dựng một không gian đặc trưng cho các xung động kinh theo một phương pháp mới. Cuối cùng, chúng tôi sử dụng hai bộ phân loại quen thuộc trong học máy gồm SVM và KNN đểviii nhận biết ra xung động kinh từ những đặc điểm thu được từ việc chiếu một ten-xơ EEG lên không gian đặc trưng vừa mới được huấn luyện. Kết quả thực nghiệm chỉ ra rằng, hệ thống nhận biết xung động kinh sử dụng phân tích HOSVD trên dữ liệu EEG cho kết quả phân loại tốt những thời điểm xuất hiện xung động kinh và những thời điểm “bình thường”. Đồng thời, chúng tôi so sánh phương pháp đề xuất với phương pháp dựa trên phân tích ten-xơ khác là CP/PARAFAC. Kết quả cũng đã cho thấy sự hiệu quả của HOSVD với độ nhạy 99% tốt hơn so với 75% của CP.ix LỜI CẢM ƠN Tôi xin chân thành cảm ơn sự hướng dẫn tận tình của PGS. TS. Nguyễn Linh Trung, PGS. TS. Phan Xuân Hiếu, TS. Nguyễn Việt Dũng, ThS. Nguyễn Thị Anh Đào, em Lê Trung Thành và các anh chị em trong Phòng thí nghiệm Tín hiệu và Hệ thống đã giúp đỡ tôi hoàn thành nghiên cứu này. Tôi cũng cảm ơn gia đình, bạn bè và các anh em trong công ty đã ủng hộ và tạo điều kiện cho tôi trong suốt quãng thời gian học tập và nghiên cứu. Tôi xin được bày tỏ lòng biết ơn đến đề tài nghiên cứu khoa học số 102.02-2015.32 do quỹ phát triển khoa học công nghệ Quốc gia (National Foundation for Science and Technology Development - NAFOSTED) tài trợ đã cho tôi cơ hội được thực hiện nghiên cứu của mình.1 CHƯƠNG 1. TỔNG QUAN VỀ LUẬN VĂN 1.1. Bất thường và các phương pháp phát hiện bất thường phổ biến 1.1.1. Bất thường Bất thường là những đối tượng, sự kiện hay dấu hiệu không mong muốn hoặc không giống với hầu hết những đối tượng, sự kiện hay dấu hiệu còn lại trong tập dữ liệu [2]. Bất thường thường có tính chất tạm thời, xuất hiện hay biến mất không tuân theo quy luật. Việc phát hiện bất thường là quan trọng vì chúng thường chứa đựng những thông tin hữu ích, có ý nghĩa trong nhiều ứng dụng thực tế. Ví dụ như, sự biến đổi bất thường của lưu lượng dữ liệu trong mạng nội bộ có thể là dấu hiệu của dữ liệu “nhạy cảm” đang bị sao chép hoặc gửi bởi kẻ tấn công. Trong thực tế, bất thường tồn tại ở nhiều dạng khác nhau, do vậy tùy thuộc vào từng ứng dụng cụ thể mà ta có những phương pháp phát hiện bất thường khác nhau. Bất thường có thể được chia làm ba loại chính, bao gồm bất thường điểm (point anomalies), bất thường bối cảnh (contextual anomalies) và bất thường tập hợp (collective anomalies) [2]. Cụ thể, bất thường điểm là loại đơn giản nhất, khi những điểm có khoảng cách đến trung tâm của một tập dữ liệu lớn hơn so với tất cả các khoảng cách từ những điểm trong tập hợp đó tới trung tâm này thì những điểm này được coi là bất thường. Hình 1.1 mô tả các điểm ,, và tập hợp điểm là bất thường so với các điểm nằm trong cụm và . Trong khi đó, bất thường bối cảnh được xác định dựa trên một bối cảnh cụ thể. Khái niệm bối cảnh ở đây được xác định từ cấu trúc, hình thái của dữ liệu đang xem xét. Cần lưu ý rằng, một điểm là bất thường trong bối cảnh này nhưng có thể hoàn toàn là bình thường trong bối cảnh khác. Bất thường bối cảnh thường được nghiên cứu, khám phá trong các ứng dụng liên tới các dữ liệu2 biến đổi theo thời gian. Hình 1.2 mô tả biểu đồ nhiệt độ của các tháng trong ba năm liên tiếp. Hình 1.1: Ví dụ về điểm bất thường trong không gian hai chiều [2]. Ta nhận thấy rằng, thời điểm được coi là một bất thường bối cảnh, trong khi đó với một thời điểm khác có cùng nhiệt độ với là , nhưng lại không được coi là bất thường. Hình 1.2 Ví dụ về bối cảnh bất thường [2]. Loại bất thường thứ ba là bất thường tập thể. Nếu một tập dữ liệu có những đặc trưng khác so với các tập hợp dữ liệu còn lại thì tập hợp ấy được coi là bất thường. Hình 1.3 mô tả dữ liệu điện tâm đồ (ECG) của một người bệnh. Ta có thể thấy, biên độ của tín hiệu trong khoảng thời gian từ mẫu thứ 1000 đến3 1500 khác hoàn toàn với các thời điểm còn lại, mặc dù những mẫu dữ liệu là khá tương đồng nhau trong khoảng thời gian này, những thời điểm này được coi là bất thường tập thể. Hình 1.3. Ví dụ về bất thường tập hợp trong tín hiệu điện tim. 1.1.2. Các phương pháp phát hiện bất thường phổ biến Có nhiều phương pháp phát hiện bất thường đã được đề xuất. Ta có thể phân thành các nhóm chính như sau: nhóm phương pháp dựa trên kỹ thuật phân lớp, nhóm phương pháp dựa trên kỹ thuật phân cụm, nhóm phương pháp dựa trên kỹ thuật phân tích phổ, và một số nhóm khác nữa [2]. Cụ thể là nhóm phương pháp đầu lấy ý tưởng từ thực tế rằng ta có thể phân tách tập dữ liệu thành hai lớp “bình thường” và bất thường thông qua việc xây dựng một mô hình phân loại trên phần dữ liệu được huấn luyện trước. Một số mô hình phân loại đã được sử dụng trong việc phát hiện bất thường có thể kể đến là mạng nơ-ron nhân tạo [3], mạng Bayesian [4] và SVM [5]. Ưu điểm của nhóm phương pháp này là các thuật toán có thể xử lý được những dữ liệu đa lớp với khả năng chính xác cao, cũng như thời gian phát hiện bất thường nhanh. Tuy nhiên, nhóm phương pháp này vẫn còn đối mặt với một số hạn chế sau như các thuật toán thường ràng buộc dữ liệu phải cho biết trước nhãn cho những mẫu “bình thường” trong quá trình huấn luyện mô hình. Nhóm phương pháp phát hiện bất thường thứ hai là dựa trên các kỹ thuật phân cụm. Tượng tự như nhóm phương4 pháp đầu, nhóm phương pháp này dựa trên giả thiết rằng (i) những dữ liệu “bình thường” thuộc vào một cụm dữ liệu, trong khi những dữ liệu “bất thường” không thuộc hoặc thuộc một cụm dữ liệu khác, (ii) hay như những dữ liệu bình thường thuộc về những cụm dữ liệu lơn, dày, đồng thời các điểm bât thường sẽ thuộc về các cụm thưa. Cụ thể hơn, các cụm được phát hiện trong dữ liệu sẽ được loại và đồng thời những mẫu dữ liệu còn lại sẽ được gán là bất thường. Nhóm phương pháp này có những ưu điểm sau đây: (i) thường được áp dụng trong những bài toán học không giám sát khi mà dữ liệu chưa có thông tin gán nhãn, (ii) có thể xử lý được những dữ liệu phức tạp. Tuy vậy, các phương pháp này phụ thuộc nhiều vào sự hiệu quả của loại thuật toán phân cụm, đồng thời độ phức tạp thuật toán tương đối cao [2]. Nhóm thứ ba liên quan tới việc phân tích phổ của dữ liệu. Các phương pháp trong nhóm này lấy ý tưởng từ thực tế rằng khi dữ liệu được nhúng trên một không gian con có số chiều nhỏ hơn so với không gian dữ liệu gốc, thì những mẫu dữ liệu “bình thường” và bất thường có thể phát hiện dễ dàng dựa trên sự khác nhau của chúng. Ví dụ, nhóm tác giả ở [6] đã sử dụng một kỹ thuật phân tích phổ để phát hiện những bất thường trong các đồ thị web biến đổi theo thời gian hay như PCA đã được sử dụng để phát hiện bất thường trên dữ liệu tập dữ liệu KDD Cup 1999 ở [7]. Lợi thế của nhóm phương pháp này là (i) có khả năng phát hiện được bất thường trong các loại dữ liệu có số chiều lớn, và (ii) tương tự như nhóm thứ 2, các phương pháp trong nhóm này thường được áp dụng trong các bài toán học không giám sát. Mặc dù vậy, độ phức tạp tính toán của nhóm phương này tương đối cao. 1.2. Phát hiện xung động kinh trong dữ liệu EEG 1.2.1. Bệnh động kinh và xung động kinh Ngày nay, việc áp dụng các tiến bộ khoa học công nghệ vào các lĩnh vực của cuộc sống nói chung và y sinh nói riêng đã và đang được nghiên cứu, thực hiện hàng ngày. Một trong số đó là hỗ trợ chẩn đoán bệnh động kinh.5 Động kinh là một loại rối loạn thần kinh, được đặc trưng bởi những xung động kinh xuất hiện lặp đi lặp lại nhiều lần [1]. Trong chẩn đoán động kinh, điện não đồ (EEG) là một trong những công cụ phổ biến giúp theo dõi các hoạt động của não bằng cách sử dụng các điện cực đặt trên da đầu [8]. Các tín hiệu điện não đầu tiên được truyền qua các tấm điện cực, sau đó được gửi đến một máy tính với màn hình hiểu thị các dạng tín hiệu [9], xem hình 1.4. Hình 1.4. Mô hình thu thập dữ liệu EEG. Từ đó, khi quan sát tín hiệu EEG, các bác sĩ có thể xác định loại bệnh động kinh và khu vực não bị tổn thương dựa vào thông tin từ các xung động kinh (epileptic seizures) và gai động kinh (epileptic spikes). Xung động kinh sẽ xuất hiện gây lên cơn co giật, do bởi sự phóng điện bất thường, quá mức của các nơ-ron thần kinh trong não bộ. Trong khi, gai động kinh sẽ xuất hiện trên điện não đồ trước hoặc sau khi cơn co giật xuất hiện. Cả xung động kinh và gai động kinh được xem là những bất thường trong dữ liệu EEG. Trong nghiên cứu này, loại bất thường mà chúng tôi quan tâm là xung động kinh. Trong xung động kinh lại chia làm hai loại chính là xung động kinh cục bộ (partial seizures) và xung động kinh toàn bộ (generalised seizures). Xung6 động kinh cục bộ gây ra bởi những rối loạn thân kinh tại một số phần tổn thương của não bộ, dẫn tới xung động kinh chỉ hiện trên những vùng này, trong khi những vùng khác bình thường. Hình 1.5 minh họa một số thời điểm và vùng có xung động kinh cục bộ. Trong khi, xung động kinh toàn cục xảy ra trên toàn bộ đầu. Hình 1.6 là một ví dụ về xung động kinh toàn cục. Hình 1.5. Ví dụ về xung động kinh cục bộ [10] Thời điểm xảy ra động kinh cũng được chia thành nhiều loại: thời điểm giữa hai cơn động kinh (Interictal), thời điểm dẫn tới động kinh (Preictal), thời điểm trong khi động kinh (Ictal) và thời điểm sau động kinh (Post-ictal) [11]. Điểm mấu chốt là nắm bắt được thời điểm dẫn tới cơn động kinh để có thể định lượng chính xác, phục vụ cho việc ngăn chặn cơn động kinh.7 Hình 1.6. Ví dụ về xung động kinh toàn bộ [5]. 1.2.2. Các phương pháp phát hiện xung động kinh Có rất nhiều nghiên cứu đã được đề xuất để giải quyết bài toán phát hiện xung động kinh trong dữ liệu EEG [11]. Ta có thể chia thành các nhóm phương pháp chính như (i) dựa trên miền thời gian (ví dụ như, sự khác nhau về hình ảnh giữa các khoảng thời gian), (ii) dựa trên miền tần số (ví dụ như, sử dụng các bộ lọc), (iii) dựa trên miền thời gian-tần số (ví dụ như, phân tích tín hiệu thành các băng tần con sử dụng biến đổi wavelet), (iv) thực nghiệm (ví dụ như, biến đổi tín hiệu thành nhóm các hàm dạng bản chất, các hàm này cho thấy sự khác nhau giữa các hoạt động bình thường và bất thường trong tín hiệu), (v) phân tích ma trân (ví dụ như, SVD, PCA). Một số ví dụ điển hình có thể kể đến như sau. A. Subasi cùng cộng sự đã đề xuất một phương pháp phát hiện xung động kinh thích nghi, tận dụng những ưu điểm của biến đổi Wavelet [12]. Trong phương pháp này, tín hiệu được phân tích thành các băng tần con nhờ biến đổi wavelet rời rạc và các đặc trưng được trích xuất trực tiếp từ các băng tần đó. Sau đó, Subasi cùng cộng sự của mình sử dụng các phương pháp phân tích khác nhau như phân tích thành phần chính (PCA), phân tích thành phần độc lập và8 phân tích thành phần tuyến tính để giảm chiều của dữ liệu. Cuối cùng, mô hình máy vec-tơ hỗ trợ SVM được huấn luyện bởi các đặc trưng này để tìm ra một thời điểm có xung động kinh. Raghunathan cùng các cộng sự đã đề xuất thuật toán phát hiện xung động kinh dựa trên thiết kế những bộ lọc tần số [13]. Kết quả của nhóm cho thấy độ nhạy 87.5% và khả năng dự đoán chính xác thời điểm không xảy ra động kinh lên tới 99.82%. Hơn nữa, ưu điểm của phương pháp này là không cần phải trải qua huấn luyện mà chỉ dựa vào đặc trưng của các mẫu khác biệt trong tập dữ liệu ban đầu. R.J. Oweis đã sử dụng biến đổi Hilbert-Huang (phương pháp thực nghiệm) để phân tách xung động kinh và những xung điện não khác [14]. Thông tin về xung động kinh được bám sát theo biên độ và tần số của tín hiệu. S. Osman đã sử dụng phương pháp phân lớp có giám sát để phát hiện xung động kinh [8]. Cách tiếp cận của phương pháp này là sử dụng biến đổi wavelet rời rạc và bộ phân lớp Ant Colony. 1.3. Phân tích ten-xơ Dữ liệu EEG thông thường được biểu diễn dưới dạng một mảng 2 chiều, trong đó thành phần đầu tiên đại diện về mặt thời gian và trong khi thành phần thứ hai dùng để mô tả về mặt kênh đo (các điện cực). Trong nhiều trường hợp khi chẩn đoán, việc khai thác thông tin EEG dựa trên những mảng 2 chiều này có thể chưa đủ, cần thiết phải có những thông tin khác như về mặt tần số, bệnh lý, nhóm tuổi, v.v. Dẫn tới, dữ liệu EEG cần những mô hình có thể mô tả được dữ liệu nhiều chiều. Ten-xơ là một giải pháp hữu ích. Ten-xơ là một cấu trúc toán học nhằm biểu diễn cho các mảng dữ liệu đa chiều [15]. Theo đó, phân tích ten-xơ trở thành một công cụ mạnh mẽ, được áp dụng một cách rộng rãi trong lĩnh vực khoa học dữ liệu nói chung và xử lý tín9 hiệu nói riêng [16]. Hai loại phân tích ten-xơ phổ biến là CP/PARAFAC và Tucker. CP/PARAFAC là mô hình phân tích một ten-xơ thành tổng các ten-xơ hạng một, trong đó ten-xơ hạng một ở đây chỉ những ten-xơ là kết quả từ việc nhân ngoài (outer product) của n vec-tơ với nhau, với n là bậc của ten-xơ. Mô hình phân tích Tucker được xem là dạng tổng quát của phân tích giá trị riêng (singular value decomposition - SVD) cho ten-xơ, nó đồng thời linh hoạt hơn về mặt cấu trúc khi so với CP. Cụ thể, Tucker cho phép ta phân tích một ten-xơ thành 1 ten-xơ con với những ma trận thành phần tương ứng, các ma trận này không bị ràng buộc phải cùng hạng ma trận. Nhiều nghiên cứu trước đây đã sử dụng phân tích ten-xơ để áp dụng vào các bài toán cụ thể khi xử lý dữ liệu EEG nói chung và phân tích xung động kinh nói riêng. Một số ví dụ có thể tìm kể đến là: (i) Trong [17], Acar sử dụng phương pháp phân tích dựa trên CP/PARAFAC để định vị được phân vùng của não bộ xảy ra xung động kinh trên 7 bệnh nhân. Tuy nhiên, với số chiều lớn hơn 5, phương pháp cho kết quả không tốt. (ii) Trong [18], phương pháp phân tích CP bậc cao được sử dụng để phát hiện vùng não bộ xảy ra xung động kinh trên dữ liệu được biến đổi wavelet. Các nhà nghiên cứu đã xác định chính xác các vùng não bộ lên đến 92% trong khi các chuyên gia về phân tích dữ liệu não bộ bằng hình ảnh chỉ có thể xác định đúng được 57%. (iii) Trong [19], W. Deburrchgraeve cùng các cộng sự của mình đã sử dụng các biến thể khác của phương pháp phân tích CP để phát hiện vùng não bộ xuất hiện xung động kinh. Tuy nhiên các nghiên cứu này chỉ tập trung vào việc định vị khu vực tổn thương trên não bộ. Trong khi bài toán xác định được chính xác thời điểm xuất hiện xung động kinh sử dụng phân tích ten-xơ hiện chưa được quan tâm, mặc dù đã có rất nhiều công trình nghiên cứu khác đã thực hiện thành công việc này như đã được đề cập ở mục 1.2.2. Chính vì thế, trong nghiên cứu này, chúng tôi mong muốn tìm kiếm được một phương pháp tận dụng được những ưu điểm của phân tích ten-xơ vào việc xác định được thời điểm xuất hiện xung động kinh trên dữ liệu EEG.10 1.4. Khái quát nội dung luận văn Trong nghiên cứu này, chúng tôi áp dụng thuật toán phân tích HOSVD, là một loại của phân tích Tucker cho ten-xơ, để phát hiện xung động kinh bất thường trong dữ liệu EEG. Nguồn cảm hứng chính của nghiên cứu này là lấy trực tiếp từ một hệ thống phát hiện gai động kinh sử dụng phân tích Tucker không âm mới được đề xuất gần đây [20]. Cụ thể hơn, mô hình chung hệ thống phát hiện xung động kinh trong dữ liệu EEG có thể được mổ tả như sau: Xây dựng tensorD ữ liệu EEGPhân tích tensorTensorPhát hiện bất thườ ngMa trận hệ sốBiểu diễn đồ thị bất thườ ng Hình 1.7 Mô hình hệ thống phát hiện xung động kinh trong dữ liệu EEG sử dụng phân tích ten-xơ Đầu tiên, tất cả các đỉnh (peaks) của tín hiệu EEG được đánh dấu lại, sau đó, những đỉnh có biên độ nhỏ, không đáng kể sẽ bị loại bỏ trong quá trình tiền xử lý. Tiếp đến, để xây dựng ten-xơ bậc 3 cho các đoạn tín hiệu EEG, chúng tôi sử dụng biến đổi sóng con liên tục (continuous wavelet transform - CWT), là một công cụ rất hữu hiệu dùng để phân tích tín hiệu trên đồng thời hai miền thời gian và tần số, nhằm thu được thông tin hữu ích của tín hiệu EEG trên miền tần số. Sau khi đã có dữ liệu dạng ten-xơ, chúng tôi chiếu các ten-xơ lên một không gian đăc trưng để sinh ra các vec-tơ đặc điểm, đại diện cho các ten-xơ này. Không gian gốc nhận được trực tiếp từ phân tích ten-xơ HOSVD. Cuối cùng, quá trình phát hiện bất thường được thực hiện bằng phân loại trên các vec-tơ đặc trưng thu được. Nếu ten-xơ thu được tại thời điểm t có vec-tơ đặc trưng nằm trong lớp bất thường thì thời điểm t được xem xét là bất thường, hay nói cách khác, thời điểm t là thời điểm chứa xung động kinh. Cụ thể hơn, toàn bộ quá trình phát hiện xung động kinh sử dụng phân tích HOSVD sẽ được trình bày cụ thể ở Chương 3 của luận văn.11 Về bố cục của luận văn, Chương 1 trình bày sơ lược về bất thường, các phương pháp phát hiện bất thường phổ biến, những bất thường trong dữ liệu EEG cũng như là bài toán phát hiện xung động kinh. Hơn nữa, phân tích ten-xơ và những ứng dụng của nó trong việc phát hiện xung động kinh cũng được tổng quan trong chương này. Chương 2 giới thiệu những khái niệm toán học cơ bản vê ten-xơ, phương pháp phân tích HOSVD và biến đổi sóng con liên tục CWT. Chương 3 trình bày về phương pháp phát hiện xung động kinh trong dữ liệu EEG sử dụng phân tích HOSVD. Chương 4 trình bày chi tiết về quá trình thực nghiệm, trong đó gồm tập dữ liệu sử dụng trong nghiên cứu, các độ đo dùng để đánh giá thuật toán và kết quả của hệ thống phân loại. Cuối cùng, Chương 5 thảo luận về các khía cạnh, ưu nhược điểm của việc áp dụng thuật toán HOSVD cũng như thuật toán khác vào việc phát hiện bất thường trong dữ liệu EEG và đưa ra kết luận.12 CHƯƠNG 2. NGHIÊN CỨU CƠ SỞ Trong chương này này, chúng tôi trước tiên trình bày sơ lược tổng quan về ten-xơ, các phép toán cơ bản của ten-xơ cũng như các ký hiệu toán học được sử dụng xuyên suốt trong nghiên cứu này. Sau đó, phương pháp phân tích HOSVD cho ten-xơ sẽ được giới thiệu trong phần thứ hai của chương. Phương pháp này chính là cơ sở cho việc trích chọn đặc trưng trong hệ thống đề xuất phát hiện xung động kinh. Cuối cùng, biến đổi sóng con wavelet liên tục cho các tín hiệu một chiều được trình bày trong phần còn lại của chương. 2.1. Các khái niệm về ten-xơ Ten-xơ là một cấu trúc toán học mở rộng cho ma trận, nhằm biểu diễn những mảng dữ liệu bậc cao, trong đó khái niệm bậc ở đây là chỉ số lượng chiều của không gian vec-tơ sinh ra mảng này [21]. Lưu ý rằng, vec-tơ và ma trận được coi là những dạng ten-xơ đặc biệt với số bậc lần lượt là một và hai. Ví dụ, hình 2.1 biểu diễn một ten-xơ bậc ba, ∈××. Hình 2.1. Ten-xơ ba chiều.  Bậc của ten-xơ như đã được giới thiệu ở trên. Ten-xơ bậc 1 là vec-tơ, ký hiệu là chữ viết thường in đậm, ví dụ như x, ten-xơ bậc 2 là ma trận, ký hiệu bởi chữ viết hoa in đậm ví dụ như X, ten-xơ có bậc lớn hơn hoặc bằng 3 được ký hiệu là .13  Phần tử thứ i của một vec-tơ x là , phần tử thứ (i,j) của ma trận X là , trong khi phần tử thứ (i,j,k) của ten-xơ bậc ba là , v.v.  Lát cắt (slide) là những ma trận được tách ra từ một ten-xơ có bậc lớn hơn hai. Những ma trận này nhận được từ việc cắt lát ten-xơ khi giữ cố định hai chiều bất kỳ của ten-xơ đó. Ví dụ, hình 2.2 mô tả lát cắt ngang, lát cắt dọc và lát cắt chính diện của một ten-xơ bậc ba (a) Lát cắt ngang: i:: (b) Lát cắt bên: :j: (c) Lát cắt trước: ::k Hình 2.2. Các lát cắt của một ten-xơ bậc 3 [21]  Chế độ (mode): là cách sắp xếp các vec-tơ của một ten-xơ. (a) Chế độ 1: x:jk (b) Chế độ 2: xi:k (c) Chế độ 3: xij: Hình 2.3. Các chế độ của một ten-xơ bậc ba [21]  Chuẩn của một ten-xơ được xác định bằng căn bậc hai của tổng bình phương tất cả các phần tử của ten-xơ đó, tương tự như chuẩn Frobenius của ma trận, cụ thể là:14 ‖‖=…… (2.1)  Ma trân hóa ten-xơ: Ma trận hóa là phương pháp chuyển đổi ten-xơ thành một ma trận bằng cách sắp xếp lại các phần tử của ten-xơ này vào trong một ma trận. Để trực quan, ta có thể xem ví dụ sau đây: giả sử ta có một ten-xơ bậc 3 ∈×× có 2 lát cắt trước và cho bởi: =159261037114812,=131721141822151923162024. (2.2) Khi đó, ta có ba cách biểu diễn ten-xơ X thành ma trận có kích thước 2×12,3×8hoặc4×6 như sau ()=159261037114812131721141822151923162024, (2.3) ()=123456759101112131415161715192021222324, (2.4) ()=113517921…4168201224. (2.5)  Nhân ten-xơ chế độ n là phép nhân của một ten-xơ ∈××…×với một ma trận U ∈×, ký hiệu là × . Kết quả trả về là một ten-xơ có kích thước là ×…××××…×, với các phần tử được xác định như sau: (×)……=… (2.6)15 2.2. Thuật toán phân tích HOSVD HOSVD là một dạng phân tích mở rộng của SVD cho các ten-xơ bậc cao. Ghi chú rằng, một ma trận là một ten-xơ bậc 2. Cụ thể hơn, thuật toán HOSVD sẽ được trình bày trong phần dưới đây. Trước khi trình bày thuật toán phân tích HOSVD cho các ten-xơ bậc cao, chúng tôi khái lược những ý chính của phân tích SVD. Hình 2.4.Phân tích SVD Cho một ma trận ∈× có hạng r, phân tích SVD cho ta một dạng biểu diễn của theo tích của ba ma trận trực giao,, như sau = (2.7) trong đó, ∈×, ∈× là ma trận vec-tơ riêng trái, và phải, ma trận đường chéo ∈× chứa các giá trị riêng (phổ của ma trận), trong đó có r giá trị khác không, ,,…,≠0, xem hình 3.1. Công thức của phân tích SVD (2.7) cho ma trận có thể được viết lại dưới dạng tích của ten-xơ như sau =×× với “×” biểu diễn cho phép nhân chế độ i của 2 ma trận. Do đó, một cách tổng quát cho một ten-xơ ∈×…× bậc n, ta kỳ vọng có được phép phân tích tương tự như SVD: =××…× (2.8)16 trong đó, G ∈×…× được gọi là ten-xơ lõi (core tensor), chứa các đặc điểm của ten-xơ gốc , được gọi là các ma trận thành phần (loading matrix). Mô hình trong (2.8) được gọi là phân tích Tucker cho ten-xơ. Có rất nhiều thuật toán được đề xuất để giải quyết (2.8), một trong số đó phải kể đến là thuật toán HOSVD. Hình 2.5 minh họa mô hình phân tích HOSVD cho một ten-xơ bậc 3. Hình 2.5. Phân tích HOSVD cho ten-xơ bậc 3. Giả sử, ta có một tập các ten-xơ bậc n, ∈×…×. Khác với PARAFAC, bậc trong HOSVD là một mảng =[,,…]. Mục đích của HOSVD là tìm các ma trận gốc mô tả chính xác nhất các chiều của tensor mà những ma trận này không phụ thuộc lẫn nhau bằng cách tính ma trận riêng trái của mỗi chế độ. Hình 3.3 mô tả mã giả của thuật toán HOSVD [21].17 procedure HOSVD(X, =[,,…]) for n = 1,…,N do ()←vector riêng bên trái của () end for G←×()×()…×() return G, (),(),…,() end procedure Hình 2.6. Thuật toán HOSVD 2.3. Biến đổi sóng con liên tục - CWT Biến đổi sóng con (wavelet transform) là một công cụ mạnh mẽ để phân tích tín hiệu trên đồng thời cả hai miền thời gian - tần số [22]. Biến đổi sóng con có hai loại chính là biến đổi sóng con liên tục CWT và biến đổi sóng con rời rac DWT. Trong đó, CWT thường tốt hơn DWT để phân tích các tín hiệu EEG vì CWT có thể cho phép chúng ta khảo sát trên tất cả các dải tần mong muốn [23]. Cụ thể, CWT phân tách các tín hiệu gốc ra thành những phiên bản dịch và co dãn của một hàm mẹ (mother function) (). CWT của một tính hiệu x(t) xây dựng từ một hàm sóng mẹ () được định nghĩa như sau (2.9) trong đó, “ * ” ký hiệu cho toán tử liên hợp phức, các sóng con ,() được xác định bằng18 (2.10) với, a, lần lượt là hệ số co dãn và dịch theo thời gian. Biến đổi ngược của CWT được tính như sau: ()=1(();,),()dτ (2.11) với giá trị của hằng số C được cho bởi =|()||| (2.12) ()là hàm đối ngẫu của (). Hàm hàm sóng mẹ () có thể là bất cứ các hàm số liên tục theo thời gian nào thỏa mãn các tính chất sau: (i) tích phân suy rộng của sóng mẹ là bằng 0, ()=0 (2.13) và (ii) năng lượng của hàm sóng mẹ phải hữu hạn, cụ thể là: |()|<+∞ (2.14)19 CHƯƠNG 3. HỆ THỐNG PHÁT HIỆN XUNG ĐỘNG KINH SỬ DỤNG HOSVD Trong chương này, chúng tôi trình bày về một hệ thống phát hiện xung động kinh sử dụng phương pháp phân tích ten-xơ HOSVD. Hệ thống này gồm 3 giai đoạn chính: (i) biểu diễn dữ liệu EEG, (ii) trích trọn đặc trưng và (iii) phân loại. Cụ thể hơn hệ thống đề xuất được mô tả như hình vẽ dưới đây: Hình 3.1. Mô tả hệ thống phát hiện xung động kinh 3.1. Biểu diễn dữ liệu EEG Trong giai đoạn này, chúng tôi nhằm xây dựng các ten-xơ bậc 3 biểu diễn cho xung động kinh và cho các hoạt động “bình thường” của não bộ, với mục20 tiêu tạo ra một tập dữ liệu 3D gồm 2 lớp xung động kinh và “bình thường”. Cụ thể hơn, quá trình xây dựng ten-xơ EEG cho 2 nhóm được thực hiện như sau: BIẾN ĐỔI DỮ LIỆUKênh 1Kênh 2..Kênh 1512000 mẫ uĐOẠN EEGBiến đổi WaveletXThời gianKênh Hình 3.2. Quá trình tạo ten-xơ bậc 3 Từ các dữ liệu EEG gốc của các bệnh nhân, N đoạn tín hiệu chứa các xung động kinh đã được đánh dấu, trong đó, mỗi đoạn tín hiệu này được biểu diễn bởi một ma trận I hàng về mặt thời gian và J cột về mặt không gian. Các đoạn tín hiệu này sau đó được phân tích thời gian - tần số sử dụng biến đổi sóng con CWT với Mexican hat là hàm sóng mẹ trên K đơn vị co dãn (scale). Sóng mẹ được chọn lựa là Mexican hat bởi vì những ưu điểm của nó trong việc xử lý hiệu quả cho các tín hiệu không dừng như EEG với xung động kinh [23]. Cụ thể hơn, sóng mẹ Mexican hat được định nghĩa bởi (3.1) trong đó à một hằng số có vai trò giống như độ lệch chuẩn trong thống kê. Từ đó, ta có thể thu được các ten-xơ bậc 3 biểu diễn cho các xung động kinh có kích thước (I x J x K ) biểu diễn về mặt thời gian - không gian - tần số.21 Hình 3.3. Hàm Mexican hat Tương tự như xây dựng ten-xơ cho xung động kinh, ta thu được một bộ ten-xơ bậc 3 có tính chất tương tự để biểu diễn cho các hoạt động bình thường của não. 3.2. Trích trọn đặc trưng 3.2.1. Trích trọn đặc trưng Quá trình trích trọn đặc trưng được thực hiện thông qua việc xác định không gian đặc điểm của dữ liệu và các vec-tơ đặc trưng thu được bằng cách chiếu dữ liệu gốc lên không gian đặc điểm vừa mới thu được này. Cụ thể, trong nghiên cứu này, mục tiêu của chúng tôi là tìm ra một không gian đặc trưng sao cho có thể đại diện chung cho các ten-xơ xung động kinh. Về mặt lý thuyết, các ten-xơ đại diện cho các hoạt động bình thường của bộ não sẽ không nằm trong không gian này, do đó, việc chiếu các ten-xơ này lên sẽ sinh ra các điểm khác biệt so với các ten-xơ xung động kinh. Để tìm không gian đặc trưng cho các xung động kinh, ta cần phải đi tối thiểu hóa hàm mục tiêu sau đây: =‖×××‖ (3.2)22 Trong đó, là các ten-xơ bậc 3 đại diện cho xung động kinh, là ten-xơ lõi chưa toàn bộ đặc điểm của xung động kinh, trong khi ,, là các ma trận thành phần để xây dựng lên không gian đặc trưng. Hình 3.4. Mô tả quá trình trích chọn đặc trưng. Dao và các cộng sự đã đề xuất một phương pháp để giải quyết (3.2) bằng cách xếp chồng các ten-xơ xung động kinh lại với nhau để hình thành một ten-xơ bậc 4 sau đó dung phân tích ten-xơ cho để tìm ra các ma trận thành phần chung của các ten-xơ xung động kinh bậc 3 này [18]. Do đó, trong nghiên cứu này, chúng tôi áp dụng cách tương tự để tìm ra các ma trân thành phần chung ,và . Điểm khác biệt của nghiên cứu này so với [15] là chúng tôi sử dụng phân tích HOSVD thày vì phần tích Tucker không âm (NTD). Cụ thể, chúng tôi chỉ xếp chồng các ten-xơ bậc 3 đại diện cho các xung động kinh trong dữ liệu EEG để thu được một ten-xơ bậc 4 đại diện chung cho xung động kinh của toàn bộ bệnh nhân. Sau đó, HOSVD được sử dụng để phân rã ten-xơ bậc 4 này và nhận lấy ra các ma trận thành phần,và23 đại diện chung cho tất cả các xung động kinh. Vec-tơ đặc trưng thu được bằng cách chiếu ten-xơ lên các ma trận hệ số: =××× (3.3) =() (3.4) Quá trình trích trọn đặc trưng được minh họa qua hình 3.3. 3.2.2. Xác định hạng ten-xơ xung động kinh Trong phân tích ten-xơ, xác định hạng đa tuyến của ten-xơ là việc làm tiên quyết và quan trọng. Kết quả của quá trình xác định hạng của ten-xơ sẽ giúp ta có được một ten-xơ xấp xỉ tốt. Trong nghiên cứu này, phân tích SVD được sử dụng để xác định hạng đa tuyến cho ten-xơ xung động kinh. Cụ thể hơn, ta đi được xác định khoảng cách eigengap, hay còn gọi là khoảng cách giữa hai trị riêng liên tiếp. Tuy nhiên, trong miền thời gian, việc biểu diễn khoảng cách này gặp khó khăn khi không gian trong miền thời gian lớn hơn rất nhiều so với các miền còn lại. Vì vậy, để nhận biết được khoảng cách “như nào là lớn”, chúng tôi sử dụng độ đo variance, hay còn gọi độ tương quan. Dựa vào độ tương quan, số lượng các thành phần của từng miền của ten-xơ có thể xấp xỉ bằng cách chọn giá trị r sao cho khoảng cách egengap hoặc độ tương quan là lớn nhất. Hai độ đo này được xác đinh như sau =|| (3.5) =∑∑100% (3.6) 3.3. Phân loại Sau khi qua bước trích trọn đặc trưng, ta dữ thu được một tập dữ liệu các đặc điểm đại diện cho xung động kinh và hoạt động binh thường của não bộ. Những bộ đặc điểm này sẽ được chia làm hai phần để phục vụ cho quá trình24 huấn huyện và kiểm thử. Cụ thể hơn, trong giai đoạn phân loại, chúng tôi sử dụng một số bộ phân loại cổ điển như SVM và KNN. Mục đích của SVM là phân lớp tập dữ liệu thành hai phần riêng biệt bằng siêu phẳng. Siêu phẳng này nằm giữa không gian có độ rộng được giới hạn bởi biên độ lớn nhất. Biên độ lớn nhất là khoảng cách giữa siêu phẳng đến các điểm dữ liệu gần nhất tương ứng với các phân lớp. Điểm quan trọng ở đây là SVM cố gắng gia tăng biên độ này, từ đó thu được siêu phẳng tạo khoảng cách xa nhất so với các đối tượng thuộc phân lớp khác nhau. Nhờ vậy, SVM có thể giảm thiểu việc phân lớp sai đối với điểm dữ liệu mới đưa vào. Điểm làm SVM hiệu quả hơn các phương pháp khác chính là vệc sử dụng phương pháp kernel giúp cho SVM không còn bị giới hạn bởi việc phân lớp một cách tuyến tính, hay nói cách khác các siêu phẳng có thể được hình thành từ các hàm phi tuyến. Ưu điểm của SVMC là có thể xử lý trên không gian có số chiều cao, tiết kiệm bộ nhớ và có tính linh hoạt cao. Bên cạnh đó, KNN cũng được sử dụng khá nhiều trong lĩnh vực khai phá dữ liệu. KNN là phương pháp phân lớp các đối tượng dựa vào khoảng cách gần nhất giữa đối tượng cần xếp lớp và tất cả các đối tượng trong tập dữ liệu huấn luyện. Một đối tượng được phân lớp dựa vào K người láng giềng của nó, trong đó K là một số nguyên dương được xác định trước khi thực hiện thuật toán. Thông thường, ta dùng khoảng cách Euclidean để tính khoảng cách giữa các đối tượng. Ưu điểm của KNN là độ phức tạp tính toán của quá trình huấn luyện là bằng 0. Ngoài ra, việc dự đoán kết quả của dữ liệu mới đơn giản và không cần giả sử về phân phối của các lớp cũng là một ưu điểm lớn của KNN. Tuy nhiên, KNN rất nhạy cảm với nhiễu khi K nhỏ và việc tính khoảng cách tới từng điểm dữ liệu trong tập huấn luyện sẽ tốn rất nhiều thời gian trong trường hợp dữ liệu có số chiều lớn và nhiều điểm dữ liệu, kéo theo việc lưu toàn bộ dữ liệu trong bộ nhớ cũng ảnh hưởng tới hiệu năng của KNN.25 CHƯƠNG 4. KẾT QUẢ THỰC NGHIỆM VÀ KẾT LUẬN 4.1. Tập dữ liệu Trong nghiên cứu này, chúng tôi sử dụng bộ dữ liệu động kinh từ Kaggle [24]. Cụ thể, bộ dữ liệu EEG này được ghi lại bằng một hệ thống điện não đồ với 15 kênh, tần số lấy mẫu là 5000Hz và thời gian đo khoảng một giờ đồng hồ trước thời điểm lên cơn co giật từ 02 bệnh nhân. Dữ liệu được chia các đoạn dữ liệu EEG dài 6 giây, với 3 triệu mẫu dữ liệu/1 kênh. Trong đó, có 50 đoạn “Interictal” là dữ liệu không có xung động kinh và 18 đoạn “Preictal” là dữ liệu có xung động kinh. Bộ dữ liệu này gồm nhiều thuộc tính khác nhau, chúng tôi quan tâm vào 2 thuộc tính sau đây:  data: ma trận EEG chứa các giá trị đo lường, hàng đại diện cho các điện cực, cột là sô mẫu được thu thập theo thời gian.  sampling_frequency: tần số lấy mẫu của dữ liệu (5000Hz). Hình 4.1 và 4.2 minh họa dữ liệu EEG đươc sử dụng trong nghiên cứu này. Hình 4.1. Tín hiệu EEG trên một số kênh trong dữ liệu EEG26 Hình 4.1 mô tả tín hiệu EEG trên 6 kênh khác nhau được chúng tôi lấy từ tập dữ liệu Kaggle, với thời điểm từ 25001 đến 50000 có chứa xung động kinh. Có thể thấy, việc một người bình thường xác định thời điểm xảy ra xung động kinh là rất khó. Bên cạnh đó, hình 4.2 biểu diễn một thời xảy ra xung động kinh khác mà mắt thường có thể dễ dàng nhận ra. Hình 4.2. Đoạn dữ liệu kiểm thử chứa dữ liệu dẫn tới co giật Trong quá trình tiền xử lý, chúng tôi nhận thấy rằng, thông thường tần số của sóng điện não có thể chia thành những dải tần sau đây [25]: (i) dải delta (<3.5Hz), theta (3.5-7.5Hz), alpha (7.5-12.5Hz), beta (12.5-50Hz). Vì thế, ta có thể giảm số lượng các mẫu, làm tăng tốc độ xử lý tính toán trong khi vẫn đảm bảo được lượng thông tin không bị mất mát, chúng tôi downsample toàn bộ dữ liệu này thế một lần nữa. Cụ thể, tần số lấy mẫu mới được sử dụng trong nghiên EEG (mV)27 cứu này là Fs = 200Hz. Chúng tôi nhận Fs được từ việc phân tích phổ của dữ liệu EEG này ra để chọn ra tần số lấy mẫu mới sao cho gấp đôi tần số lớn nhất trong bộ dữ liệu theo tiêu chuẩn Nyquist, xem hình 4.1. Như vậy, chúng tôi thu được một bộ dữ liệu mới đã được downsample với số lượng mẫu ít hơn và dung lượng nhỏ hơn. Cụ thể hơn, mỗi 1 đoạn tín hiệu EEG, chúng tôi có một ma trận dữ liệu tương ứng với kích thước 15 x 1200. Bộ dữ liệu này sẽ được đi vào các bước tiếp theo để xử lý. Hình 4.3. Phân tích Fourier của tín hiệu EEG.28 4.2. Đánh giá thuật toán Trong nghiên cứu này, chúng tôi sử dụng phương pháp cross-validation cùng độ đo chất lượng: sensitivity, accuracy, specificity, diện tích AUC và đồ thị ROC để đánh giá hiệu năng của hệ thống phân tách xung động kinh. Về phương pháp cross-validation, với dữ liệu có sẵn cũng như đặc tính của dữ liệu EEG, chúng tôi xây dựng năm bộ dữ liệu nhỏ khác nhau. Mỗi bộ dữ liệu gồm 2500 đoạn dữ liệu không có xung động kinh và 900 đoạn dữ liệu có xung động kinh. Tỉ lệ dữ liệu giữa quá trình huấn luyện và kiểm thử là: 4/1. Dữ liệu dùng để huấn luyện không được sử dụng trong quá trình kiểm thử hệ thống. Hình 4.4 mô tả việc sử dụng bộ dữ liệu trong phương pháp cross-validation. Dữ liệu có nhãn 1 là chứa xung động kinh, ngược lại, nhãn 0 là dữ liệu không chứa xung động kinh. Tại pha 1, chúng tôi cho học bộ phân lớp với tập dữ liệu tìm không gian gốc hoàn toàn là tập dữ liệu có chứa xung động kinh được sắp xếp ngẫu nhiên. Sau khi đã có không gian gốc, chúng tôi dùng thêm tập dữ liệu học (chứa hoặc không chứa xung động kinh được xáo trộn) để học bộ phân lớp. Tại pha 2, tập dữ liệu kiểm thử (không nằm trong tập dữ liệu huấn luyện) được đưa vào bộ phân lớp để dự đoán nhãn.29 Tập dữ liệu họcTập dữ liệu tìm không gi an gốcTập dữ liệu huấn luyệnTập dữ liệu kiểm thửBộ phân lớpHọc bộ phân lớpPha 1: Học bộ phân lớpPha 2: Sử dụng bộ phân lớp Hình 4.4. Mô tả quá trình sử dụng dữ liệu Về mặt ước lượng chất lượng hệ thống, sensitivity, accuracy, specificity, diện tích AUC và đồ thị ROC là những độ đo phổ biến. Cụ thể, coi đây là một bài toán phần lớp nhị phân: thời điểm có xung động kinh là dương (positive) và thời điểm không có xung động kinh là âm (negative). True Positive (TP) là số lượng các thời điểm thuộc lớp dương được phân loại chính xác vào lớp dương. False Positive (FP) là số lượng các thời điểm thuộc lớp âm bị phân loại nhầm vào lớp dương. True Negative (TN) là số lượng các thời điểm thuộc lớp âm được phân loại chính xác vào lớp âm. False Negative (FN) là số lượng các thời điểm thuộc lớp âm bị phân loại nhầm vào lớp dương. Sensitivity được định nghĩa là tỉ lệ số thời điểm thực sự dương trong số những thời điểm thực sự là dương. =+ (4.1)30 Sensitivity càng cao đồng nghĩa với chất lượng của hệ thống càng tốt. Sensitivity cao nghĩa là tỉ lệ bỏ sót các thời điểm có xung động kinh thấp. Độ chuẩn xác (Accuracy) dùng để chỉ xác suất dự đoán đúng trên tất cả các lần dự đoán của hệ thống =++++ (4.2) Bên cạnh đó, khả năng dự đoán đúng thời điểm không có xung co giật cũng được chúng tôi coi trọng. Để đánh giá, chúng tôi sử dụng độ đo Specificity: =+ (4.3) Cuối cùng, thông số AUC (Area Under the Curve) được dùng để đánh giá mô hình. Đại lượng này chính là diện tích nằm dưới đường cong ROC, có giá trị là một số dương nhỏ hơn hoặc bằng 1. Nếu giá trị này càng lớn thì mô hình được đánh giá càng tốt. 4.3. Kết quả Quá trình mô phỏng được thực hiện bằng Matlab cùng với các công cụ hỗ trợ như Ten-xơlab và Ten-xơ Toolbox để làm việc với ten-xơ. Tất cả các thí nghiệm được mô phỏng và thực thi máy tính có cấu hình: Bộ vi xử lý Intel Core i5-6500 4 nhân, RAM 16GB, đồ họa GeForce GTX 1060 6GB. Các kết quả thực nghiệm sẽ được trình bày trong phần dưới đây. 4.3.1. Xác định hạng đa tuyến của ten-xơ xung động kinh31 Kết quả thực nghiệm được thể hiện trên hình vẽ 4.3, 4.4 và 4.5. Cụ thể hơn, từ hình 3.4, chúng ta có thể thấy rằng hơn 100 thành phần đầu tiên có thể đại diện cho với 100 giá trị tương quan đầu tiên hơn các giá trị còn lại và đạt xấp xỉ 100% độ tương quan. Trong quá trình thực nghiệm, chúng tôi thấy 200 thành phần đầu tiên cho kết quả tốt và đây cũng là giá trị nằm trong khoảng có ý nghĩa. Hình 4.3. Độ tương quan các trị riêng theo miền thời gian.32 Hình 4.4. Độ tương quan các trị riêng theo miền tần số. Tương tự tại hình 4.4 và 4.5, chúng tôi chọn được 5 thành phần cho miền tần số và 15 thành phần cho miền kênh, để độ tương quan xấp xỉ bằng 100%. Do đó, hạng đa tuyến được sử dụng trong phân tích HOSVD là: =[200515] Hình 4.5. Độ tương quan các trị riêng theo miền kênh. 4.3.2. Trích chọn đặc trưng Từ 780 mẫu dữ liệu ten-xơ 3 chiều chứa xung động kinh, chúng tôi xếp chồng thành một ten-xơ bậc 4 có kích thước như sau∈×××. Bằng việc phân tích HOSVD cho ∈×××, chúng tôi thu được các ma trận thành phần có kích thước lần lượt là: ∈×, ∈× và ∈× với R = [200 5 15] là hạng đa tuyến đã được ước lượng trong phần trước. Các kết quả thực nghiệm được minh họa ở các hình 4.6 đến 4.9.33 Từ hình 4.6, ta có thể thấy được rằng mỗi thành phần sẽ đại diện cho một số yếu tố nhất định. Ví dụ, với ma trận hệ số gốc trên miền kênh , thành phần #2 tập trung đặc trưng cho kênh từ 12 đến 14, tương tự với các thành phần #1, #7, #10 và #14. Hình 4.6. Biểu diễn hình ảnh ma trận hệ số gốc . Sau đó, chúng tôi sử dụng biến đổi wavelet để tạo thành các ten-xơ 3 chiều như trong [20] với 15 kênh và mỗi ten-xơ bao gồm 1200 mẫu.34 Hình 4.7. Sự khác biệt giữa điểm của xung động kinh và hoạt động bình thường. 4.3.3. Kết quả phân loại Khi đã có một tập các ten-xơ, chúng tôi thực hiện quá trình chiếu ten-xơ lên không gian gốc, hay còn gọi là các ma trận hệ số, theo công thức (3.3), sau đó vec-tơ hóa thành vec-tơ đặc trưng. Những vec-tở đặc trưng này được chia làm hai tập dữ liệu con gồm tập huấn luyện và kiểm nha như tỉ lệ trong cross-valiation. Kết quả phân loại mô tả thống kê như được trình bày trong Bảng 4.1. Bảng cho thấy mô hình của chúng tôi có tỉ lệ bỏ sót các thời điểm thấp trong khi độ nhạy (SEN) rất tốt (có trường hợp 3 với tỉ lệ lên đến 100%), độ chuẩn xác trung bình (ACC) trên 78%, khả năng dự đoán đúng thời điểm không có xung co giật lên tới 72% . TH SE/NSE TP TN SEN ACC SPE AUC 1 180/500 176 400 0.98 0.85 0.80 0.93 2 180/500 174 290 0.97 0.68 0.58 0.86 3 180/500 180 338 1.00 0.76 0.68 0.93 4 180/500 178 374 0.99 0.81 0.75 0.96 5 180/500 172 386 0.96 0.82 0.77 0.95 Trung bình 176 357 0.98 0.78 0.72 0.92 Bảng 4-1. Đánh giá chất lượng mô hình Bên cạnh đó, chúng tôi sử dụng đồ thị ROC để đánh giá chất lượng mô hình. Với kết quả AUC lên đến hơn 86% trong cả năm trường hợp, đường ROC cũng cho thấy một kết quả tương đồng. Trên hình 4.8, đường cong ROC khá bám sát điểm (0,1) trong một tập dữ liệu cụ thể.35 Hình 4.8. Đồ thị ROC Hơn nữa, chúng tôi còn so sánh quá trình huấn luyện mô hình SVM của mình với mô hình KNN. Kết quả cho thấy SVM cho hiệu quả dự đoán tốt hơn KNN trên cùng một bộ dữ liệu. Tuy nhiên, cả hai bộ phân loại này để đưa ra tỉ lệ phát hiện đúng xung động kinh trên 98.0%. Mô hình TP TN SEN ACC SPE AUC SVM 178 396 0.99 0.84 0.79 0.93 KNN 176 316 0.98 0.72 0.63 0.80 Bảng 4-2. So sánh SVM với KNN Cuối cùng, chúng tôi thực hiện so sánh giữa phương pháp mà chúng tôi sử dụng là HOSVD với một phương pháp phân tích ten-xơ khác là CP. Kết quả cho thấy HOSVD hiệu quả hơn CP trong việc phân tích ten-xơ bậc cao (như Hình 4.9 và Bảng 4-3).36 Hình 4.9. So sánh đường ROC của HOSVD và CP Phương pháp TP TN SEN ACC SPE AUC HOSVD 178 392 0.99 0.84 0.79 0.93 CP 134 380 0.75 0.76 0.76 0.84 Bảng 4-3. So sánh HOSVD với CP 4.4. Kết luận Trong nghiên cứu này, chúng tôi đã phát hiện thành công các xung động kinh khi sử dụng các tiếp cận dựa trên phân tích ten-xơ. Cụ thể, thuật toán HOSVD lần đầu tiên được áp dụng trong bài toán phát hiện xung động kinh, có khả năng phân tích được các đặc điểm của dữ liệu EEG nói chung và xung động kinh nói riêng. Cách tiếp cận kết hợp giữa HOSVD và mô hình SVM mang lại kết quả phát hiện xung động kinh với độ chính xác cao hơn so với mô hình KNN cũng như phương pháp phân tích ten-xơ khác như CP/PARAFAC. Bên cạnh đó, khác với nghiên cứu [20], chúng tôi đã áp dụng thành công một phương pháp mới dựa trên ten-xơ để xây dựng được không gian đặc trưng37 cho xung động kinh. Trong [20], Đào cùng nhóm nghiên cứu của mình đã xây dựng không gian đặc trưng của gai động kinh bằng việc xếp chồng và trích chọn đặc trưng từ các thời điểm có xuất hiện và không xuất hiện gai động kinh. Trong nghiên cứu của mình, tôi đã xây dựng không gian đặc trưng của xung động kinh bằng cách xếp chồng và trích chọn đặc trưng từ các ten-xơ đại diện cho các thời điểm xuất hiện xung động kinh. Ngoài ra, thay vì sử dụng phương pháp phân tích ten-xơ không âm như trong [20], tôi sử dụng phương pháp phân tích ten-xơ HOSVD để xây dựng không gian đặc trưng của xung động kinh. Trong nghiên cứu của mình, chúng tôi sử dụng thực thi thí nghiệm trên máy tính có cấu hình: Bộ vi xử lý Intel Core i5-6500 4 nhân, RAM 16GB, đồ họa GeForce GTX 1060 6GB. Trong giới hạn phần cứng dùng để nghiên cứu của mình, tôi đã thực hiện được mục đích của nghiên cứu là xây dựng thuật toán phát hiện xung động kinh trong dữ liệu điện não. Các kết quả mô phỏng cho kết quả khá tích cực. Thời điểm được dự đoán chính xác, tỉ lệ lỗi nhỏ đối với cả thời điểm có xung động kinh và thời điểm không có xung động kinh, từ đó phần nào giúp người bệnh có một cuộc sống tốt hơn, phòng tránh những tai nạn đáng tiếc. Trong tương lai, chúng tôi sẽ tiếp tục nghiên cứu để nâng cao chất lượng phát hiện xung động kinh trong dữ liệu điện não EEG. Cụ thể, việc thay thế các thuật toán phân tích ten-xơ sẽ góp phần cải thiện thời gian tính toán như phân tích Tucker, phân tích Tucker không âm, phân tích thành phần chính. Bên cạnh đó, chúng tôi cũng muốn sử dụng các mô hình phân loại cao cấp hơn như các mô hình của deep learning. Đồng thời, quá trình thu thập cũng như phân tích dữ liệu của hệ thống này sẽ khiến ta phải đối mặt với một khối lượng dữ liệu rất lớn mà các công cụ phần mềm cơ sở dữ liệu bình thường không thể lưu trữ, quản lý và phân tích. Bên cạnh đó, việc xử lý tín hiệu liên tục EEG cần sử dụng biến đổi wavelet với các dải tần khác nhau. Chúng tôi đồng thời mong muốn nghiên cứu thêm các thuật toán khác để phát hiện được nhiều loại bất thường hơn, nhanh hơn và chính xác hơn, đem lại lợi ích nhiều hơn.38 TÀI LIỆU THAM KHẢO 1. (2018) “Epilepsy”, Availabe http://www.who.int/news-room/fact-sheets/detail/epilepsy 2. B. Arindam, C. Varun and K. Vipin (2009), “Anomaly detection: A survey”, ACM Computing Surveys, 31(3), pp. 1-72. 3. M. Augusteijn and B. Folkert (2002), “Neural network classification and novelty detection”, International Journal on Remote Sensing, 23(14), pp. 2891–2902. 4. K. Das and J. Schneider (2007), “Detecting anomalous records in categorical datasets”, In Proceedings of the 13th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM Press. 5. M. Davy and S. Godsill (2002), Detection of abrupt spectral changes using support vector machines. An application to audio signal segmentation, In Proceedings of IEEE International Conference on Acoustics, Speech, and Signal Processing. 6. T. Ide and H. Kashima (2004), Eigenspace-based anomaly detection in computer systems, In Proceedings of the 10th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM Press, pp. 440–449. 7. M.L. Shyu, S.C. Chen, K. Sarinnapakorn and L. Chang (2003), A novel anomaly detection scheme based on principal component classifier, In Proceedings of 3rd IEEE International Conference on Data Mining, pp. 353–365. 8. M. Ahmed, N. Amal and S. Osman (2014), “Epileptic seizure detection from EEG signal using discrete wavelet transform and ant colony classifier”, “IEEE ICC”, 14, pp. 3529-2534.39 9. N.T.A Dao, N.L. Trung, L.V. Nguyen, T.D. Tan, N.T.H. Anh and B. Boashash (2018), “A multistage system for automatic detection of epileptic spikes”, Rev Journal on Electronics and Communications, 8(1-2). 10. K. Rahul, “Artifacts in EEG - Recognition and differentiation”, Availabe https://www.slideshare.net/drrahulkumarsingh/artifacts-in-eeg-recognition-and-differentiation 11. T.N. Alotaiby, S.A. Alshebeili, T. Alshawi, I. Ahmad and F.E.A. El-Samie (2014), “EEG seizure detection and prediction algorithms: a survey”, EURASIP Journal on Advances in Signal Processing, 1(183). 12. A. Subasi and M.I. Gursoy (2010), “EEG signal classification using PCA, ICA, LDA and support vector machines”, Expert Systems with Applications, 37, pp. 8659-8666. 13. S. Raghunathan, A. Jaitli and PP. Irazoqui (2011), “Multistage seizure detection techniques optimized for low-power hardware platforms”, Epilepsy & Behavior, 22, pp. 61-68. 14. R.J. Oweis and E.W. Abdulhay (2011), “Seizure classification in EEG signals utilizing Hilbert-Huang transform”, BioMedical Engineering OnLine, 10. 15. F. Hadi, G. Joao (2016), “Tensor-based anomaly detection: An interdisciplinary survey”, Knowledge-Based Systems (2016), 0, pp. 1-28. 16. N.D. Sidiropoulos, L.D. Lathauwer, X. Fu, K. Huang and E.E. Papalexakis (2017), “Tensor decomposition for signal processing and machine learning”, IEEE Transactions on Signal Processing, 65(13), pp. 3551-3582. 17. E. Acar, C. Aykut-Bingol, H. Bingol, R. Bro and B. Yener (2007), “Multiway analysis of epilepsy tensors”, Bioinformatics, 23(13), pp. i10-i18.40 18. M.D. Vos, A. Vergult, L.D. Lathauwer, W.D. Clercq, S.V. Huffel, P. Dupont, A. Palmini and W.V. Paesschen (2007), “Canonical decomposition of ictal scalp EEG reliably detects the seizure onset zone”, NeuroImage, 37(3), pp. 844-854. 19. W. Deburchgraeve, P.J. Cherian, M.D. Vos, R.M. Swarte, J.H. Blok, G.H. Visser, P. Govaert and S.V. Huffel (2009), “Neonatal seizure localization using PARAFAC decomposition”, Clinical Neurophysiology, 120, pp. 1787-1796. 20. N.T.A. Dao, L.T. Thanh, N.L. Trung and L.V. Ha (2018), “Nonnegative ten-sor decomposition for EEG epileptic spike detection”, 5th NAFOSTED Conference on Information and Computer Science (NICS), IEEE 21. G. Kolda and W. Brett (2009), “Tensor decompositions and applications”, SIAM Review, 51(3), pp. 455-500. 22. Mallat, Stephane. “A wavelet tour of signal processing: the sparse way”. Academic press, 2008. 23. M. Latka, Z. Was, A. Kozik and B.J. West (2003), “Wavelet analysis of epileptic spikes”, Physical Review E, 67(5). 24. American Epilepsy Society (2015), “Predict seizures in intracranial EEG recordings”, Availabe https://www.kaggle.com/c/seizure-prediction 25. J. Zahra and K.S. Hemant (2010), “Detection and classification of EEG waves”, Oriental Journal of Computer Science & Technology, 3(1), pp. 207-213. 26. A. Evrim (2007), “Multiway analysis of epilepsy tensor”, Bioinformatics, 23, pp. 10-18.

- Xem thêm -

Tài liệu liên quan

Bình luận