Luận văn: Xây dựng và làm giàu ONTOLOGY Tiếng Việt chuyên ngành Công nghệ thông tin
410 2
Tải về máy để xem đầy đủ hơn, bản xem trước là bản PDF
Tags: #luận văn#luận án#tiểu luận#đồ án
Mô tả chi tiết
1. Mở đầu
1.1 Lý do chọn nghiên cứu
Ngày nay cùng với sự phát triển của internet thì dữ liệu của ngành công nghệ thông tin ngày càng gia tăng. Nhu cầu quản lý, chia sẻ, tìm kiếm thông tin trong ngành này cũng được đặt ra và đáp ứng một phần nhờ các công cụ tìm kiếm. Một số công cụ tìm kiếm nổi tiếng hiện nay như Google hay Yahoo đều có thể cho phép người dùng tìm kiếm dữ liệu có liên quan bằng cách nhập từ khóa và tìm những tài liệu có chứa từ khóa đó. Với phương pháp tìm như vậy thì kết quả tìm kiếm đôi khi chẳng liên quan gì đến cái mà người dùng muốn tìm, vì các công cụ tìm kiếm này không hiểu được ý nghĩa cần tìm. Việc tìm kiếm thông tin về từ khóa đã vậy thì việc trả lời những câu hỏi càng không thể đối với những công cụ tìm kiếm này
1.2 Mục đích nghiên cứu
Xây dựng ontology chuyên ngành công nghệ thông tin tiếng Việt phục vụ cho việc nhận diện thực thể có tên, không tên và xác định quan hệ giữa chúng trong tài liệu công nghệ thông tin tiếng Việt, hỗ trợ cho các ứng dụng, nghiên cứu khác về xử lý ngữ nghĩa văn bản tiếng Việt chuyên ngành công nghệ thông tin
1.3 Đối tượng và phạm vi nghiên cứu
Các khái niệm trong lĩnh vực Công nghệ thông tin và quan hệ giữa chúng
Thông tin các công ty, trường học, tổ chức, hiệp hội, chuyên gia, các sự kiện trong ngành và quan hệ ngữ nghĩa giữa chúng
Các chương trình đào tạo Công nghệ thông tin
1.4 Phương pháp nghiên cứu
Xây dựng và nhập dữ liệu bằng tay cho ontology dùng công cụ Protégé
Tìm kiếm dữ liệu để làm giàu ontology từ internet sử dụng API của Google và Yahoo
Dùng thuật toán SVM để phân loại tài liệu công nghệ thông tin tiếng
2. Nội dung
2.1 Cơ sở lý thuyết
Mở đầu
Tổng quan về ontology
Khảo sát các nghiên cứu có liên quan
Tổng kết chương
2.2 Xây dựng và làm giàu ontology tiếng Việt chuyên ngành công nghệ thông tin (ITVO)
Xây dựng ontology tiếng việt chuyên ngành công nghệ thông tin (ITVO)
Phương pháp làm giàu ontology tiếng Việt chuyên ngành công nghệ thông tin
Tổng kết chương
2.3 Hiện thực hệ thống và đánh giá
Mở đầu
Kiến trúc chương trình làm giàu ontology
Các bước chạy chương trình
Thực nghiệm và đánh giá
3. Kết luận
Đề tài là bước khởi đầu cho một ontology hoàn thiện tiếng Việt về lĩnh vực công nghệ thông tin. Lượng dữ liệu hiện nay có thể dùng để xác định những thực thể có tên, tuy nhiên cần nhập thêm nhiều dữ liệu để có thể sử dụng cho các yêu cầu khác đã đặt ra. Công cụ làm giàu ontology đã có thể sử dụng để làm giàu các cá thể khái niệm trong lĩnh vực công nghệ thông tin, tuy nhiên vẫn cần đƣợc cải thiện để có thể làm giàu thêm lớp và quan hệ
4. Tài liệu tham khảo
Lương Quý Tịnh Hà, Xây dựng công cụ tìm kiếm tài liệu học tập bằng các truy vấn ngôn ngữ tự nhiên trên kho học liệu mở tiếng Việt, Luận văn thạc sĩ, khoa Khoa học máy tính, trường Đại học Công nghệ Thông tin, Tp. HCM, 2009
Lê Thành Nhân, Võ Trung Hùng, Cao Xuân Tuấn, Hoàng Thị Mỹ Lệ, MATHIS – Hệ thống hỗ trợ tạo chú thích và tìm kiếm tài liệu khoa học, Tạp chí khoa học và công nghệ, Đại học Đà Nẵng - Số 4(39).2010
Trần Đình Khang, Vũ Tuyết Trinh, Đỗ Đức Thành, Đỗ Thị Ngọc Quỳnh, Một phương pháp tìm kiếm dựa trên Ontology phục vụ quản lý thông tin khoa học công nghệ, Bộ môn Hệ thống Thông tin, Trƣờng Đại Học Bách Khoa Hà Nội, 2007