XÁC ĐỊNH YẾU TỐ NƯỚC NGOÀI DỰA TRÊN CÁC PHỤ THUỘC CHỨC NĂNG ĐẶC BIỆT TRONG CƠ SỞ DỮ LIỆU. Tiêu đề chủ đề: Xác định các yếu tố nước ngoài dựa trên sự phụ thuộc chức năng đặc biệt trong cơ sở dữ liệu quan hệ và ứng dụng. Tìm hiểu về các phần phụ thuộc chức năng và các ngoại lệ trong cơ sở dữ liệu quan hệ.
Tìm hiểu thêm về các phương pháp phát hiện ngoại lệ đối với các phần phụ thuộc chức năng trong cơ sở dữ liệu quan hệ. Ứng dụng tra cứu yếu tố nước ngoài để kiểm tra thứ hạng học tập, danh hiệu học sinh THPT tại Hải Phòng. Sử dụng yếu tố ngoại lai trong các phụ thuộc chức năng cụ thể để kiểm định thứ hạng, danh hiệu học tập của học sinh trung học phổ thông ở Hải Phòng.
Đề tài tốt nghiệp: Xác định các phần tử ngoại lai dựa trên các phụ thuộc chức năng đặc biệt trong cơ sở dữ liệu và ứng dụng quan hệ. Cung cấp cái nhìn tổng quan về các phụ thuộc chức năng và các phần tử không liên quan trong cơ sở dữ liệu quan hệ. Ứng dụng tìm yếu tố nước ngoài kiểm tra thứ hạng học tập, danh hiệu học sinh tại trường THPT Kiến Thụy Hải Phòng.
Ứng dụng tìm yếu tố nước ngoài kiểm tra thứ hạng, danh hiệu học tập của học sinh THPT tại Hải Phòng.
- Phụ thuộc hàm
- Định nghĩa phụ thuộc hàm
- Hệ tiên đề Armstrong
- Các dạng phụ thuộc hàm đặc biệt loại đơn giản
- Dạng các phụ thuộc hàm dạng bằng nhau
- Dạng phụ thuộc hàm dạng tỉ lệ
- Phần tử ngoại lai và mối quan hệ giữa chúng với khai phá dữ liệu
- Khái niệm về phần tử ngoại lai
- Mối quan hệ giữa phần tử ngoại lai với khai phá dữ liệu
- Mô hình phát hiện các phần tử ngoại lai trong dữ liệu và trong CSDL
- Định nghĩa
- Phân loại các phần tử ngoại lai trong CSDL quan hệ
- Ứng dụng của các phần tử ngoại lai
Về mặt hình thức, người ta có thể định nghĩa các ngoại lệ của một tập dữ liệu là các mục bằng cách nào đó có các đặc điểm không giống với phần lớn phần còn lại của tập dữ liệu [đầu tiên]. Ký hiệu T là một tập hợp các quy tắc và ràng buộc (gọi là định luật) mà các phần tử của r phải tuân theo. Các phần tử ngoại lệ của r là các phần tử trong bảng dữ liệu này không tuân theo một trong các quy tắc và ràng buộc này [4].
Một phần tử của bảng dữ liệu được hiểu là một tập hợp các giá trị thuộc tính. Các phần tử bên ngoài đóng vai trò đặc biệt quan trọng trong mô hình cơ sở dữ liệu quan hệ, đặc biệt đối với các phụ thuộc chức năng trên bảng dữ liệu. Một cặp bộ t1, t2 r không thỏa mãn điều kiện phụ thuộc hàm của F được gọi là một cặp phần tử ngoại đối với sự phụ thuộc hàm của bảng dữ liệu r.
Trong luận án này, mối quan tâm chính là học các thuật toán khai thác và tìm ra các giá trị ngoại lệ trong các bộ dữ liệu lớn, đa chiều. Cung cấp một số thông tin về mối quan hệ giữa các yếu tố nước ngoài. Cung cấp một số giải thích hoặc mô tả về không gian dữ liệu trong đó giá trị ngoại lệ xuất hiện.
Và một vấn đề nữa chúng ta cần lưu ý có liên quan đến ý nghĩa của các yếu tố ngoại lai. Mô hình phát hiện các ngoại lệ trong dữ liệu và cơ sở dữ liệu quan hệ. Các phần tử ngoại lệ của r là các phần tử trong bảng dữ liệu này không tuân theo một trong các quy tắc và ràng buộc này.
Tùy thuộc vào các loại ràng buộc phần tử trong một quan hệ của cơ sở dữ liệu quan hệ, chúng ta cũng có các loại phần tử ngoại cho từng trường hợp (các phần tử vi phạm các ràng buộc tương ứng). Các phần tử ngoại trong cơ sở dữ liệu quan hệ nêu trong luận án chỉ bao gồm các phần tử ngoại liên quan đến phụ thuộc hàm [1]. Một ứng dụng khác trong việc phát hiện các ngoại lệ là ứng dụng nghiên cứu cổ phiếu và chứng khoán.
Nhiều cá nhân, công ty đã cố gắng dự đoán giá trị cổ phiếu niêm yết dựa trên việc tìm kiếm các ngoại lệ (ví dụ: giả sử phần lớn cổ phiếu trong một ngành đều tăng giá ở một thị trường cụ thể), thị trường ảo và có các thị trường khác (trong cùng ngành). ) khi giá cổ phiếu biến động đột ngột, những ngoại lệ đó phải được xác định và sau đó các nhà phân tích có thể dựa vào nguyên nhân để giải thích, theo dõi tình trạng quá nóng hoặc lạnh của thị trường, để xác định xu hướng của những cổ phiếu có thể mua, bán hoặc tích lũy). Việc phát hiện các phần tử lạ cho cơ sở dữ liệu quan hệ có nhiều ứng dụng thực tế: làm sạch dữ liệu trong lĩnh vực khai thác dữ liệu, phát hiện gian lận và sai sót trong lĩnh vực khai thác dữ liệu, kiểm toán và thương mại điện tử.
Phần tử ngoại lai đối với phụ thuộc hàm
- Khái niệm phần tử ngoại lai đối với phụ thuộc hàm
- Định lý nhận biết cặp ngoại lai đối với phụ thuộc hàm
Dựa trên tuyên bố trên, chúng ta có một thuật toán để xác định các cặp ngoại lệ cho các phụ thuộc hàm, như được hiển thị bên dưới [2].
Phần tử ngoại lai đối với một số dạng phụ thuộc hàm đặc biệt
- Phần tử ngoại lai đối với phụ thuộc hàm dạng bằng nhau
- Phần tử ngoại lai đối với phụ thuộc hàm dạng tỉ lệ
Dựa trên định nghĩa này, một thuật toán được đề xuất để phát hiện các ngoại lệ đối với các loại phụ thuộc hàm này. Thuật toán dựa trên việc kiểm tra các giá trị thuộc tính bên trái và bên phải của hàm. Trong thực tế, chúng ta gặp phải kiểu phụ thuộc chức năng này khi lập danh sách số lượng sản phẩm được sản xuất, cùng với các thành phần dùng để tạo ra sản phẩm đó (theo tiêu chuẩn quy định).
Đồng thời, trong thực tế các báo cáo này có thể được chấp nhận với một giá trị sai số nhất định nên đối với trường hợp này chúng tôi đưa ra định nghĩa về các ngoại lệ như sau. Trên thực tế, với mỗi thuộc tính, bạn có thể chọn giá trị khác nhau tùy theo yêu cầu về độ chính xác. Đầu ra: Tập OTL gồm r ngoại lệ cho sự phụ thuộc hàm này.
Áp dụng thuật toán trên ta có bảng tính tỉ số thực tế như sau:
- Bài toán đặt ra và mục tiêu chương trình
- Bài toán đặt ra
- Mục tiêu chương trình
- Chọn thuật toán thử nghiệm
- Dữ liệu vào và yêu cầu kết quả ra
- Môi trường thử nghiệm và quy trình thực hiện
- Hệ quản trị dữ liệu
- Quy trình thực hiện
- Một số giao diện chính
- Giao diện trang chủ
- Giao diện nhập liệu vào hệ thống
- Giao diện xem dữ liệu báo cáo
- Giao diện tính toán trung gian (tệp 3)
- Giao diện phát hiện phần tử ngoại lai
- Đánh giá kết quả và hướng mở rộng
Dựa vào đó, hãy so sánh các giá trị trên mỗi dòng. Nếu giá trị của hai cột này không giống nhau thì hàng đó là "ngoại lệ". Điều này về cơ bản dẫn đến vấn đề kiểm tra việc áp dụng thuật toán phát hiện ngoại lệ cho các phụ thuộc chức năng tương tự. 1 - Sử dụng thuật toán phát hiện ngoại lệ cho các phụ thuộc chức năng giống nhau cho hai cột “xếp hạng hiệu suất tính toán” và “xếp hạng hiệu suất báo cáo”.
2 - Sử dụng thuật toán để phát hiện các ngoại lệ đối với các phụ thuộc hàm bằng nhau cho hai cột xác định "tiêu đề calc" và "tiêu đề báo cáo". Dữ liệu đầu vào: Tệp Excel chứa dữ liệu về điểm trung bình môn học, điểm xếp hạng học tập (tỷ lệ) và danh dự (tỷ lệ) của học sinh một lớp THPT. Bước 4: Tìm phần tử lạ trong file 3 theo thuật toán mô tả ở chương 2.
Máy so sánh giá trị 2 cột GPA với GPA hoặc GPA với GPA hoặc Honours với GPA. Nếu chúng không bằng nhau thì dòng này là nổi bật. Ở đây chúng ta chọn đúng file dữ liệu (Input1) để kiểm tra trường hợp đầu tiên không có phần tử ngoại lai. Để kiểm tra ví dụ thứ hai có các phần tử không liên quan, chúng ta tạo một tệp mới input1b trong Excel (tệp có lỗi), sau đó nhập tệp vào chương trình và thực thi.
Bạn có thể lưu kết quả nổi bật vào tệp Excel để báo cáo. Sự phát triển và ứng dụng của lý thuyết ngoại lệ sẽ được khám phá sâu hơn cho các phụ thuộc hàm phức tạp hơn thuộc các loại đặc biệt, chẳng hạn như phụ thuộc hàm gần đúng, phụ thuộc hàm mờ, v.v. Đề tài “Xác định các phần tử ngoại lai dựa trên sự phụ thuộc chức năng cụ thể trong cơ sở dữ liệu và ứng dụng quan hệ” có ý nghĩa khoa học và thực tiễn nhất định.
Việc ứng dụng chủ đề có yếu tố nước ngoài vào đời sống kinh tế, xã hội, giáo dục ngày càng mở rộng và phát triển. Tổng quan về các vấn đề phổ biến nhất về sự phụ thuộc chức năng và các phần tử không liên quan trong cơ sở dữ liệu quan hệ. Tìm hiểu rõ ràng về phương pháp phát hiện các ngoại lệ đối với các phụ thuộc chức năng trong cơ sở dữ liệu quan hệ.
Biết vận dụng lý thuyết yếu tố ngoại lai để kiểm tra tính đúng, sai trong kết luận xếp loại kết quả học tập và danh hiệu học sinh một trường trung học phổ thông ở Hải Phòng. 4] Phạm Hà Thủy (2005), Nhận dạng các phần tử ngoại lai trong cơ sở dữ liệu quan hệ, Hội thảo khoa học “Một số vấn đề chọn lọc về CNTT”, Hải Phòng, tháng 8, Khoa Công nghệ thông tin, Viện Hàn lâm Khoa học Việt Nam.