1.1. Yêu cầu tổ chức lưu trữ dữ liệu một cách khoa học
a. Hạn chế dư thừa trong lưu trữ dữ liệu
– Thói quen cá nhân khi lưu trữ có thể dẫn đến sự không nhất quán của dữ liệu khi lưu trữ thủ công.
– Ví dụ: Ở bảng điểm môn Toán, ĐĐG cuối kì của Nguyễn Kì Duyên là 9. Nhưng ở bảng điểm lớp học ĐĐG cuối kì môn Toán của Nguyễn Kì Duyên có thể bị ghi nhầm là 8.
Trích xuất bảng điểm môn Toán
Trích xuất bảng điểm lớp học có điểm trung bình
– Lập bảng điểm lớp học từ dữ liệu cơ sở có thể được thực hiện dễ dàng trên máy tính.
– Không cần lưu trữ bảng điểm lớp học, chỉ cần ghép các bảng điểm môn học do bảng này chỉ là một khung nhìn tổng hợp từ dữ liệu cơ sờ bằng cách ghép các bảng điểm môn học
– Việc lưu trữ dữ liệu trên máy tính cần tổ chức để hạn chế trùng lặp và khắc phục lỗi không nhất quán.
b. Sự phụ thuộc phần mềm và dữ liệu
– Việc lưu trữ dữ liệu liên quan chặt chẽ đến việc khai thác thông tin nhờ phần mềm ứng dụng.
– Các phần mềm cần hỗ trợ cập nhật dữ liệu điểm và khai thác thông tin.
– Các thành phần cần có của phần mềm bao gồm: cập nhật điểm môn học, quản lí danh sách lớp học và lập bảng điểm lớp học.
– Giải pháp lưu trữ đơn giản nhất là sử dụng hệ thống tệp văn bản (text) khi viết các mô đun phần mềm bằng ngôn ngữ lập trình, ví dụ như Python.
Các mô đun phần mềm và quan hệ với các tệp dữ liệu
– Khi viết mỗi mô đun phần mềm, người lập trình cần biết cấu trúc của tệp dữ liệu để đọc và tách các thành phần tương ứng.
– Thay đổi cấu trúc dữ liệu đòi hỏi chỉnh sửa các mô đun phần mềm liên quan.
– Sự phụ thuộc giữa chương trình và dữ liệu dẫn đến việc sửa đổi phần mềm khi thay đổi cách lưu trữ dữ liệu, gây mất thời gian và công sức.
– Việc tổ chức dữ liệu độc lập để phần mềm không cần biết chi tiết về cách lưu trữ là một trong các ý tưởng của khoa học cơ sở dữ liệu.
1.2. Cơ sở dữ liệu và một số thuộc tính cơ bản
a. Khái niệm CSDL
– Việc lưu trữ dữ liệu phải độc lập cần được xem xét khái quát. Việc này giúp giảm thời gian và công sức trong việc khai thác dữ liệu, tránh phụ thuộc giữa dữ liệu và phần mềm.
– CSDL là tập hợp các dữ liệu liên quan, được lưu trữ có tổ chức trên hệ thống máy tính.
– Ví dụ về CSDL là bảng điểm các môn học hoặc thông tin tài khoản ngân hàng gồm tên chủ tài khoản, số căn cước công dân và số dư trong tài khoản.
b. Một số thuộc tính cơ bản của CSDL
– Tính không dư thừa: giới hạn lưu trữ dữ liệu trùng lặp và thông tin dễ dàng thu được từ khai thác dữ liệu được gọi là tính không dư thừa của CSDL.
– Tính độc lập dữ liệu: CSDL được thiết kế để phục vụ nhiều mục đích quản lý và không phụ thuộc vào cách tổ chức hoặc lưu trữ dữ liệu cụ thể.
– Tính toàn vẹn: các giá trị dữ liệu phải tuân thủ các ràng buộc cụ thể của thực tế.
– Tính nhất quán: dữ liệu phải được đảm bảo đúng đắn sau khi cập nhật và tránh sự cố làm ảnh hưởng đến tính nhất quán của dữ liệu.
– Tính bảo mật và an toàn: dữ liệu phải được bảo vệ an toàn, ngăn chặn truy cập trái phép và đảm bảo khôi phục dữ liệu dù có sự cố xảy ra.