Học Database, ví dụ thực tế về dị thường dữ liệu (Data Anomalies)

Hôm nay học Cơ Sở Dữ Liệu mặc dù buồn ngủ (do tối trước đó thức khuya chứ nội dung học khá hay) nhưng cũng tiếp thu được một ít:
+ Tìm khóa trong một lượt đồ quan hệ.
+ Chuẩn hóa cơ sở dữ liệu.

Tóm lại điều bổ ít hôm nay học được là nếu một cơ sở dữ liệu được thiết kế chưa tốt sẽ dễ dẫn đến sự dị thường thông tin, thừa thiếu hoặc mâu thuẫn thông tin. Ví dụ thực tế 7200 người trùng số CMND tại TP HCM :D. Nhớ hồi sinh viên làm bài tập cô giáo hay lấy ví dụ số CMND để làm khóa (key), giờ đọc thấy cái này hơi bỡ ngỡ, chắc giống mấy anh chị hay hù mấy em sinh viên là "ra đời nó khác những gì mình học" :v

Với góc nhìn của một newbie khi học database thì việc quản lý mấy con số này hiện nay mình thấy nhiều bất cập như:
+ CMND là ID duy nhất để nhận dạng một công dân vậy tại sao khi đổi tỉnh cư trú lại phải đổi cả ID dẫn đến một người có thể có nhiều số CMND nếu thay đổi địa chỉ cư trú nhiều lần?
+ CSDL chứa thông tin CMND có vẻ như được quản lý độc lập ở mỗi tỉnh dẫn đến trùng lấp dữ liệu về công dân khi thay đổi cư trú.
+ Khi chưa giải quyết hết bất cập lại vội triển khai cấp & đổi CMND 12 số, thật tế có thể giải quyết vấn đề tràn số đối với thành phố lớn hơn 10 triệu dân bằng việc bổ sung thêm mã tỉnh, ví dụ mã tỉnh 28 là của Bình Dương, nếu quá 10 triệu có thể cấp thêm một mã tỉnh khác như 70, 71,... Với mỗi mã mới sẽ có thể cấp mới thêm cho 10 triệu công dân.

Thôi học tiếp, để học sâu thêm rồi quay lại bàn tiếp... hehe

Nhận xét

Bài đăng phổ biến từ blog này

CVE-2019-12839: Lỗ hổng thực thi mã lệnh tùy ý trên OrangeHRM CMS

[Steganography] Kỹ thuật che dấu thông tin - Phần 2

[Steganography] Kỹ thuật che dấu thông tin - Phần 1