Thứ Bảy, 9 tháng 8, 2014

Miêu tả cơ sở dữ liệu XML, các loại của nó và việc mapping xml schema với database schema

I. XML là một database tuyệt vời.

- Trước hết thì ta nên hiểu thế nào là một database (cơ sở dữ liệu): Cơ sở dữ liệu là một nơi dùng để lưu thông tin và nó hỗ trợ việc truy, xuất dữ liệu.

- Với XML ta có thể lưu trữ vô vàn thông tin dưới dạng thẻ. Ngoài ra nó còn hỗ trợ hệ cơ sở dữ liệu quan hệ bởi vì nó có các định dạng, các dàng buộc thay vì các mối quan hệ giữa các bảng trong Database.

- Trong Java ta có thể truy xuất dữ liệu trong XML cực kì đơn giản với DOM và SAX với một tốc độ rất nhanh.

- XML là ngôn ngữ thông dịch và nó có thể chạy được trên tất cả các nền tảng, vì thế nó rất hữu dụng.

- Ta có thể chuyển đổi dữ liệu từ XML sang định dạng khác khá đơn giản với chi phí thấp.

II. Các loại cơ sở dữ liệu XML.

a. XML - enabled.

- Loại này một là có thể map XML với cấu trúc cơ sở dữ liệu truyền thống (như cơ sở dữ liệu quan hệ) nó chấp nhận XML như một input và render XML như một output, hay gần đây nhất là nó hỗ trợ các kiểu XML trong cơ sở dữ liệu quan hệ.

b. Native XML

- Mô hình nội bộ các database như vậy phụ thuộc vào XML và sử dụng các tài liệu XML như một đơn vị nền tảng của việc lưu trữ, tuy nhiên không cần thiết phải lưu trữ trong một mẫu các file văn bản.

III. Ưu điểm của việc sử dụng XML database.

XML database cung cấp ngôn ngữ truy vấn, lưu trữ và giao diện lập trình như các cơ sở dữ liệu khác.

Nó có thể dễ dàng chạy trên mọi nơi, vì nó là một ngôn ngữ đa nên tảng.

Nó miêu tả thông tin một cách vô cùng cụ thể nên không cần phải khai báo bất cứ cái gì thêm.

Nó lưu trữ dữ liệu dưới dạng các nút (nodes).

Nó cho phép việc lồng và trùng lặp dữ liệu.

IV. Tổ chức dữ liệu XML.

a. Data Centric Documents

Trong một tài liệu data-centric, một tài liệu XML được sử dụng như một nơi lưu trữ dành cho dữ liệu mà được cấu trúc và xuất hiện trong một Regular Order, một ví dụ cho một XML  data-centric là Simple Object Access Protocol.

Document-Centric Documents: Tệp tin XML không có cấu trúc chặt chẽ như Data-Centric Documents mà có thêm những thứ khác như tài liệu HTML vân vân.

V. Object

- Các thông tin trong tài liệu XML được lưu trữ dưới dạng các nodes.

- Một node có thể dễ dàng chuyển đổi thành một object.

- Có các thư viện để biến đổi tài liệu XML sang object và ngược lại

VI. Cơ sở dữ liệu quan hệ XML.

Một cơ sở dữ liệu quan hệ là một bộ sưu tập các bảng mà chứa dữ liệu như các bản ghi.
Các bản ghi được cấu tổ chức bởi một tập hợp các trường. Mỗi trường có một tên và giá trị
Bạn có thể sử dụng truy vấn để nhận về và thay đổi dữ liệu trong một bảng. Một tài liệu XML có thể được xem như một cơ sở dữ liệu quan hệ bởi vì nó sử dụng cùng các kĩ thuật của cơ 
sở dữ liệu quan hệ để lưu trữ dữ liệu.

Trong tài liệu Document.
- Các nút tài liệu được xem như một cơ sở dữ liệu

- Các nút thành phần được xem như các bảng trong cơ sở dữ liệu

- Một nút thành phần đi theo cùng với các nút con của loại nút dữ liệu của nó được xem như các trường trong một bảng.

- Các nút con của một nốt thành phần được xem như bảng ghi của một bảng.'

- Khi không có trường node trong tài liệu XML thì được coi là null.


VII. Native XML Database.

Tính năng của native xml database:

- Cho phép lưu trữ dữ liệu trong định dang xml.

- Cho phép truy vấn đối với dữ liệu của các collection.

- Cung cấp ngôn ngữ truy vấn để truy cập dữ liệu

- Cho phép việc cập nhật dữ liệu trong collections.
IIIX. Mapping document schema to database schema

a. Table-Based Mapping



Ưu điểm của table-based mapping
việc matching cấu trúc của bảng rất dễ dang.
việc viết mã lệnh đơn giản.
truy cập dữ liệu nhanh.

Nhượng điểm.
nó làm việc trong một phần nhỏ của một tài liệu xml.
nó không thể mở rộng cấu trúc vật lý của một tài liệu xml.

b. Object Mapping



Như bảng trên ta thấy thì việc mapping giữa XML Document với Object vô cùng đơn giản.


Không có nhận xét nào:

Đăng nhận xét