Cấu trúc dữ liệu và giải thuật bằng ngôn ngữ C+

Chia sẻ bởi Lê Vinh Cầm | Ngày 25/10/2018 | 77

Chia sẻ tài liệu: Cấu trúc dữ liệu và giải thuật bằng ngôn ngữ C+ thuộc Tin học 7

Nội dung tài liệu:

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC SƯ PHẠM
KHOA TIN HỌC
(((

Phan Đoàn Ngọc Phương

GIÁO TRÌNH
CẤU TRÚC DỮ LIỆU VÀ GIẢI THUẬT

Đà Nẵng - 2007

Chương 1 Tổng quan về cấu trúc dữ liệu và giải thuật

I. Khái niệm :
Xem xét các cấu trúc dữ liệu kinh điển và các cách xử lý tương ứng.
I.1. Cấu trúc dữ liệu (CTDL):
Cấu trúc dữ liệu là những dữ liệu phức hợp gồm nhiều thành phần. Ví dụ mảng, bản ghi, tập hợp ...
Cấu trúc dữ liệu là 1 đối tượng chỉ có một tên gọi và tồn tại một cơ chế để truy cập đến từng thành phần của đối tượng đó.
Những điểm cần quan tâm khi xem xét một cấu trúc dữ liệu:
- mô hình quan niệm
- cấu trúc lưu trữ : cách thức bố trí các phần tử của cấu trúc dữ liệu bên trong bộ nhớ
- Các phép toán cơ bản trên cấu trúc :
+ Cách thành lập cấu trúc
+ Bổ sung và loại bỏ phần tử
+ Duyệt cấu trúc ( mỗi phần tử đến một lần )
+ Tìm kiếm (tìm phần tử thỏa mãn điều kiện nào đó)
+ Sắp xếp
- Các ưu, khuyết điểm của cấu trúc đó.
Hiệu suất của giải thuật (nếu ta xem xét giải thuật)
I.2. Giải thuật (GT) :
Định nghĩa:
Giải thuật là một khái niệm quan trọng của toán học. Giải thuật là một dãy xác định , hữu hạn các thao tác mà sau khi thực hiện chúng một cách tuần tự ta sẽ được kết quả mong muốn. "Hữu hạn" được hiểu là cả về mặt thời gian thực hiện lấn công cụ thực hiện. Ví dụ: vào phòng máy
B1: mở khoá B2: Bật đèn
B3: Bật cầu dao B4: Bật công tấc CPU
B5: Bật công tấc màn hình
Nói cách khác GT thể hiện một giải pháp cụ thể , thực hiện từng bước một, để đưa tới lời giải cho một bài toán nào đó.
Khi giải một bài toán trên máy tính điện tử (MTĐT) ta quan tâm đến thiết kế giải thuật. Nhưng cần nhớ rằng: giải thuật là đặc trưng cho cách xử lý, mà cách xử lý thì thường liên quan đến đối tượng xử lý, tức là "dữ liệu". Cung cách thể hiện dữ liệu mà theo đó chúng được lưu trữ và được xử lý trong MTĐT được gọi là cấu trúc dữ liệu (CTDL). Như vậy giữa CTDL và giải thuật luôn có quan hệ: thay đổi CTDL sẽ dẫn đến thay đổi giải thuật.
Các đặc trưng của giải thuật :
- Tính dừng : sau một bước hữu hạn giải thuật phải dừng.
- Tính xác định : các bước của thao tác phải rõ ràng, không gây sự nhập nhằng. Nói rõ hơn là trong cùng một điều kiện, hai bộ xử lý cùng thực hiện một bước của giải thuật phải cho kết quả như nhau.
- Tính hiệu quả : giải thuật cần phải đúng đắn nghĩa là sau khi đưa dữ liệu vào giải thuật sẽ hoạt động và đưa ra kết quả như ý muốn.
- Tính phổ dụng : giải thuật có thể giải bất kỳ bài toán nào trong lớp các bài toán. Cụ thể là giải thuật có thể có các đầu vào là các bộ dự liệu khác nhau trong một miền xác định.
- Yếu tố vào ra : Một giải thuật luôn luôn có một đối tượng vào và một đối tượng ra.
I.3. Ngôn ngữ giải thuật :
Giải thuật thường được mô tả bằng một dãy các lệnh. Bộ xử lý sẽ thực hiện lệnh theo một trật tự nhất định cho đến khi gặp lệnh dừng thì kết thúc. Ngôn ngữ GT gồm 3 loại : NN liệt kê từng bước, sơ đồ khối và NN cấu trúc
Ví dụ : Giai thuật giải phương trình bậc hai ax2 + bx + c = 0
Sơ đồ khối :
NN liệt kê từng bước :
B1 : xác định các hệ số a, b, c
B2 : kiểm tra xem a < > 0 không ?
nếu a = 0 thì quay lại B1
B3 : Tính ( = b2 - 4ac
B4 : nếu ( < 0 thì thông báo " PTVN" và chuyển đến B8
B5 : nếu ( = 0 thì tính x1 = x2 = -b/2a và chuyển B7
B6 : nếu ( > 0 thì tính x1 = (- b + sqrt(())/2a và (- b - sqrt(())/2a và chuyển B7
B7 : Thông báo các nghiệm x1, x2
B8 : kết thúc GT
- NN lập trình :
Để máy tính hiểu được GT, ta sử dụng một ngôn ngữ lập trình cụ thể để diễn đạt GT thông qua ngôn ngữ đó, cụ thể ở trong giáo trình này là ngôn ngữ C.
II. Công cụ biểu diễn giải thuật : Dựa trên ngôn ngữ lập trình C
II.1 Các lệnh vào ra : printf(…) : xuất dữ liệu
Printf(…) + scanf(..) : nhập dữ liệu
II.2 Lệnh tính toán : .
II.3 Lệnh điều khiển :
(i) if (Biểu thức logic) ;
[ else ;]

switch (biểu thức nguyên)
{
case N1: Lenh1; break ;
case N2: Lenh2; break ;
…
[default : Lenh;] break ;
}

iii) for (bt1; bt2; bt3) Lenh ;

iv) while (Biểu thức logic) ;

do Lenh ;
while (biểu thức logic);
* Chú ý : Lệnh break ; thoát khỏi vòng lặp trong cùng.
Lệnh continue ; bỏ qua phần còn lại trong vòng lặp và thực hiện vòng lặp tiếp theo.
II.4 Khai báo: biến, hằng, kiểu dữ liệu, hàm, thủ tục ...
II.5 Hàm và chương trình : Một chương trình C bao gồm nhiều hàm. Hàm là một đơn vị độc lập, khép kín.Hàm main() là hàm bắt buộc của chương trình.
* Chú ý : - Một hàm không được bao gồm các hàm khác.
Tránh dùng biến toàn cục trong hàm
Các biến trong mỗi hàm chỉ được sử dụng trong nội bộ hàm đó.
- Các giải thuật trong giáo trình này được trình bày dưới dạng hàm.
III. Chương trình đệ qui :
Khái niệm: Chương trình (CT) đệ qui là chương trình có chứa lời gọi đến chính bản thân nó, nghĩa là chương trình đệ qui thực hiện sau khi thực hiện bản sao của chính nó
Điều kiện lập CT đệ qui :
+ Khi bài toán có thể phát biểu thông qua chính bản thân nó, nhưng với kích thước nhỏ hơn
+ Kích thước của bài toán bằng cách này hay cách khác phải trở thành tham số (gián tiếp hoặc trực tiếp)
* Chú ý : - Khi gặp CT đệ qui ta phải phân biệt được các trường hợp suy biến và trường hợp đệ qui (trường hợp suy biến không gọi đệ qui nữa)
- CT đệ qui có hiệu suất kém hơn so CT không đệ qui, tuy nhiên CT đệ qui đơn giản và dễ hiểu hơn
Ví dụ 1: Tính giai thừa của một số nguyên >=0.
Phát biểu bài toán:
giaithua(n) = 1, khi n=0 // trường hợp suy biến
giaithua(n) = n * giaithua(n-1), khi n>0 // trường hợp đệ qui
CT đệ qui:
long giaithua(int n)
{
if (n = = 0) return 1;
else return (n * giaithua(n-1)) ;
}
Ví dụ 2: Tìm ước số chung lớn nhất của hai số nguyên dương a va b.
Phát biểu bài toán:
USCLN(a, b) = b , nếu (a % b = = 0) // trường hợp suy biến
USCLN(a, b) = USCLN(b, a % b), nếu (a % b != 0) // trường hợp đệ qui
CT đệ qui:
int uscln(int a, int b)
{
if (a % b = = 0) return b;
else return (uscln(b, a % b);
}

Bài tập :
1) Đọc chương 1 và 3 sách CẤU TRÚC DỮ LIỆU và GIẢI THUẬT của Đỗ xuân Lôi.

IV. Độ phức tạp của giải thuật (GT) :
IV.1 Khái niệm :
Tímh hiệu quả của GT bao gồm hai yếu tố cơ bản:
- Không gian nhớ cần thiết cho những dữ liệu vào, các kết quả tính toán trung gian và các kết quả của GT.
- Thời gian cần thiết để thực hiện GT (ta gọi là thời gian chạy CT).
Việc đánh giá hai yếu tố trên sẽ cho ta cơ sở để xác định giải thuật nào là tốt hơn. Tuy nhiên hai yếu tố trên lại hay mâu thuẩn nhau: tốt về thời gian thường lại không tốt về không gian và ngược lại. Vì vậy trong thực tế đối với từng loại bài toán, một trong hai yếu tố sẽ được coi trọng hơn.
Thông thường thời gian thực hiện GT vẫn được chú ý hơn; vì vậy sau đây ta sẽ xét việc đánh giá thời gian thực hiện GT.
Có hai cách tiếp cận để đánh giá thời gian thực hiện của một GT. Thời gian chạy chương trình phụ thuộc vào các yếu tố chính sau:
(1) Các dữ liệu vào.
(2) chương trình dịch để chuyển chương trình nguồn thành mã máy.
(3) Tốc độ thực hiện các phép toán của máy tính được sử dụng để chạy chương trình.
Thời gian thực hiện GT chịu ảnh hưởng của nhiều yếu tố. Vì vậy ta không thể tính chính xác thời gian bằng phút, giây, ... như cách đo thời gian thông thường. Trong phương pháp lý thuyết, ta sẽ coi thời gian thực hiện GT phụ thuộc vào kích thước của dữ liệu vào hay nói cách khác nó như là hàm số của cỡ dữ liệu vào. Cỡ dữ liệu vào là một tham số đặc trưng cho dữ liệu vào, nó có ảnh hưởng quyết định đến thời gian thực hiện chương trình. Thông thường cỡ của dữ liệu vào là một số nguyên dương n. Ta sẽ sử dụng hàm số T(n), trong đó n là cỡ dữ liệu vào, để biểu diễn thời gian thực hiện của một GT.
Thời gian thực hiện của một GT không những phụ thuộc vào cỡ dữ liệu mà còn phụ thuộc vào dữ liệu cá biệt. Chẳng hạn, ta xét bài toán tìm kiếm một đối tượng x trên một danh sách n phần tử. Nếu xem T(n) là số phép so sánh, ta có T(n) <= n, trường hợp xấu nhất T(n) = n. Vì vậy, ta có hai cách nói là thời gian thực hiện GT trong trường hợp xấu nhất và thời gian thực hiện trung bình.
Ta có thể xác định thời gian thực hiện T(n) là số phép toán sơ cấp cần phải làm khi thực hiện GT. Chẳng hạn các phép toán số học +, -, *,/, và các phép toán so sánh =, <, <=, >, >=, < > là các phép toán sơ cấp. Phép toán so sánh chuỗi kí tự không thể xem là phép toán sơ cấp vì thời gian thực hiện phụ thuộc vào độ dài của chuỗi.
Tóm lại, độ phức tạp của GT là thời gian để thực hiện GT đó. GT A với kích thước đầu vào là n thì thời gian thực hiện GT được biểu diễn là T(n) và có độ phức tạp là O(f(n)) nếu tìm được 1 hằng c sao cho: T(n) <= c.f(n), với bất kỳ n >= n0

IV. 2 Cách tính độ phức tạp :
Q1 : một lệnh có thời gian thực hiện không phụ thuộc vào đầu vào thì lệnh đó có độ phức tạp là O(1) (hay thời gian thực hiện là hằng số)
Q2 : Nếu lệnh b thực hiện sau lệnh a và nếu a có độ phức tạp O(f(n)) và b có độ phức tạp O(g(n)) thì độ phức tạp tổng cộng là O(max( f(n), g(n) ) hay O(f(n), g(n)) = O(max(f(n), g(n))
Q3 : Nếu b lồng trong a và a có độ phức tạp là O(f(n)) và b có độ phức tạp là O(g(n)) thì độ phức tạp là O(f(n)*g(n)) hay O(f(g(n))) = O(f(n)*g(n))
Ghi chú : Đôi khi độ phức tạp của GT phụ thuộc vào giá trị cụ thể của dữ liệu, trong trường hợp này ta có thể xét tới độ phức tạp trong trường tốt nhấp, tồi nhất và độ phức tạp bình quân

IV.3 Một số độ phức tạp thường gặp :

Ký hiệu lớn
Tên gọi thông thường
Các phép toán

O(1)
Hằng
gán, so sánh

O(logn)
logarit
tìm nhị phân

O(n)
Tuyến tính
tìm tuyến tính

O(nlogn)
nlogn
QuickSort, TreeSort...

O(n2)
bình phương
SX chọn, SX chèn...

O(n3)
lập phương
đa thức bậc 3

O(2n)
mũ (luỹ tiến)

Ví dụ:
*) Xét đoạn chương trình sau :
for (i = 0; i {
...
}
for (i = 0; i {
for (j = 0; j ...
}

*) Xét đoạn chương trình sau :
i = 1 ;
While (i <= n)
{
...
i

* Một số tài liệu cũ có thể bị lỗi font khi hiển thị do dùng bộ mã không phải Unikey ...

Người chia sẻ: Lê Vinh Cầm

Dung lượng: | Lượt tài: 0

Loại file:

Nguồn : Chưa rõ

(Tài liệu chưa được thẩm định)

Tải tài liệu

Báo cáo sai sót

Đề suất chỉnh sửa , phân lại mục