CHƯƠNG 4: BỘ VI XỬ LÝ
Chia sẻ bởi Người Đẹp |
Ngày 29/04/2019 |
108
Chia sẻ tài liệu: CHƯƠNG 4: BỘ VI XỬ LÝ thuộc Bài giảng khác
Nội dung tài liệu:
CHƯƠNG 4: BỘ VI XỬ LÝ
Ngày nay có rất nhiều loại máy tính được sản xuất và bán trên thị trường, với chủng loại rất đa dạng: từ những máy PC để bàn cho tới các siêu máy tính thương mại. Bộ vi xử lý của các máy này khác nhau như thế nào? Phân loại các bộ vi xử lý theo cơ chế vận hành của chúng sẽ giúp ta tìm được phương thức lập trình tốt nhất cho máy tính của mình.
1. NGUYÊN LÝ HOẠT ĐỘNG
Nguyên lý cơ bản của tất cả bộ xử lý máy tính đều giống nhau. Về cơ bản, chúng luôn lấy tín hiệu ở dạng 0 và 1 (tín hiệu nhị phân), chế tác chúng theo bộ chỉ thị và xuất ra tín hiệu 0 và 1. Điện áp trên cùng tuyến ở cùng thời điểm tín hiệu được gởi đi sẽ quyết định tín hiệu là 0 hay là 1.
Ví dụ: Đối với hệ thống 3.3 volt, một ứng dụng 3.3 volt có tín hiệu là 1, còn một ứng dụng 0 volt có tín hiệu là 0.
Bộ xử lý làm việc bằng cách tác động trở lại thiết bị nhập theo tín hiệu 0 và 1 bằng những cách đặc trưng rồi trả về thiết bị xuất khi cần thiết. Hoạt động này xảy ra trong mạch được gọi là cổng logic, mỗi cổng phải có ít nhất một transistor (thiết bị bán dẫn).
Thật ra những bộ xử lý hiện nay chứa hàng triệu transistor, điều này góp phần tạo ra một hệ thống logic rất phức tạp. Cổng logic của bộ xử lý cùng làm việc để đưa đến việc sử dụng logic kiểu Boolean, dựa vào hệ Đại số được xây dựng bởi nhà Toán học Geogre Boole.
Những toán tử kiểu Boolean cơ bản là AND, OR, NOT, và NAND (not AND).
Cổng AND xuất ra tín hiệu 1 nếu chúng nhận vào toàn là tín hiệu 1.
Cổng OR sẽ xuất ra tín hiệu 1 nếu ít nhất có 1 tín hiệu vào là 1.
Và cổng NOT lấy ra một tín hiệu nhập đơn và phủ định nó, tức là xuất ra 1 nếu tín hiệu nhập vào là 0 và ngược lại.
Dòng điện qua mỗi cổng được điều khiển bởi transistor của cổng đó. Tuy nhiên, những transistor này không phải là những đơn vị độc lập và riêng lẻ. Thay vào đó, một số lượng lớn transistor được chế tạo từ một mẩu silicon đơn (hoặc chất liệu bán dẫn khác) và được nối với nhau mà không cần dây nối hay những chất liệu bên ngoài nào khác. Những đơn vị này được gọi là những mạch tích hợp (ICs), và việc phát triển chúng về cơ bản tạo ra sự phức tạp của bộ vi xử lý.
Sự tích hợp của các mạch không chỉ dừng lại ở vi mạch đầu tiên. Khi mạch tích hợp đầu tiên kết nối nhiều transistor, gọi là mạch tích hợp bội - liên kết theo một quy trình được xem như là tích hợp cỡ lớn (LSI); cuối cùng khi những bộ mạch tích hợp được kết nối theo một quy trình có độ tích hợp rất cao (VLSI).
Những bộ vi xử lý hiện đại ngày nay chứa hàng triệu transistor cực nhỏ. Được dùng kết hợp với điện trở, tụ điện và điôt, cấu tạo nên cổng logic. Các cổng logic cấu tạo nên mạch tích hợp, và các mạch tích hợp cấu tạo nên những hệ thống điện tử.
Intel là hãng sản xuất nổi tiếng đầu tiên với con chip xử lý đơn phức tạp chứa tất cả những cổng logic của bộ xử lý có độ tích hợp cao - thế hệ Intel 4004 - sản xuất sau năm 1971.
Con chip này có bộ vi xử lý 4-bit, dùng trong máy tính bỏ túi. Nó xử lý dữ liệu với 4 bit, nhưng những chỉ thị của nó là 8 long-bit. Chương trình và dữ liệu tách rời, lần lượt là 1KB và 4KB. Cũng có 16 thanh ghi đa năng 4-bit (hay 8-bit). Intel 4004 có 46 chỉ thị, chỉ dùng 2,300 transistor trong 1 DIP 16-pin (kiểu đóng gói) và chạy ở tốc độ 740kHz (8 vòng trên một chu trình CPU 10.8 micro giây).
Chỉ trong vòng vài năm 2 dòng vi xử lý đã thống trị công nghiệp PC - Pentium của Intel và PowerPC của Motorola. Những CPU này cũng là những thử nghiệm tốt nhất của 2 kiến trúc CPU đang cạnh tranh nhau trong 2 thập kỉ qua - nhóm phát minh ra con chip CISC và sau đó là nhóm phát minh ra chip RISC.
CISC
CISC (máy tính có bộ chỉ lệnh phức hợp) là kiến trúc truyền thống của máy tính, trong đó CPU sử dụng vi mã để thực hiện bộ chỉ lệnh rất toàn diện.
Chỉ trong một vài năm, xu hướng của các hãng sản xuất là xây dựng những CPU tăng thêm độ phức tạp có bộ lệnh chỉ thị lớn hơn.
Vào năm 1974, viện nghiên cứu IBM đã quyết định đưa ra một phương pháp giảm đột ngột số chỉ lệnh mà con chip phải thực thi. Vào giữa những năm 1980, điều này đã dẫn đến một số hãng sản xuất máy tính đổi hướng bằng cách phát minh những CPU có tính năng thực thi chỉ một bộ hữu hạn các chỉ lệnh.
RISC
RISC (máy tính dùng tập lệnh rút gọn) CPU giữ kích thước chỉ lệnh không đổi. Một lợi thế của CPU RISC là chúng có thể thực thi những chỉ lệnh rất nhanh bởi vì các chỉ lệnh quá đơn giản. Mặt khác, lợi thế quan trọng hơn là chip RISC phụ thuộc không nhiều vào những transistor, làm cho chúng rẻ hơn trong thiết kế và sản xuất.
Vẫn còn nhiều tranh luận giữa những chuyên gia về kết quả cuối cùng của kiến trúc RISC. Những người đề xướng tranh luận rằng RISC vừa rẻ hơn vừa nhanh hơn, và vì vậy nó là máy của tương lai.
Lưu ý rằng việc tạo ra phần cứng đơn giản hơn, kiến trúc RISC đặt nặng về phần mềm hơn - trình biên dịch RISC phải tạo ra phần mềm để thực thi những chỉ lệnh phức tạp mà máy tính CISC hoạt động bên trong phần cứng. Họ cho rằng điều này không có ích bởi vì những bộ vi xử lý quy ước ngày càng tăng tốc độ và rẻ hơn.
Trong một chừng mực nào đó, ý kiến này đang trở thành vấn đề tranh luận bởi vì những thực thi CISC và RISC ngày càng trở nên giống nhau. Nhiều con chip RISC hiện nay có nhiều chỉ lệnh và ngược lại, những con chip CISC hiện nay sử dụng nhiều kỹ thuật trước đây kết hợp với con chip RISC. Chip CISC của Intel đã dùng kỹ thuật RISC trong chip 486 của nó và làm tăng số lượng trong những bộ xử lý của dòng Pentium.
2. KHÁI NIỆM VỀ CPU HIỆN ĐẠI
Hệ thống P_Rating (PR)
Theo truyền thống, các CPU được phân loại theo tốc độ xung nhịp của chúng. Ví dụ, một CPU Pentium 233MHz, nói chung được xem như có hiệu năng tốt hơn một CPU Pentium 166MHz.
Tuy nhiên, điều này làm lộ ra các rắc rối về tiếp thị phiền phức và kỳ dị đối với các nhà sản xuất CPU cạnh tranh nhau. Mặc dù Intel vẫn tiếp tục dẫn đầu trong việc phát minh CPU, nhưng các nhà chế tạo CPU khác (như AMD và Cyrix chẳng hạn) đang duy trì một sức ép lên họ bằng cách nhồi nhét hiệu năng cao hơn vào trong các chu kỳ xung nhịp ít hơn.
Đáng tiếc là, một người dùng bình thường khó có thể phân biệt được một CPU phi_intel ở một tốc độ xung nhịp cho trước lại có hiệu năng cũng tốt như một CPU của Intel chạy ở một tốc độ xung nhịp khác.
Vào đầu năm 1996, Cyrix, IBM Microelectronics, và SGS Thomson (tất cả đều là những nhà sản xuất cạnh tranh với Intel) đã tụ họp lại để tạo ra hệ thống P-rating (tức PR) để mô tả các CPU của họ. Bằng cách dùng một cách mệnh danh “PR”, một CPU nào đó có thể được coi ngang hàng với một CPU Pentium của Intel.
Ví dụ, bộ xử lý AMD 133MHz Am5x86 được ghi là PR75, và có hiệu năng có thể so sánh được với một chip Intel 75MHz Pentium. Khi điểm đánh giá (rating) có kèm một hậu tố “+” hoặc “++” (ví dụ, PR 75++), nó có nghĩa là CPU ấy cung cấp hiệu năng tốt hơn là đối thủ phía Intel tương ứng. Cac điểm đánh giá P_rating được xác định thông qua một phương pháp so sánh trực tiếp.
Trình kiểm định (benchmark) Winstone 96 được chạy trên một hệ thống PC được lắp đặt cấu hình một cách cụ thể, có động lực là một bộ xử lý Pentium có một tốc độ xung nhịp đa định.
Bộ xử lý Pentium ấy được tháo ra khỏi hệ thống và được thay một bộ xử lý cạnh tranh. Trình Benchmark winstone 96 được chạy lại lần nữa, và người ta thu được một điểm winstone thứ 2 từ cùng hệ thống đó, nhưng giờ đang chạy bộ xử lý cạnh tranh kia. Cấu hình hệ thống được giữ giống hệt hệ thống cũ, và tất cả các thiết bị ngoại vi đều được ghi chú tài liệu kỹ lưỡng.
Bộ xử lý cạnh tranh ấy được cấp điểm PR cao nhất mà tại đó nó cung cấp những điểm winstone bằng hoặc lớn hơn CPU đang xét. Ví dụ, nếu một bộ xử lý AMD K5, cung cấp được hiệu năng bằng hoặc tốt hơn một bộ Pentium 90Mhz, thì nó nhận được điểm PR là 90.
Các đế cắm CPU
Một ý tưởng quan trọng khác trong việc phát minh và tính khả năng nâng cấp của CPU là khái niệm các đế cắm socket, mỗi thế hệ CPU sử dụng một số chân cắm khác nhau ( và các quy định chân cắm khác nhau ), cho nên phải dùng một đế cắm vật lý xác định trên bo mạch chính thì mới thích nghi được với từng thế hệ bổ xử lý mới.
Các CPU lúc đầu không sẵn sàng để đổi lẫn cho nhau, và việc nâng cấp một CPU thường có nghĩa là phải nâng cấp luôn mainboard. Với sự ra đời của các CPU I486, khái niệm bộ xử lý Overdrive đã trở nên được nhiều người ưa thích thay thế một CPU có sẵn bằng một CPU thay thế tương thích số chân vốn hoạt động ở những tốc độ xung nhịp nội cao hơn để tăng cường hiệu năng hệ thống. Khi các CPU đã tiến bộ các kiểu đế cắm đã sinh sôi nẩy nở để yểm trợ cả một tập hợp không ngừng tăng trưởng các bộ xử lý tương thích.
Gần đây, loại đế cắm thông dụng nhất là socket 370, và 478 (dùng cho P4) các bo mạch chính socket 7 yểm trợ hầu hết các bộ xử lý loại Pentium (tức là Pentium của Intel, Pentium MMX của Intel, K5 K6 của AMD, 6x86 6x86MX Cyrix). Bằng cách ấn định tốc độ xung nhịp và hệ số nhân thích hợp, một bo mạch chính loại socket 7 có thể yểm trợ nhiều CPU Pentium mà không cần thực hiện bất kỳ sự thay đổi phần cứng nào. Chính tính vạn năng này đã khiến các đế cắm đó trở nên quan trọng đến vậy, và đã kéo dài tuổi thọ của các PC hiện nay bằng cách cung cấp một lộ trình nâng cấp cho các CPU.
Xử lý lệnh theo đường ống (Pipelining)
Các CPU xử lý các lệnh và tạo ra kết quả thông qua một chuỗi phức tạp các khóa chuyển bằng transistor ở bên trong bản thân của CPU (hệt như mọi chip luận lý khác).
Các CPU cũ đã xử lý mỗi lúc một lệnh – tức là lệnh trước đã được lấy về và được xử lý hoàn toàn rồi một lệnh mới mới được đọc về. Việc xử lý một lệnh có thể được hoàn tất trong vài chu kỳ xung nhịp (số chu kỳ xung nhịp đích xác bao nhiêu là tuỳ thuộc vào lệnh cụ thể)
Kỹ thuật xử lý theo đường ống (pipelining), hoặc xử lý lệnh liên tiếp (Intruction Pipelining) cho phép lệnh mới bắt đầu được xử lý trong khi các lệnh hiện tại vẫn đang được xử lý.
Bằng cách này, CPU thực sự có thể được thực hiện vài lệnh trong cùng một chu kì xung nhịp. Nói cách khác, đối với một chu kì xung nhịp cho trước bất kỳ, có thể có vài lệnh “In the pipeline” cùng một lúc. Xử lý theo đường ống cho phép CPU tận dụng các tài nguyên xử lý trong khi một lệnh nào đó đang được hoàn tất.
Thi hành siêu hướng
(Superscalar Execution)
Các CPU truyền thống dùng một “động cơ thi hành” duy nhất đề xử lí các lệnh. Đối với một chu kì xung nhịp cho trước chỉ có thể sinh ra kết quả cho một lệnh mà thôi.
Bằng cách bổ xung nhiều “động cơ thi hành” vào CPU, các nhà thiết kế đã cung cấp cho CPU một khả năng xử lí nhiều lệnh trong một chu kì xung nhịp.
Các CPU này được gọi là bộ xử lí siêu hướng. (Superscalar Processor). Ví dụ , Pentium Pro bằng cách kết hợp xử lí theo đường ống với nhiều động cơ thi hành của kiến trúc siêu hướng, các CPU hiện đại đã tận dụng cực kì hữu hiệu mọi chu kì xung nhịp.
Tiên đoán rẽ nhánh
(Branch Prediction)
Bởi vì các CPU được xử lý theo đường ống phải lấy về lệnh kế tiếp trước khi chúng hoàn thành lệnh trước đó, nên đều này dẫn đế một tình thế tiến thoái lưỡng nan trong xử lý
Nếu lệnh trước là một nhánh (một phát biểu if then), thì lệnh kế tiếp lấy về sẽ có thể sai. Branch Prediction là kỹ thuật có nhiệm vụ cố gắng phỏng đoán địa chỉ thích hợp của của lệnh kế tiếp trong khi chỉ biết lệnh hiện tại. Nếu tiên đoán được nhánh không đúng (gọi là một mispredict – sự tiên đoán nhầm), thì phải xác định lại nhánh đúng và điều này có thể xảy ra sự chậm trễ, ảnh hưởng xấu đến hiệu năng xử lý.
Hệ quả là tính năng Branch prediction của một CPU hiện đại hẳn phải là cực kì mạnh mẽ.
Thi hành động
(Dynamic Execution)
Ngay cả CPU nhanh nhất cũng thi hành theo thứ tự mà chúng được viết bên trong chương trình cụ thể. Điều này có nghĩa là chương trình được viết một cách không đúng đắn, không hiệu quả sẽ làm giảm hiệu suất xử lý của CPU.
Trong nhiều trường hợp, ngay cả mã lệnh được viết tốt cũng có thể trở nên bị sút kém trong quá trình lắp ráp và liên kết phẩn mềm. Kỹ thuật thi hành lệnh cho phép bộ xử lý ước lượng “dòng chảy” của chương trình và “chọn lựa” thứ tự tốt nhất để xử lý các lệnh. Khi được thực hiện một cách đúng đắn, sự “sắp xếp thứ tự lại một cách chọn lọc” các lệnh sẽ cho phép CPU tận dụng thậm chí còn tốt hơn tài nguyên xử lý của nó - và giúp làm tăng hiệu năng tổng thể của CPU.
CPU cache RAM
Dòng dữ liệu đi qua CPU với tốc độ rất nhanh. Ram bình thường không thể giữ được tốc độ này. Vì thế, một loại Ram đặc biệt có tên gọi là cache được sử dụng như một loại bộ đệm (buffer) hay nói cách khác là một nơi lưu trữ tạm thời.
Để CPU với hiệu năng cao nhất , số lượng các luồng dữ liệu vào và ra phải giảm thiểu rất nhiều. Vậy khi luồng dữ liệu truyền đi có nhiều hơn, thì nó phải được chứa tạm ở một nơi nào đó trong CPU, thì tốc độ sẽ nhanh hơn. Và như thế dòng dữ liệu sẽ liên tục.
Vì thế, Intel 80486 đã tích hợp bộ xử lí toán học và đơn vị dấu chấm động và 8 Kb L1-cache RAM. Chính 2 đặc tính quan trọng đó đã giúp giảm thiểu luồng giữ liệu ra vào trên CPU.
CPU cache RAM (tt)
Ta thấy rằng CPU dùng kiến trúc Pipeline để truyền và xử lý dữ liệu. Bằng 1 cách nào đó để dữ liệu không được dồn nén hay quá lớn, nhưng cũng phải liên tục thì mới tận dụng hết khả năng của CPU. Lúc đầu chưa có cache, CPU đơn thuần sử dụng RAM để truy xuất data. Sau đó các nhà khoa học đã nghĩ ra việc tạo ra một Ram Cache nằm ngay trên chính miếng Silicon tạo ra CPU, và như vậy, ta luôn sẵn sàng có một chỗ rất gần bộ xử lí chứa đựng thông tin để đưa qua. Ram Cache được tích hợp đó gọi là L1.
CPU cache RAM (tt)
Cache RAM trở nên rất quan trọng tốc độ CPU, ở đó tốc độ xung nhịp thực sự là cao hơn nhiều so với bên ngoài. Ta có thể hiểu cache RAM là ngôi nhà sức mạnh của CPU. Trong các đời CPU cũ, L2 cache được chế tạo từ những chip SRAM và gắn trên mainboard, nhưng CPU hiện đại nó được gắn trong CPU. Như thế L2 đóng vai trò như một người bạn sẵn sàng cung cấp data cho L1 và nhận data từ RAM.
3. CÁC LOẠI CPU
TỐC ĐỘ - CÔNG NGHỆ
Bảng sau đây biểu diễn các thế hệ bộ xử lý từ thế hệ 8088/86 đầu tiên của Intel trong những năm cuối 1970 đến thế hệ thứ 8 AMD Athlon 64, được giới thiệu vào mùa thu năm 2003
Pentium
Từ pentium không có nghĩa gì cả , nó có âm tiết là pent, mà tiếng Hy Lạp có nghĩa là số 5. Bắt nguồn từ việc Intel gọi pentium 80586, nối tiếp sau của thế hệ chíp 80x86. Do không thích giống các công ty khác như AMD, Cyrix và một số kẻ nhái theo một cung lấy tên là 80x86, vì vậy Intel quyết định lấy tên thương mại là Pentium.
Các chip Pentium mà dựa vào kiến trúc CISC được mô tả như là một bược nhãy so với thế hệ 486. tốc độ 120MHz và có khoảng 3.3 triệu con transistor , được chế tạo trên một quy trình 0.35 mirco mét. Bên trong, bộ xử lý sử dụng một bus 32 bit , nhưng bên ngoài sử dụng bus dử liệu 64 bit mở rộng.
External bus đòi hỏi một bo mạch chủ tách riêng và để hổ trợ điều này Intel đã đưa ra bán một chipset đặc biệt có chức năng liên kết Pentium đến cache 64 bit bên ngoài và đến bus PCI.
Phần lớn các pentium (75Mhz và lớn hơn nữa ) hoạt động có hiệu qủa ở 3.3v.
Pentium Pro
Pentium Pro được giới thiệu vào năm 1995 là thế hệ kế tục của dòng Pentium, là bộ xử lý đầu tiên của thế hệ thứ 6 và đưa ra một vài kỹ thuật đặc biệt duy nhất chưa từng thấy trong bộ xử lý PC trước đó.
Pentium Pro là CPU đầu tiên của xu hướng mới làm thay đổi cơ bản cách thức thực thi những chỉ lệnh, bằng cách chuyển sang những vi chỉ lệnh tương tự như RISC và thực thi chúng theo hướng cải tiến bên trong ở mức độ cao. Nó cũng đưa ra một cách đột ngột cache thứ 2 có hiệu suất cao hơn tất cả những bộ xử lý trước đây. Thay vì sử dụng cache của bản mạch chính cơ bản chạy với tốc độ của bus bộ nhớ, nó dùng một cache tích hợp cấp 2 với bus của nó, chạy ở tốc độ bộ xử lý đầy đủ, đặc trưng cho 3 lần tốc độ mà cache chạy trên Pentium.
MMX
Intel`s p55c mmx (multimedia extension) giới thiệu vào đầu năm 1997. Nó là sự thay đổi lớn kiến trúc cơ bản của bộ xử lý danh cho pc trong 10 năm và gồm có 3 cải tiến lớn:
Cache L1 chuẩn của Pentium được tăng gấp 2 lên 32kb
77 lệnh mới được thiết kế đặc biệt để thao tác xử lý video, audio, và nhiều tính năng hiệu quả dành cho đồ hoạ.
Có một tiến trình mới được gọi là single intruction multiple data SIMD (một chỉ thị trên nhiều dữ liệu) được phát triển nó làm cho một lệnh (intruction) thực hiện các chức năng tương tự nhau trên nhiều phần của data một cách đồng thời.
Nó có một số cải tiến đặc biệt cho các ứng dụng multi media và đồ hoạ như mã hoá / giải mã tín hiệu audio và video , việc nạp và xử lý các hình ảnh. Intel khuyến cáo việc cải tiến này sẽ làm tăng tốc độ xử lý lến 10- 20% nếu sử dụng phần mền non - mmx và 60% đối với các ứng dụng có MMX.
Pentium II
Được đưa ra vào giữa năm 1997, P.II được giới thiệu là có một số thay đổi lớn đối với tiến trình kết thúc của PC:
Đầu tiên là con chip và hệ thống cache Level 2 được kết nối bởi một bus chuyên dụng mà nó có thể chạy đồng thời với processor đến bus hệ thống.
Thứ hai là processor, hai cache và heatsink (bộ tỏa nhiệt được lắp đặt trên một bảng nhỏ (small board) mà có thể cắm vào một slot của bo mạch chủ. Intel đặt tên là hộp single edge contact (cartridge SEC).
Thay đổi thứ ba là có nhiều thứ tổng hợp thực sự , như pentium hợp nhất tính năng bus Dual Independent Bus (DIB) của pentium Pro với việc cải tiến MMX được tìm thấy trên pentiumMMX thành một dạng ghép mới của Pentium Pro/ MMX. Do đó , đôi khi ta thấy có vẻ như khác hẳn với các con xử lý của intel trước đó, nhưng thực chất PentiumII là sự pha trộn giữa công nghệ mới và việc nâng cấp các thuộc tính cũ của nó.
Không giống Pentium Pro hoạt động ở 3.3V, nó hoạt động ở 2.8 V, bằng cách ấy Intel cho phép cháy nó tần số cao mà không đòi hỏi tăng điện áp một cách quá mức. Trong khi với 200Mhz pentium Pro với bộ cache 512KB tiêu tốn khoảng 37.9 w, còn 266Mhz của PentiumII với cache 512Kb tốn khoảng 37w.
Celeron
Trong một cố gắng tạo một vị trí tốt hơn cho PC giá rẻ, AMD và Cyrix vẫn tiếp tục phát triển dựa trên cấu trúc socket 7, Intel đã đưa ra thị trường một dòng processor Celeron dựa trên cấu trúc đó vào tháng 4 năm 1998.
Cùng với việc dựa vào cùng siêu cấu trúc như P II, và sử dụng cùng tiến trình 0.25micron, hệ thống Celeron được cung cấp một gói các công nghệ gần đây nhất như hổ trợ cho đồ hoạ AGP, các đĩa cứng ATA-33, SDRAM và ACPI. Lúc đầu Celeron có thể làm việc với bất kỳ chipset của pentiumII mà hỗ trợ bus hệ thống 66 Mhz như 440LX, 440BX và mới nhất là 440EX- sau đó thì được thiết kế đặc biệt riêng.
Lúc đầu Celeron 266 và 300 Mhz không có cache L2, không được thị trường chấp nhận lắm vận chuyển ít hoặc tốt hơn các hệ thống mà dựa trên Socket 7, gặp một số nhược điểm khi thực hiện các chỉ thị phức tạp. Vào tháng 8 năm 1998 Intel thay đổi dòng celerons trước đó với tên mới là Mendocino, tất cả các Celeron đều có Cache L2 ở tất cả các tốc độ của CPU và có thể giao tiếp bên ngoài thông qua bus 66Mhz. Việc thay đổi mới này làm cho Celeron tốt hơn nhiều người tiền nhiệm của nó .
Pentium Xeon
Vào tháng 6/1998 Intel đã giới thiệu một processor của nó ,tốc độ 400Mhz. kỹ thuật mà Xeon sử dụng là sự kết hợp của Pentium Pro và Pentium II và được thiết kế để cung cấp các chỉ thị đặc biệt dành cho các ứng dụng trên Server hoặc Workstation. Việc sử dụng bộ phận Slot 2 , làm Xeon có kính thước gấp hai lần PentiumII , trước hết bởi vì việc tăng cache L2,. Cache hệ thống thì cùng kiểu với Pentium Pro, nó là một trong các yếu tố giá cả chính trong Xeons. Một cái khác là ECC SRAM được coi là chuẩn trong tất cả Xeons.
Khi được đưa ra , chíp vơi cache L2 512kb hoặc 1Mb vẫn được sử dụng. Trước đó thì được mong đợi dành cho các máy trạm sau được ấn định việc thực thi của server. Loại 2 Mb xuất hiện cuối 1999.
Giống với CPU PentiumII 350Mhz và 400Mhz, bus Front Side Bus chạy ở 100Mhz cho việc mở rộng băng thông của hệ thống.
Hệ thống mà dựa trên Pentium Xeon II có thể được cấu hình mở rộng lên đến 4 hoặc 8 processor hay hơn nữa.
Mặc dù Intel đã quyết định đích của Xeon là cả các máy trạm và Server, nhưng nó phát triển trên các chipset mainboard khác nhau. Chipset 440GX được thiết lập dựa cốt lõi là cấu trúc của chipset 440BC thì được sử dụng trên máy trạm. Chipset 450NX, hoặc một số khác, được thiết kế dành cho các server.
Mùa xuân 2001 Pentium 4 đầu tiên dựa trên Xeon được xuất xưởng, với tốc độ đồng hồ 1.4, 1.5, 1.7Ghz. Dựa vào lõi Foster, đây là điều giống với chuẩn của Pentium 4 từ dạng (form factor) microPGA socket 630 và khả năng của cặp processor. Pentium IV Xeon được hở trợ bởi Chipset i860, tương tự với chipset i850 là thêm hỗ trợ căp processor ,bus PCI 2x64 bit và Memory Repeater Hubs(MRH-R) để tăng tối đa kích thước bộ nhớ lên 4 GB (8RIMMs).
Một năm sau một thế hệ nhiều processor đã được công bố , cho phép 4 và 8 processor cho đa xử lý đối xứng (SMP) và tính năng tích hợp cache L3 512 kb hoặc 1 Mb.
Pentium III
Kế thừa của bộ xử lý Intel Pentium II, trước kia là bảng mã có tên là Kâtmi được đưa ra thị trường vào mùa xuân năm 1999. Bộ vi xử lí mới này được giới thiệu có 70 điểm mới về phần mở rộng nhưng không có bất cứ thay đổi nào về mặt kiến trúc
50 trong số cái mới về phần mở rộng của dữ liệu đa đường truyền là cải thiện cách biểu thị của dấu chấm động. Cũng có 12 lệnh mới về Media để hỗ trợ nhiều hơn cho việc xử lý dữ liệu truyền thông. Tám lệnh cuối cùng này cũng được Intel đưa ra là lệnh về Cacheability. Chúng cải thiện đáng kể hiệu quả của CPU và cho phép những phát triển phần mềm làm tăng khả năng thực thi của game hay ứng dụng của họ
Tháng 10 năm 1999 bộ xử lí mã Coppermine được sử dụng kĩ thuật xử lí 0,18 nm cao cấp của Intel. Cấu trúc đặc biệt này nhỏ hơn sợi tóc người 500 lần và nhỏ hơn cả vi khuẩn, ngắn hơn bước sóng ánh sáng mà con người có thể nhìn thấy được. Sự kết hợp hợp lí giữa tốc độ và điện thế hoạt động thấp đã làm cho hiệu quả của hệ thống vượt xa tốc độ có thể của đồng hồ tốc độ 1GHz.
Cho dù kích thước của 2 cache trong Pentium III mới 256KB được đặt cứng trên và chạy cùng tốc độ với bộ xử lí và nhanh gấp rưỡi tốc độ trước đây. Intel đề cập tăng cường băng thông bằng Advanced Transfer Cache.
Pentium lõi Tualatin (Core) là một ví dụ khác về trình độ của Intel đạt được trong kế hoặch kĩ thuật trong một thờI gian dài nhưng phảI đưa vào thị trường trong thờI gian ngắn hơn
Tualatin
Tualatin về bản chất là sự cải tiến của hệ tiền nhiệm là Coppermine. Bởi vì được sản xuất trên 1 bộ vi xử lí nhỏ hơn, Tualatin cần ít năng lượng hơn nhiều so với lõi Coppermine.
Cuối cùng, Tualatin giới thiệu một đặc tính bên ngoài của CPU. Gói FC-PGA2 chứa một tích hơp giải nhiệt được thiết kế làm hai nhiệm vụ quan trọng. Trước hết là giải nhiệt bằng cách cung cấp một bề mặt rộng hơn trên gắn bộ tản nhiệt. Thứ hai là bảo vệ những nguy hiểm về cơ học do lõi vi xử lí rất dễ gãy, hay ít ra nó cũng tránh va chạm và nguy hiểm có thể xảy ra khi lớp hộp toả nhiệt
Ba phiên bản Socket 370 của Tualatin đã được xác định la Pentium III desktop, Pentium III-S, Pentium III- M. Cả máy nhà và máy chủ và máy lưu động đều tăng L2 cache lên 512 KB. Chắc chắc với khát khao tránh được những đáng tiếc vớI bộ vi xử lí Pentium IV trong chợ máy desktop, và bộ xử lí đờI cũ cũng có cấu hình L2 cache 256KB
Không chỉ duy nhất 0,13mn chế tạo vi xử lí Tualatin, mà Intel còn sử dụng cả đồng nối thay cho nhôm
Copper interconnect
Nhôm là chất được chọn từ rất lâu nhưng giữa thập kỉ 90 nó đã bị loại bỏ vì sớm đạt đến giới hạn về vật lí. Những nhà khoa học đã nhận ra điều này nhiều năm và nghiên cứu để tìm ra cách thay thế nhôm với một trong ba chất dẫn điện tốt hơn là Cu, Ag, Au. Tuy nhiên sau nhiều năm nghiên cứu không có ai thành công trong việc tạo ra chíp Cu.
Tất cả đều thay đổi vào tháng 9 năm 1998 khi IBM sử dụng cách mạng kĩ thuật nối thông đồng để sản xuất một chíp sử dụng dây dẫn đồng hơn là kết nối nhôm truyền thống để kết nối transitor.
IBM có lịch sử danh tiếng về sự dẫn đầu của nó về công nghệ bộ vi xử lí nhưng lại thất bại về mặt kinh tề.
Pentium IV
Năm 2000, Intel hé mở những chi tiết đầu tiên của lõi IA-32 từ Pentium Pro giới thiệu 1995. Trước đó codename “Willimate”- bộ vi xử lí được sản xuất và tiếp thị với tên là Pentium IV và nhằm vào thị trường desktop hơn là server
Khả năng thực thi của P4 tăng nhanh là vì kiến trúc thay đổi cho phép thiết bị hoạt động tốc độ xung lượng cao và sự thay đổi về logic dẫn đến nhiều lệnh được xử lí trong một chu kì.
Thí nghiện trên p4 đầu tiên - đạt tốc độ 1,4 GB va 1,5GB diễn ra vào tháng hai năm 2000. Những chỉ số ban đầu là những con chip được cảI thiện sự thực thi trên những ứng dụng 3D giống như game trên những ứng dụng đồ họa mạnh như là phim. Trong các ứng dụng văn phòng hàng ngày giống như Word , bảng tính, thư điện tử khả năng thực thi hoàn hảo hơn
Một trong những khía cạnh gây tranh cãi của P4 là những hỗ trợ đặc thù, nó tích hợp với DRDRAM. Điều này làm cho hệ thống p4 dường như đắt hơn các hệ thống khác của AMD mà cũng sử dụng SDRAM. Tuy nhiên sự kết hợp của AMD Athon và DDR chống lại hệ thống P4 trạng bị DRDRAM với giá cả thấp hơn
Trong nưa năm đầu của năm 2001 những nhà cung cấp lõi logic SIS và VIA quyết định khai thác tình huống này bằng cách bỏ đi chipset P4 hỗ trợ DDRAM. Intel đã nhận được phản hồi vào mùa hè năm 2001 với việc bỏ đi I485 chipset .
Mùa thu năm 2002 p4 trở thành bộ vi xử lí được thương mại hóa đầu tiên hoạt động với ba tỉ phép tính / giây.P4 3,06Gb cũng đã đánh dấu quan trọng về lời giới thiệu của Intel về kĩ thuật Hyper Threadting (HT) trong cuộc cách mạng máy tính gia đình. Thật vậy kĩ thuật HT cũng sớm hiện diện trong bộ xử lý P4 .Điều này không được hợp lí trước đây bởi vì cấu trúc của hệ thống cần được bổ xung các kĩ thuật tiên tiến hỗ trợ chipset mainboard và đòi hỏi về điện lượng và nhiệt độ _không được đặt trước đây
Mở rộng trên bộ xử lí máy chủ của Intel kĩ thuật HT được hỗ trợ hệ thống cho phép PC hoạt động hiệu quả hơn bằng các tài nguyên và cho phép máy đơn có thể chạy hai chương trình tách biệt cùng một lúc. Do môi trường đa nhiệm kết quả là việc cải thiện khả năng thực thi mà qua sự đáp ứng của hệ thống
HYPER THEADING TECHNOLOGY
Kỹ thuật HT tác dụng như đòn bẩy hỗ trợ quá trình xử lí song song bằng cách thi hành hai bộ xử lí logic trên một con chip đơn lẻ. Về mặt kiến trúc, mỗi bộ xử lí với kĩ thuật HT được xem như là bao gồm hai bộ xử lí logic
Phần mềm kế thừa sẽ chạy tốt trên bộ xử lí HT và mã đòi hỏi lợi ích chung tốt về kĩ thuật là quan hệ đơn giản. Intel ước lượng rằng một chương trình có thể được 30% khi truy cập hệ thống và mã ứng dụng. Hơn nữa trong môi trường đa xử lí việc tăng sức mạnh tính toán nói chung giống như tăng số lượng bộ xử lí về mặt vật lí
ITANIUM
Vào tháng 6 năm 1994 Hewlett Parket công bố nghiên cứu về kết nối của họ và phát triển dự án nhằm mục đích nâng cấp kĩ thuật tối tân cho máy chủ và các sảm phẩm tính toán kinh doanh và tháng 10 năm 1997 họ tiết lộ những chi tiết đầu tiên về kiến trúc máy tính 64 bit. Ngay lúc này bộ vi xử lí Intel mới trong gia đình 64 bit mà”Merced” , mà sau “Coliformain” đã được thành phẩm vào năm 1999 sử dụng kĩ thuật 0,18mn. Trong sự kiện này chương trình phát triển Merced trở nên tồi tệ và được ước lượng khoảng một năm từ khi làm xong công trình nghiên cứu, khi Intel công bố lựa chọn loại hàng tên Itanium vào tháng 10 năm 1999
Các bộ xử lý đa lõi
1999 – CPU 2 lõi kép đầu tiên ra đời (IBM Power4 cho Server)
2001 – bắt đầu bán ra thị trường Power4
2002 – AMD và Intel thông báo thành lập CPU đa lõi của mình.
2004 – CPU lõi kép của Sun ra đời UltraSPARS IV
2005 – Power5
03/2005 – CPU Intel lõi kép x86 ra đời, AMD – Opteron, Athlon 64X2
20-25/05/2005 – AMD bắt đầu bán Opteron 2xx
26/05 Intel Pentium D
31/05 AMD – bán Athlon 64X2
Presler 65nm
Yonah Dual Core
Ngày nay có rất nhiều loại máy tính được sản xuất và bán trên thị trường, với chủng loại rất đa dạng: từ những máy PC để bàn cho tới các siêu máy tính thương mại. Bộ vi xử lý của các máy này khác nhau như thế nào? Phân loại các bộ vi xử lý theo cơ chế vận hành của chúng sẽ giúp ta tìm được phương thức lập trình tốt nhất cho máy tính của mình.
1. NGUYÊN LÝ HOẠT ĐỘNG
Nguyên lý cơ bản của tất cả bộ xử lý máy tính đều giống nhau. Về cơ bản, chúng luôn lấy tín hiệu ở dạng 0 và 1 (tín hiệu nhị phân), chế tác chúng theo bộ chỉ thị và xuất ra tín hiệu 0 và 1. Điện áp trên cùng tuyến ở cùng thời điểm tín hiệu được gởi đi sẽ quyết định tín hiệu là 0 hay là 1.
Ví dụ: Đối với hệ thống 3.3 volt, một ứng dụng 3.3 volt có tín hiệu là 1, còn một ứng dụng 0 volt có tín hiệu là 0.
Bộ xử lý làm việc bằng cách tác động trở lại thiết bị nhập theo tín hiệu 0 và 1 bằng những cách đặc trưng rồi trả về thiết bị xuất khi cần thiết. Hoạt động này xảy ra trong mạch được gọi là cổng logic, mỗi cổng phải có ít nhất một transistor (thiết bị bán dẫn).
Thật ra những bộ xử lý hiện nay chứa hàng triệu transistor, điều này góp phần tạo ra một hệ thống logic rất phức tạp. Cổng logic của bộ xử lý cùng làm việc để đưa đến việc sử dụng logic kiểu Boolean, dựa vào hệ Đại số được xây dựng bởi nhà Toán học Geogre Boole.
Những toán tử kiểu Boolean cơ bản là AND, OR, NOT, và NAND (not AND).
Cổng AND xuất ra tín hiệu 1 nếu chúng nhận vào toàn là tín hiệu 1.
Cổng OR sẽ xuất ra tín hiệu 1 nếu ít nhất có 1 tín hiệu vào là 1.
Và cổng NOT lấy ra một tín hiệu nhập đơn và phủ định nó, tức là xuất ra 1 nếu tín hiệu nhập vào là 0 và ngược lại.
Dòng điện qua mỗi cổng được điều khiển bởi transistor của cổng đó. Tuy nhiên, những transistor này không phải là những đơn vị độc lập và riêng lẻ. Thay vào đó, một số lượng lớn transistor được chế tạo từ một mẩu silicon đơn (hoặc chất liệu bán dẫn khác) và được nối với nhau mà không cần dây nối hay những chất liệu bên ngoài nào khác. Những đơn vị này được gọi là những mạch tích hợp (ICs), và việc phát triển chúng về cơ bản tạo ra sự phức tạp của bộ vi xử lý.
Sự tích hợp của các mạch không chỉ dừng lại ở vi mạch đầu tiên. Khi mạch tích hợp đầu tiên kết nối nhiều transistor, gọi là mạch tích hợp bội - liên kết theo một quy trình được xem như là tích hợp cỡ lớn (LSI); cuối cùng khi những bộ mạch tích hợp được kết nối theo một quy trình có độ tích hợp rất cao (VLSI).
Những bộ vi xử lý hiện đại ngày nay chứa hàng triệu transistor cực nhỏ. Được dùng kết hợp với điện trở, tụ điện và điôt, cấu tạo nên cổng logic. Các cổng logic cấu tạo nên mạch tích hợp, và các mạch tích hợp cấu tạo nên những hệ thống điện tử.
Intel là hãng sản xuất nổi tiếng đầu tiên với con chip xử lý đơn phức tạp chứa tất cả những cổng logic của bộ xử lý có độ tích hợp cao - thế hệ Intel 4004 - sản xuất sau năm 1971.
Con chip này có bộ vi xử lý 4-bit, dùng trong máy tính bỏ túi. Nó xử lý dữ liệu với 4 bit, nhưng những chỉ thị của nó là 8 long-bit. Chương trình và dữ liệu tách rời, lần lượt là 1KB và 4KB. Cũng có 16 thanh ghi đa năng 4-bit (hay 8-bit). Intel 4004 có 46 chỉ thị, chỉ dùng 2,300 transistor trong 1 DIP 16-pin (kiểu đóng gói) và chạy ở tốc độ 740kHz (8 vòng trên một chu trình CPU 10.8 micro giây).
Chỉ trong vòng vài năm 2 dòng vi xử lý đã thống trị công nghiệp PC - Pentium của Intel và PowerPC của Motorola. Những CPU này cũng là những thử nghiệm tốt nhất của 2 kiến trúc CPU đang cạnh tranh nhau trong 2 thập kỉ qua - nhóm phát minh ra con chip CISC và sau đó là nhóm phát minh ra chip RISC.
CISC
CISC (máy tính có bộ chỉ lệnh phức hợp) là kiến trúc truyền thống của máy tính, trong đó CPU sử dụng vi mã để thực hiện bộ chỉ lệnh rất toàn diện.
Chỉ trong một vài năm, xu hướng của các hãng sản xuất là xây dựng những CPU tăng thêm độ phức tạp có bộ lệnh chỉ thị lớn hơn.
Vào năm 1974, viện nghiên cứu IBM đã quyết định đưa ra một phương pháp giảm đột ngột số chỉ lệnh mà con chip phải thực thi. Vào giữa những năm 1980, điều này đã dẫn đến một số hãng sản xuất máy tính đổi hướng bằng cách phát minh những CPU có tính năng thực thi chỉ một bộ hữu hạn các chỉ lệnh.
RISC
RISC (máy tính dùng tập lệnh rút gọn) CPU giữ kích thước chỉ lệnh không đổi. Một lợi thế của CPU RISC là chúng có thể thực thi những chỉ lệnh rất nhanh bởi vì các chỉ lệnh quá đơn giản. Mặt khác, lợi thế quan trọng hơn là chip RISC phụ thuộc không nhiều vào những transistor, làm cho chúng rẻ hơn trong thiết kế và sản xuất.
Vẫn còn nhiều tranh luận giữa những chuyên gia về kết quả cuối cùng của kiến trúc RISC. Những người đề xướng tranh luận rằng RISC vừa rẻ hơn vừa nhanh hơn, và vì vậy nó là máy của tương lai.
Lưu ý rằng việc tạo ra phần cứng đơn giản hơn, kiến trúc RISC đặt nặng về phần mềm hơn - trình biên dịch RISC phải tạo ra phần mềm để thực thi những chỉ lệnh phức tạp mà máy tính CISC hoạt động bên trong phần cứng. Họ cho rằng điều này không có ích bởi vì những bộ vi xử lý quy ước ngày càng tăng tốc độ và rẻ hơn.
Trong một chừng mực nào đó, ý kiến này đang trở thành vấn đề tranh luận bởi vì những thực thi CISC và RISC ngày càng trở nên giống nhau. Nhiều con chip RISC hiện nay có nhiều chỉ lệnh và ngược lại, những con chip CISC hiện nay sử dụng nhiều kỹ thuật trước đây kết hợp với con chip RISC. Chip CISC của Intel đã dùng kỹ thuật RISC trong chip 486 của nó và làm tăng số lượng trong những bộ xử lý của dòng Pentium.
2. KHÁI NIỆM VỀ CPU HIỆN ĐẠI
Hệ thống P_Rating (PR)
Theo truyền thống, các CPU được phân loại theo tốc độ xung nhịp của chúng. Ví dụ, một CPU Pentium 233MHz, nói chung được xem như có hiệu năng tốt hơn một CPU Pentium 166MHz.
Tuy nhiên, điều này làm lộ ra các rắc rối về tiếp thị phiền phức và kỳ dị đối với các nhà sản xuất CPU cạnh tranh nhau. Mặc dù Intel vẫn tiếp tục dẫn đầu trong việc phát minh CPU, nhưng các nhà chế tạo CPU khác (như AMD và Cyrix chẳng hạn) đang duy trì một sức ép lên họ bằng cách nhồi nhét hiệu năng cao hơn vào trong các chu kỳ xung nhịp ít hơn.
Đáng tiếc là, một người dùng bình thường khó có thể phân biệt được một CPU phi_intel ở một tốc độ xung nhịp cho trước lại có hiệu năng cũng tốt như một CPU của Intel chạy ở một tốc độ xung nhịp khác.
Vào đầu năm 1996, Cyrix, IBM Microelectronics, và SGS Thomson (tất cả đều là những nhà sản xuất cạnh tranh với Intel) đã tụ họp lại để tạo ra hệ thống P-rating (tức PR) để mô tả các CPU của họ. Bằng cách dùng một cách mệnh danh “PR”, một CPU nào đó có thể được coi ngang hàng với một CPU Pentium của Intel.
Ví dụ, bộ xử lý AMD 133MHz Am5x86 được ghi là PR75, và có hiệu năng có thể so sánh được với một chip Intel 75MHz Pentium. Khi điểm đánh giá (rating) có kèm một hậu tố “+” hoặc “++” (ví dụ, PR 75++), nó có nghĩa là CPU ấy cung cấp hiệu năng tốt hơn là đối thủ phía Intel tương ứng. Cac điểm đánh giá P_rating được xác định thông qua một phương pháp so sánh trực tiếp.
Trình kiểm định (benchmark) Winstone 96 được chạy trên một hệ thống PC được lắp đặt cấu hình một cách cụ thể, có động lực là một bộ xử lý Pentium có một tốc độ xung nhịp đa định.
Bộ xử lý Pentium ấy được tháo ra khỏi hệ thống và được thay một bộ xử lý cạnh tranh. Trình Benchmark winstone 96 được chạy lại lần nữa, và người ta thu được một điểm winstone thứ 2 từ cùng hệ thống đó, nhưng giờ đang chạy bộ xử lý cạnh tranh kia. Cấu hình hệ thống được giữ giống hệt hệ thống cũ, và tất cả các thiết bị ngoại vi đều được ghi chú tài liệu kỹ lưỡng.
Bộ xử lý cạnh tranh ấy được cấp điểm PR cao nhất mà tại đó nó cung cấp những điểm winstone bằng hoặc lớn hơn CPU đang xét. Ví dụ, nếu một bộ xử lý AMD K5, cung cấp được hiệu năng bằng hoặc tốt hơn một bộ Pentium 90Mhz, thì nó nhận được điểm PR là 90.
Các đế cắm CPU
Một ý tưởng quan trọng khác trong việc phát minh và tính khả năng nâng cấp của CPU là khái niệm các đế cắm socket, mỗi thế hệ CPU sử dụng một số chân cắm khác nhau ( và các quy định chân cắm khác nhau ), cho nên phải dùng một đế cắm vật lý xác định trên bo mạch chính thì mới thích nghi được với từng thế hệ bổ xử lý mới.
Các CPU lúc đầu không sẵn sàng để đổi lẫn cho nhau, và việc nâng cấp một CPU thường có nghĩa là phải nâng cấp luôn mainboard. Với sự ra đời của các CPU I486, khái niệm bộ xử lý Overdrive đã trở nên được nhiều người ưa thích thay thế một CPU có sẵn bằng một CPU thay thế tương thích số chân vốn hoạt động ở những tốc độ xung nhịp nội cao hơn để tăng cường hiệu năng hệ thống. Khi các CPU đã tiến bộ các kiểu đế cắm đã sinh sôi nẩy nở để yểm trợ cả một tập hợp không ngừng tăng trưởng các bộ xử lý tương thích.
Gần đây, loại đế cắm thông dụng nhất là socket 370, và 478 (dùng cho P4) các bo mạch chính socket 7 yểm trợ hầu hết các bộ xử lý loại Pentium (tức là Pentium của Intel, Pentium MMX của Intel, K5 K6 của AMD, 6x86 6x86MX Cyrix). Bằng cách ấn định tốc độ xung nhịp và hệ số nhân thích hợp, một bo mạch chính loại socket 7 có thể yểm trợ nhiều CPU Pentium mà không cần thực hiện bất kỳ sự thay đổi phần cứng nào. Chính tính vạn năng này đã khiến các đế cắm đó trở nên quan trọng đến vậy, và đã kéo dài tuổi thọ của các PC hiện nay bằng cách cung cấp một lộ trình nâng cấp cho các CPU.
Xử lý lệnh theo đường ống (Pipelining)
Các CPU xử lý các lệnh và tạo ra kết quả thông qua một chuỗi phức tạp các khóa chuyển bằng transistor ở bên trong bản thân của CPU (hệt như mọi chip luận lý khác).
Các CPU cũ đã xử lý mỗi lúc một lệnh – tức là lệnh trước đã được lấy về và được xử lý hoàn toàn rồi một lệnh mới mới được đọc về. Việc xử lý một lệnh có thể được hoàn tất trong vài chu kỳ xung nhịp (số chu kỳ xung nhịp đích xác bao nhiêu là tuỳ thuộc vào lệnh cụ thể)
Kỹ thuật xử lý theo đường ống (pipelining), hoặc xử lý lệnh liên tiếp (Intruction Pipelining) cho phép lệnh mới bắt đầu được xử lý trong khi các lệnh hiện tại vẫn đang được xử lý.
Bằng cách này, CPU thực sự có thể được thực hiện vài lệnh trong cùng một chu kì xung nhịp. Nói cách khác, đối với một chu kì xung nhịp cho trước bất kỳ, có thể có vài lệnh “In the pipeline” cùng một lúc. Xử lý theo đường ống cho phép CPU tận dụng các tài nguyên xử lý trong khi một lệnh nào đó đang được hoàn tất.
Thi hành siêu hướng
(Superscalar Execution)
Các CPU truyền thống dùng một “động cơ thi hành” duy nhất đề xử lí các lệnh. Đối với một chu kì xung nhịp cho trước chỉ có thể sinh ra kết quả cho một lệnh mà thôi.
Bằng cách bổ xung nhiều “động cơ thi hành” vào CPU, các nhà thiết kế đã cung cấp cho CPU một khả năng xử lí nhiều lệnh trong một chu kì xung nhịp.
Các CPU này được gọi là bộ xử lí siêu hướng. (Superscalar Processor). Ví dụ , Pentium Pro bằng cách kết hợp xử lí theo đường ống với nhiều động cơ thi hành của kiến trúc siêu hướng, các CPU hiện đại đã tận dụng cực kì hữu hiệu mọi chu kì xung nhịp.
Tiên đoán rẽ nhánh
(Branch Prediction)
Bởi vì các CPU được xử lý theo đường ống phải lấy về lệnh kế tiếp trước khi chúng hoàn thành lệnh trước đó, nên đều này dẫn đế một tình thế tiến thoái lưỡng nan trong xử lý
Nếu lệnh trước là một nhánh (một phát biểu if then), thì lệnh kế tiếp lấy về sẽ có thể sai. Branch Prediction là kỹ thuật có nhiệm vụ cố gắng phỏng đoán địa chỉ thích hợp của của lệnh kế tiếp trong khi chỉ biết lệnh hiện tại. Nếu tiên đoán được nhánh không đúng (gọi là một mispredict – sự tiên đoán nhầm), thì phải xác định lại nhánh đúng và điều này có thể xảy ra sự chậm trễ, ảnh hưởng xấu đến hiệu năng xử lý.
Hệ quả là tính năng Branch prediction của một CPU hiện đại hẳn phải là cực kì mạnh mẽ.
Thi hành động
(Dynamic Execution)
Ngay cả CPU nhanh nhất cũng thi hành theo thứ tự mà chúng được viết bên trong chương trình cụ thể. Điều này có nghĩa là chương trình được viết một cách không đúng đắn, không hiệu quả sẽ làm giảm hiệu suất xử lý của CPU.
Trong nhiều trường hợp, ngay cả mã lệnh được viết tốt cũng có thể trở nên bị sút kém trong quá trình lắp ráp và liên kết phẩn mềm. Kỹ thuật thi hành lệnh cho phép bộ xử lý ước lượng “dòng chảy” của chương trình và “chọn lựa” thứ tự tốt nhất để xử lý các lệnh. Khi được thực hiện một cách đúng đắn, sự “sắp xếp thứ tự lại một cách chọn lọc” các lệnh sẽ cho phép CPU tận dụng thậm chí còn tốt hơn tài nguyên xử lý của nó - và giúp làm tăng hiệu năng tổng thể của CPU.
CPU cache RAM
Dòng dữ liệu đi qua CPU với tốc độ rất nhanh. Ram bình thường không thể giữ được tốc độ này. Vì thế, một loại Ram đặc biệt có tên gọi là cache được sử dụng như một loại bộ đệm (buffer) hay nói cách khác là một nơi lưu trữ tạm thời.
Để CPU với hiệu năng cao nhất , số lượng các luồng dữ liệu vào và ra phải giảm thiểu rất nhiều. Vậy khi luồng dữ liệu truyền đi có nhiều hơn, thì nó phải được chứa tạm ở một nơi nào đó trong CPU, thì tốc độ sẽ nhanh hơn. Và như thế dòng dữ liệu sẽ liên tục.
Vì thế, Intel 80486 đã tích hợp bộ xử lí toán học và đơn vị dấu chấm động và 8 Kb L1-cache RAM. Chính 2 đặc tính quan trọng đó đã giúp giảm thiểu luồng giữ liệu ra vào trên CPU.
CPU cache RAM (tt)
Ta thấy rằng CPU dùng kiến trúc Pipeline để truyền và xử lý dữ liệu. Bằng 1 cách nào đó để dữ liệu không được dồn nén hay quá lớn, nhưng cũng phải liên tục thì mới tận dụng hết khả năng của CPU. Lúc đầu chưa có cache, CPU đơn thuần sử dụng RAM để truy xuất data. Sau đó các nhà khoa học đã nghĩ ra việc tạo ra một Ram Cache nằm ngay trên chính miếng Silicon tạo ra CPU, và như vậy, ta luôn sẵn sàng có một chỗ rất gần bộ xử lí chứa đựng thông tin để đưa qua. Ram Cache được tích hợp đó gọi là L1.
CPU cache RAM (tt)
Cache RAM trở nên rất quan trọng tốc độ CPU, ở đó tốc độ xung nhịp thực sự là cao hơn nhiều so với bên ngoài. Ta có thể hiểu cache RAM là ngôi nhà sức mạnh của CPU. Trong các đời CPU cũ, L2 cache được chế tạo từ những chip SRAM và gắn trên mainboard, nhưng CPU hiện đại nó được gắn trong CPU. Như thế L2 đóng vai trò như một người bạn sẵn sàng cung cấp data cho L1 và nhận data từ RAM.
3. CÁC LOẠI CPU
TỐC ĐỘ - CÔNG NGHỆ
Bảng sau đây biểu diễn các thế hệ bộ xử lý từ thế hệ 8088/86 đầu tiên của Intel trong những năm cuối 1970 đến thế hệ thứ 8 AMD Athlon 64, được giới thiệu vào mùa thu năm 2003
Pentium
Từ pentium không có nghĩa gì cả , nó có âm tiết là pent, mà tiếng Hy Lạp có nghĩa là số 5. Bắt nguồn từ việc Intel gọi pentium 80586, nối tiếp sau của thế hệ chíp 80x86. Do không thích giống các công ty khác như AMD, Cyrix và một số kẻ nhái theo một cung lấy tên là 80x86, vì vậy Intel quyết định lấy tên thương mại là Pentium.
Các chip Pentium mà dựa vào kiến trúc CISC được mô tả như là một bược nhãy so với thế hệ 486. tốc độ 120MHz và có khoảng 3.3 triệu con transistor , được chế tạo trên một quy trình 0.35 mirco mét. Bên trong, bộ xử lý sử dụng một bus 32 bit , nhưng bên ngoài sử dụng bus dử liệu 64 bit mở rộng.
External bus đòi hỏi một bo mạch chủ tách riêng và để hổ trợ điều này Intel đã đưa ra bán một chipset đặc biệt có chức năng liên kết Pentium đến cache 64 bit bên ngoài và đến bus PCI.
Phần lớn các pentium (75Mhz và lớn hơn nữa ) hoạt động có hiệu qủa ở 3.3v.
Pentium Pro
Pentium Pro được giới thiệu vào năm 1995 là thế hệ kế tục của dòng Pentium, là bộ xử lý đầu tiên của thế hệ thứ 6 và đưa ra một vài kỹ thuật đặc biệt duy nhất chưa từng thấy trong bộ xử lý PC trước đó.
Pentium Pro là CPU đầu tiên của xu hướng mới làm thay đổi cơ bản cách thức thực thi những chỉ lệnh, bằng cách chuyển sang những vi chỉ lệnh tương tự như RISC và thực thi chúng theo hướng cải tiến bên trong ở mức độ cao. Nó cũng đưa ra một cách đột ngột cache thứ 2 có hiệu suất cao hơn tất cả những bộ xử lý trước đây. Thay vì sử dụng cache của bản mạch chính cơ bản chạy với tốc độ của bus bộ nhớ, nó dùng một cache tích hợp cấp 2 với bus của nó, chạy ở tốc độ bộ xử lý đầy đủ, đặc trưng cho 3 lần tốc độ mà cache chạy trên Pentium.
MMX
Intel`s p55c mmx (multimedia extension) giới thiệu vào đầu năm 1997. Nó là sự thay đổi lớn kiến trúc cơ bản của bộ xử lý danh cho pc trong 10 năm và gồm có 3 cải tiến lớn:
Cache L1 chuẩn của Pentium được tăng gấp 2 lên 32kb
77 lệnh mới được thiết kế đặc biệt để thao tác xử lý video, audio, và nhiều tính năng hiệu quả dành cho đồ hoạ.
Có một tiến trình mới được gọi là single intruction multiple data SIMD (một chỉ thị trên nhiều dữ liệu) được phát triển nó làm cho một lệnh (intruction) thực hiện các chức năng tương tự nhau trên nhiều phần của data một cách đồng thời.
Nó có một số cải tiến đặc biệt cho các ứng dụng multi media và đồ hoạ như mã hoá / giải mã tín hiệu audio và video , việc nạp và xử lý các hình ảnh. Intel khuyến cáo việc cải tiến này sẽ làm tăng tốc độ xử lý lến 10- 20% nếu sử dụng phần mền non - mmx và 60% đối với các ứng dụng có MMX.
Pentium II
Được đưa ra vào giữa năm 1997, P.II được giới thiệu là có một số thay đổi lớn đối với tiến trình kết thúc của PC:
Đầu tiên là con chip và hệ thống cache Level 2 được kết nối bởi một bus chuyên dụng mà nó có thể chạy đồng thời với processor đến bus hệ thống.
Thứ hai là processor, hai cache và heatsink (bộ tỏa nhiệt được lắp đặt trên một bảng nhỏ (small board) mà có thể cắm vào một slot của bo mạch chủ. Intel đặt tên là hộp single edge contact (cartridge SEC).
Thay đổi thứ ba là có nhiều thứ tổng hợp thực sự , như pentium hợp nhất tính năng bus Dual Independent Bus (DIB) của pentium Pro với việc cải tiến MMX được tìm thấy trên pentiumMMX thành một dạng ghép mới của Pentium Pro/ MMX. Do đó , đôi khi ta thấy có vẻ như khác hẳn với các con xử lý của intel trước đó, nhưng thực chất PentiumII là sự pha trộn giữa công nghệ mới và việc nâng cấp các thuộc tính cũ của nó.
Không giống Pentium Pro hoạt động ở 3.3V, nó hoạt động ở 2.8 V, bằng cách ấy Intel cho phép cháy nó tần số cao mà không đòi hỏi tăng điện áp một cách quá mức. Trong khi với 200Mhz pentium Pro với bộ cache 512KB tiêu tốn khoảng 37.9 w, còn 266Mhz của PentiumII với cache 512Kb tốn khoảng 37w.
Celeron
Trong một cố gắng tạo một vị trí tốt hơn cho PC giá rẻ, AMD và Cyrix vẫn tiếp tục phát triển dựa trên cấu trúc socket 7, Intel đã đưa ra thị trường một dòng processor Celeron dựa trên cấu trúc đó vào tháng 4 năm 1998.
Cùng với việc dựa vào cùng siêu cấu trúc như P II, và sử dụng cùng tiến trình 0.25micron, hệ thống Celeron được cung cấp một gói các công nghệ gần đây nhất như hổ trợ cho đồ hoạ AGP, các đĩa cứng ATA-33, SDRAM và ACPI. Lúc đầu Celeron có thể làm việc với bất kỳ chipset của pentiumII mà hỗ trợ bus hệ thống 66 Mhz như 440LX, 440BX và mới nhất là 440EX- sau đó thì được thiết kế đặc biệt riêng.
Lúc đầu Celeron 266 và 300 Mhz không có cache L2, không được thị trường chấp nhận lắm vận chuyển ít hoặc tốt hơn các hệ thống mà dựa trên Socket 7, gặp một số nhược điểm khi thực hiện các chỉ thị phức tạp. Vào tháng 8 năm 1998 Intel thay đổi dòng celerons trước đó với tên mới là Mendocino, tất cả các Celeron đều có Cache L2 ở tất cả các tốc độ của CPU và có thể giao tiếp bên ngoài thông qua bus 66Mhz. Việc thay đổi mới này làm cho Celeron tốt hơn nhiều người tiền nhiệm của nó .
Pentium Xeon
Vào tháng 6/1998 Intel đã giới thiệu một processor của nó ,tốc độ 400Mhz. kỹ thuật mà Xeon sử dụng là sự kết hợp của Pentium Pro và Pentium II và được thiết kế để cung cấp các chỉ thị đặc biệt dành cho các ứng dụng trên Server hoặc Workstation. Việc sử dụng bộ phận Slot 2 , làm Xeon có kính thước gấp hai lần PentiumII , trước hết bởi vì việc tăng cache L2,. Cache hệ thống thì cùng kiểu với Pentium Pro, nó là một trong các yếu tố giá cả chính trong Xeons. Một cái khác là ECC SRAM được coi là chuẩn trong tất cả Xeons.
Khi được đưa ra , chíp vơi cache L2 512kb hoặc 1Mb vẫn được sử dụng. Trước đó thì được mong đợi dành cho các máy trạm sau được ấn định việc thực thi của server. Loại 2 Mb xuất hiện cuối 1999.
Giống với CPU PentiumII 350Mhz và 400Mhz, bus Front Side Bus chạy ở 100Mhz cho việc mở rộng băng thông của hệ thống.
Hệ thống mà dựa trên Pentium Xeon II có thể được cấu hình mở rộng lên đến 4 hoặc 8 processor hay hơn nữa.
Mặc dù Intel đã quyết định đích của Xeon là cả các máy trạm và Server, nhưng nó phát triển trên các chipset mainboard khác nhau. Chipset 440GX được thiết lập dựa cốt lõi là cấu trúc của chipset 440BC thì được sử dụng trên máy trạm. Chipset 450NX, hoặc một số khác, được thiết kế dành cho các server.
Mùa xuân 2001 Pentium 4 đầu tiên dựa trên Xeon được xuất xưởng, với tốc độ đồng hồ 1.4, 1.5, 1.7Ghz. Dựa vào lõi Foster, đây là điều giống với chuẩn của Pentium 4 từ dạng (form factor) microPGA socket 630 và khả năng của cặp processor. Pentium IV Xeon được hở trợ bởi Chipset i860, tương tự với chipset i850 là thêm hỗ trợ căp processor ,bus PCI 2x64 bit và Memory Repeater Hubs(MRH-R) để tăng tối đa kích thước bộ nhớ lên 4 GB (8RIMMs).
Một năm sau một thế hệ nhiều processor đã được công bố , cho phép 4 và 8 processor cho đa xử lý đối xứng (SMP) và tính năng tích hợp cache L3 512 kb hoặc 1 Mb.
Pentium III
Kế thừa của bộ xử lý Intel Pentium II, trước kia là bảng mã có tên là Kâtmi được đưa ra thị trường vào mùa xuân năm 1999. Bộ vi xử lí mới này được giới thiệu có 70 điểm mới về phần mở rộng nhưng không có bất cứ thay đổi nào về mặt kiến trúc
50 trong số cái mới về phần mở rộng của dữ liệu đa đường truyền là cải thiện cách biểu thị của dấu chấm động. Cũng có 12 lệnh mới về Media để hỗ trợ nhiều hơn cho việc xử lý dữ liệu truyền thông. Tám lệnh cuối cùng này cũng được Intel đưa ra là lệnh về Cacheability. Chúng cải thiện đáng kể hiệu quả của CPU và cho phép những phát triển phần mềm làm tăng khả năng thực thi của game hay ứng dụng của họ
Tháng 10 năm 1999 bộ xử lí mã Coppermine được sử dụng kĩ thuật xử lí 0,18 nm cao cấp của Intel. Cấu trúc đặc biệt này nhỏ hơn sợi tóc người 500 lần và nhỏ hơn cả vi khuẩn, ngắn hơn bước sóng ánh sáng mà con người có thể nhìn thấy được. Sự kết hợp hợp lí giữa tốc độ và điện thế hoạt động thấp đã làm cho hiệu quả của hệ thống vượt xa tốc độ có thể của đồng hồ tốc độ 1GHz.
Cho dù kích thước của 2 cache trong Pentium III mới 256KB được đặt cứng trên và chạy cùng tốc độ với bộ xử lí và nhanh gấp rưỡi tốc độ trước đây. Intel đề cập tăng cường băng thông bằng Advanced Transfer Cache.
Pentium lõi Tualatin (Core) là một ví dụ khác về trình độ của Intel đạt được trong kế hoặch kĩ thuật trong một thờI gian dài nhưng phảI đưa vào thị trường trong thờI gian ngắn hơn
Tualatin
Tualatin về bản chất là sự cải tiến của hệ tiền nhiệm là Coppermine. Bởi vì được sản xuất trên 1 bộ vi xử lí nhỏ hơn, Tualatin cần ít năng lượng hơn nhiều so với lõi Coppermine.
Cuối cùng, Tualatin giới thiệu một đặc tính bên ngoài của CPU. Gói FC-PGA2 chứa một tích hơp giải nhiệt được thiết kế làm hai nhiệm vụ quan trọng. Trước hết là giải nhiệt bằng cách cung cấp một bề mặt rộng hơn trên gắn bộ tản nhiệt. Thứ hai là bảo vệ những nguy hiểm về cơ học do lõi vi xử lí rất dễ gãy, hay ít ra nó cũng tránh va chạm và nguy hiểm có thể xảy ra khi lớp hộp toả nhiệt
Ba phiên bản Socket 370 của Tualatin đã được xác định la Pentium III desktop, Pentium III-S, Pentium III- M. Cả máy nhà và máy chủ và máy lưu động đều tăng L2 cache lên 512 KB. Chắc chắc với khát khao tránh được những đáng tiếc vớI bộ vi xử lí Pentium IV trong chợ máy desktop, và bộ xử lí đờI cũ cũng có cấu hình L2 cache 256KB
Không chỉ duy nhất 0,13mn chế tạo vi xử lí Tualatin, mà Intel còn sử dụng cả đồng nối thay cho nhôm
Copper interconnect
Nhôm là chất được chọn từ rất lâu nhưng giữa thập kỉ 90 nó đã bị loại bỏ vì sớm đạt đến giới hạn về vật lí. Những nhà khoa học đã nhận ra điều này nhiều năm và nghiên cứu để tìm ra cách thay thế nhôm với một trong ba chất dẫn điện tốt hơn là Cu, Ag, Au. Tuy nhiên sau nhiều năm nghiên cứu không có ai thành công trong việc tạo ra chíp Cu.
Tất cả đều thay đổi vào tháng 9 năm 1998 khi IBM sử dụng cách mạng kĩ thuật nối thông đồng để sản xuất một chíp sử dụng dây dẫn đồng hơn là kết nối nhôm truyền thống để kết nối transitor.
IBM có lịch sử danh tiếng về sự dẫn đầu của nó về công nghệ bộ vi xử lí nhưng lại thất bại về mặt kinh tề.
Pentium IV
Năm 2000, Intel hé mở những chi tiết đầu tiên của lõi IA-32 từ Pentium Pro giới thiệu 1995. Trước đó codename “Willimate”- bộ vi xử lí được sản xuất và tiếp thị với tên là Pentium IV và nhằm vào thị trường desktop hơn là server
Khả năng thực thi của P4 tăng nhanh là vì kiến trúc thay đổi cho phép thiết bị hoạt động tốc độ xung lượng cao và sự thay đổi về logic dẫn đến nhiều lệnh được xử lí trong một chu kì.
Thí nghiện trên p4 đầu tiên - đạt tốc độ 1,4 GB va 1,5GB diễn ra vào tháng hai năm 2000. Những chỉ số ban đầu là những con chip được cảI thiện sự thực thi trên những ứng dụng 3D giống như game trên những ứng dụng đồ họa mạnh như là phim. Trong các ứng dụng văn phòng hàng ngày giống như Word , bảng tính, thư điện tử khả năng thực thi hoàn hảo hơn
Một trong những khía cạnh gây tranh cãi của P4 là những hỗ trợ đặc thù, nó tích hợp với DRDRAM. Điều này làm cho hệ thống p4 dường như đắt hơn các hệ thống khác của AMD mà cũng sử dụng SDRAM. Tuy nhiên sự kết hợp của AMD Athon và DDR chống lại hệ thống P4 trạng bị DRDRAM với giá cả thấp hơn
Trong nưa năm đầu của năm 2001 những nhà cung cấp lõi logic SIS và VIA quyết định khai thác tình huống này bằng cách bỏ đi chipset P4 hỗ trợ DDRAM. Intel đã nhận được phản hồi vào mùa hè năm 2001 với việc bỏ đi I485 chipset .
Mùa thu năm 2002 p4 trở thành bộ vi xử lí được thương mại hóa đầu tiên hoạt động với ba tỉ phép tính / giây.P4 3,06Gb cũng đã đánh dấu quan trọng về lời giới thiệu của Intel về kĩ thuật Hyper Threadting (HT) trong cuộc cách mạng máy tính gia đình. Thật vậy kĩ thuật HT cũng sớm hiện diện trong bộ xử lý P4 .Điều này không được hợp lí trước đây bởi vì cấu trúc của hệ thống cần được bổ xung các kĩ thuật tiên tiến hỗ trợ chipset mainboard và đòi hỏi về điện lượng và nhiệt độ _không được đặt trước đây
Mở rộng trên bộ xử lí máy chủ của Intel kĩ thuật HT được hỗ trợ hệ thống cho phép PC hoạt động hiệu quả hơn bằng các tài nguyên và cho phép máy đơn có thể chạy hai chương trình tách biệt cùng một lúc. Do môi trường đa nhiệm kết quả là việc cải thiện khả năng thực thi mà qua sự đáp ứng của hệ thống
HYPER THEADING TECHNOLOGY
Kỹ thuật HT tác dụng như đòn bẩy hỗ trợ quá trình xử lí song song bằng cách thi hành hai bộ xử lí logic trên một con chip đơn lẻ. Về mặt kiến trúc, mỗi bộ xử lí với kĩ thuật HT được xem như là bao gồm hai bộ xử lí logic
Phần mềm kế thừa sẽ chạy tốt trên bộ xử lí HT và mã đòi hỏi lợi ích chung tốt về kĩ thuật là quan hệ đơn giản. Intel ước lượng rằng một chương trình có thể được 30% khi truy cập hệ thống và mã ứng dụng. Hơn nữa trong môi trường đa xử lí việc tăng sức mạnh tính toán nói chung giống như tăng số lượng bộ xử lí về mặt vật lí
ITANIUM
Vào tháng 6 năm 1994 Hewlett Parket công bố nghiên cứu về kết nối của họ và phát triển dự án nhằm mục đích nâng cấp kĩ thuật tối tân cho máy chủ và các sảm phẩm tính toán kinh doanh và tháng 10 năm 1997 họ tiết lộ những chi tiết đầu tiên về kiến trúc máy tính 64 bit. Ngay lúc này bộ vi xử lí Intel mới trong gia đình 64 bit mà”Merced” , mà sau “Coliformain” đã được thành phẩm vào năm 1999 sử dụng kĩ thuật 0,18mn. Trong sự kiện này chương trình phát triển Merced trở nên tồi tệ và được ước lượng khoảng một năm từ khi làm xong công trình nghiên cứu, khi Intel công bố lựa chọn loại hàng tên Itanium vào tháng 10 năm 1999
Các bộ xử lý đa lõi
1999 – CPU 2 lõi kép đầu tiên ra đời (IBM Power4 cho Server)
2001 – bắt đầu bán ra thị trường Power4
2002 – AMD và Intel thông báo thành lập CPU đa lõi của mình.
2004 – CPU lõi kép của Sun ra đời UltraSPARS IV
2005 – Power5
03/2005 – CPU Intel lõi kép x86 ra đời, AMD – Opteron, Athlon 64X2
20-25/05/2005 – AMD bắt đầu bán Opteron 2xx
26/05 Intel Pentium D
31/05 AMD – bán Athlon 64X2
Presler 65nm
Yonah Dual Core
* Một số tài liệu cũ có thể bị lỗi font khi hiển thị do dùng bộ mã không phải Unikey ...
Người chia sẻ: Người Đẹp
Dung lượng: |
Lượt tài: 7
Loại file:
Nguồn : Chưa rõ
(Tài liệu chưa được thẩm định)