I/O
Global Memory
M1
I/O
P1
M1
I/O
P1
M1
I/O
P1
(a)Đa xử lý với bộ nhớ toàn cục
(b) Đa xử lý với các bộ nhớ ph©n t¸n
2.Hiệu suất của kiến trúc
Kiến trúc đa xử lý với n thành phần xử lý P lý tưởng có thể cho S(n)=n, với băng thông dữ liệu
và lệnh là b thì có thể đạt được hiệu suất là nb. Giả sử, một bộ đa xử lý gồm n đơn vị xử lý: P1,
P2, ., Pn, và có m đơn vị nhớ: M1, M2,. ,Mm kết nối theo kiến trúc bus giao nhau (cross). Tất cả
các dữ liệu và chương trình cất ở trong module nhớ Mm. Băng thông của lệnh hoặc dữ liệu của Pj
là b tỷ lệ với tốc độ truy nhập của Pj tới đơn vị nhớ, mà tốc độ truy nhập đơn vị nhớ lại phụ thuộc
Trang 5
vào số lượng trung bình B các đơn vị bận nhớ. Xác suất truy nhập đơn vị nhớ (đọc hoặc ghi) Mj
của bất kỳ đơn vị Pj là 1/m. Xác suất đơn vị nhớ Mj bận là
n
m))/1(1(1 −−
. Khi Mj bận, thì yêu
caaif mà nó nhận được không thể phục vụ ngay, phải chờ cho đến khi Mj rỗi, như vậy, giá trị sẽ là:
∑
=
−−==
m
i
n
i
m
mpB
1
1
1 1
4
B,số lượng các đơn vị nhớ
m, Số lượng các mô đun nhớ
n= 4
n= 3
n= 2
3
nn = 1
2
nn = 1
1
nn = 1
0
nn = 1
1 2 3 4 5 6 7 8
m, sè lîng c¸c m« ®un nhí
Hình 1.2. Hiệu suất của bộ xử lý chia sẻ bộ nhớ
Nếu n → ∞, B → m và m cố định, tương tự n cố định và m→ ∞ thì B=n. Hình 1.2 là đồ thị giá
trị B phụ thuộc vào số lượng PE, số lượng M trong một bộ xử lý chia sẻ bộ nhớ.
Trang 6
3. Hiệu suất của bộ nhớ đa xử lý đối xứng được chia sẻ
3.1 Hiệu suất đo khối lượng công việc thương mại
Các phép đo thực hiện khối lượng công việc thương mại, đã được thực hiện hoặc một
Alphaserver 4100, hoặc bằng cách sử dụng một mô phỏng cấu hình theo mô hình sau khi
Alphaserver 4100. Alphaserver 4100 được sử dụng cho các phép đo có bốn bộ vi xử lý, mỗi trong
số đó là một Alpha 21164-ning chạy ở 300 MHz. Mỗi bộ xử lý có một hệ thống phân cấp bộ nhớ
cache cấp ba:
L1 bao gồm một cặp 8 KB cache ánh xạ trực tiếp trên chip, một hướng dẫn và một cho dữ liệu.
Các kích thước khối là 32-byte, và bộ nhớ cache dữ liệu là ghi thông qua L2, bằng cách sử dụng
một bộ đệm ghi
L2 là 96 KB onchip thống nhất 3-way tập Cache liên kết với một kích thước khối 32-byte,
bằng cách sử dụng ghi lại.
L3 là một off-chip, kết hợp, ánh xạ trực tiếp 2 MB cache với các khối 64-byte cũng có thể sử
dụng ghi lại.
Độ trễ cho một truy cập vào L2 là 7 chu kỳ, L3 nó là 21 chu kỳ, và bộ nhớ chính là 80 chu kỳ
đồng hồ (điển hình mà không có tranh chấp)
Trang 7
Hình 1.3 thời gian thực hiện phân tích cho ba chương trình (OLTP, DSS, và Altavista) trong khối lượng công
việc thương mại. Các số DSS là mức trung bình trên sáu truy vấn khác nhau. CPI rất khác nhau từ mức thấp 1,3
Al-tavista, đến 1,61 cho các truy vấn DSS, 7.0 cho Oracle
Hình 1.4 khi khối lượng công việc OLTP yêu cầu nhiều nhất từ bộ nhớ hệ thống với số lượng lớn đắt cấp cao
L3 bỏ lỡ, Kiểm tra tác động của kích thước bộ nhớ cache L3, số bộ xử lý, và kích thước khối trên chuẩn OLTP.
Hình này cho thấy tác dụng tăng kích thước bộ nhớ cache, sử dụng 2 cách thiết lập cache kết hợp, làm giảm số
lượng lớn bỏ lỡ cuộc xung đột. Thời gian thực hiện được chứng minh là bộ nhớ cache L3 lớn do giảm L3 nhớ.
Thời gian nhàn rỗi cũng tăng, thực hiện giảm một số lợi nhuận. Sự tăng trưởng này xảy ra bởi vì các quầy hàng
bày ít bộ nhớ hệ thống, quy trình máy chủ là cần thiết để trang trải các I / O độ trễ. Các hoạt động tương đối của
khối lượng công việc OLTP như kích thước của bộ nhớ cache L3, được thiết lập như là thiết lập liên kết 2 chiều,
được phát triển từ 1 MB đến 8MB.Thật thú vị, hiệu suất của 1 MB, bộ nhớ cache bộ kết hợp 2 chiều là rất tương tự
như MB bộ nhớ cache ánh xạ trực tiếp 2 được sử dụng trong Alphaserver 4100.
Trang 8
Hình 1.5 cho thấy dữ liệu này, hiển thị số chu kỳ truy cập bộ nhớ theo hướng dẫn đóng góp từ năm nguồn. Hai
nguồn lớn nhất của bộ nhớ truy cập trở ngại (do bỏ lỡ L3) với 1 MB L3 là hướng dẫn và năng lực / xung đột nhớ.
Với L3 lớn hơn hai nguồn thu nhỏ là đóng góp nhỏ. Như vậy, 4 và 8 MB, chia sẻ thật sự bỏ lỡ tạo ra các phần chi
phối của các bỏ lỡ
Việc tăng kích thước bộ nhớ cache loại bỏ hầu hết các bộ xử lý đơn bỏ lỡ, trong khi để lại nhiều
việc bỏ lỡ bị ảnh hưởng. Làm thế nào để tăng tính chuyên nghiệp-mức ảnh hưởng đến các loại
khác nhau của việc bỏ lỡ? Như chúng ta có thể mong đợi, sự gia tăng trong tỷ lệ thực sự bỏ lỡ
chia sẻ, mà không được bồi thường của bất kỳ giảm trong bộ xử lý đơn nhớ, dẫn đến tăng tổng thể
trong các chu kỳ truy cập bộ nhớ theo hướng dẫn.
3.2 Hiệu suất của đa chương trình và khối lượng công việc hệ điều hành
Kiểm tra việc thực hiện khối lượng công việc của bộ nhớ cache
Trang 9
Không có nhận xét nào:
Đăng nhận xét