Những sự thay đổi trong tích hợp
Với cấu trúc Nehalem , Intel đã thực sự tiến tới tăng khả năng tích hợp trong bộ vi xử lí .
Họ bắt đầu chuyển vào bên trong CPU tất cả những bộ phận chức năng cơ bản mà đã dùng trong những Chipset hệ thống trước kia như : mạch điều khiển bộ nhớ , điều khiển Bus PCIe , lõi đồ họa . CPU cũng có thêm Cache L3 . Nói một cách khác CPU không chỉ là trung tấm tính toán cục bộ mà còn chứa đựng những bộ phận phức tạp khác .
Tất nhiên việc tích hợp này có nhiều lợi ích và cho phép tăng hiệu suất làm việc do giảm thời gian chờ đợi trong khi truyền dữ liệu . Tuy nhiên việc có càn nhiều bộ phận khác nhau bên trong CPU sẽ khiến cho việc kết nối về điện ngày càng khó . Và hầu hết nhiệm vụ khó trong trường hợp này là nối giữa bộ nhớ Cache L3 dùng chung và lõi bộ vi xử lí , nhất là khi số lõi ngày càng nhiều . Như vậy khi nghĩ tới Sandy Bridge , Intel đã phải xem xét nghiêm túc khi kết nối giữa tất cả những bộ phận khác nhau trong CPU . Phương thức trước kia dùng kết nối bên trong qua CrossBar chung và đã làm việc tốt với những Chip Nehalem 2- , 4- và 6-lõi nhưng nó lại không phù hợp cho những CPU kiểu module với nhiều lõi kiểu khác nhau bên trong .
Trên thực tế bộ vi xử lí Nehalem EX có 8-lõi và Intel đã dùng công nghệ hoàn toàn mới để kết nối những lõi tính toán với bộ nhớ Cache L3 . Công nghệ này có tên gọi Ring Bus và đã được dùng trong vi cấu trúc Sandy Bridge mới .
Tất cả lõi tính toán , bộ nhớ Cache , lõi đồ họa , những thành phần North Bridge bên trong CPU mới được kết nối bằng Ring Bus đặc biệt hỗ trợ giao thức tương tự như QPI , mà cho phép giảm đáng kể số lượng kết nối bên trong bộ vi xử lí để truyền tín hiệu .
Intel chia Cache L3 trong Sandy Bridge thành những ngăn ( bank ) như nhau , mỗi ngăn là 2MB , để bảo đảm truyền thông giữa những bộ phận chức năng bộ vi xử lí với Cache L3 bằng Ring Bus . Thiết kế ban đầu dùng số lượng ngăn bằng số lõi bộ vi xử lí . Tuy nhiên khi ngắt kết nối một số Bank khỏi Bus sẽ làm ảnh hưởng tới tính toàn vẹn của dữ liệu và sẽ giảm dung lượng bộ nhớ Cache L3 . Như vậy Intel đã thiết kế không chia như trước , mỗi Bank được quản lí để làm việc cùng với nhau cùng một lúc và dữ liệu trong đó trong bao giờ trùng nhau .Như vậy nếu dùng những Bank không chia như trước kia trong Cache L3 sẽ cho phép tăng băng thông khi số lõi tăng lên . Ví dụ , Ring Bus rộng 32-bit , băng thông lớn nhất của Cache L3 trong CPU 4-lõi @ 3.4GHz đạt 435.2GB/s
Việc số lõi trong CPU tăng lên không chỉ thuận lợi cho Ring Bus mà cũng làm cho thời gian trễ của Cache L3 giảm đi , khi đó dữ liệu truyền trong “Ring” sẽ đi quãng đường ngắn hơn .
Hiện tại thời gian trễ Cache L3 trong Sandy Bridge là 26-31 chu kì xung nhịp , trong khi đó của Nehalem là 35-40 . Tuy nhiên có điều chúng ta nên nhớ là bộ nhớ Cache trong Sandy Bridge làm việc cùng với tấn số của bộ vi xử lí , và đó cũng là nguyên nhân khác khiến cho nó nhanh hơn .
Một điều thuận lợi khác của Ring Bus đó là việc nó làm việc với cả lõi đồ họa tích hợp bên trong , gộp cả vào đường truyền dữ liệu chung . Có nghĩa là lõi đồ họa trong Sandy Bridge không làm việc trực tiếp với bộ nhớ , nhưng như lõi x08 mà làm việc với bộ nhớ Cache L3 . Cách này nó làm việc nhanh hơn , hạn chế những nhược điểm ảnh hưởng tới hiệu suất khi mà lõi đồ họa cũng cần bus bộ nhớ trong khi nó lại đang phục vụ lõi x86 .
Lõi đồ họa có thêm những tính năng mới
Lõi đồ họa bên trong CPU không có gì là mới , những bộ vi xử lí Clarkdale đã có GPU Intel HD Graphics . Nhưng chỉ với Sandy Bridge lõi đồ họa và lõi x86 với làm việc thân thiện với nhau : chúng cùng chung khuôn bán dẫn và được kết nối với cùng Ring Bus , chia xẻ tài nguyên lõi x86 khác . Cấu trúc này thay đổi , lõi đồ họa rất gần với mạch điều khiển bộ nhớ và truy cập được tới bộ nhớ Cache L3 điều đó sẽ nâng cao hiệu suất hoạt động . Lõi đồ họa , cũng như lõi x86 , cũng được cải tiến theo nhiều cách nên cũng được cho là một thế hệ mới .
Tuy nhiên cấu trúc lõi đồ họa thực sự không có thự thay đổi đáng chú ý nào . Nó vẫn dựa trên 12 Shader nhưng Intel đã đẩy nhanh tốc độ lên gấp hai trong một số nhiệm vụ và đạt tốc độ cao hơn khi xử lí những phép toán song song . Trong số những sự thay đổi bao gồm đó đáng kể hơn cả là Shader Model 4.1 và hỗ trợ DirectX 10.1 .
Lõi đồ họa trong Sandy Bridge được sản xuất bằng công nghệ 32nm nên dễ dàng đẩy cao tốc độ lên tới 1.35GHz . Như thế kết quả là lõi đồ họa trong Sandy Bridge trong những ứng dụng thực tế có thể so sánh được với những Card màn hình rời giá rẻ . Điều đó sẽ khiến cho cả AMD và NVIDIA thúc đẩy việc cho ra mắt những Card màn hình giá rẻ hỗ trợ DirectX 11 để tận dụng được khả năng hỗ trợ DirectCompute dùng trong những trình duyệt Internet mới .
Bên cạnh những lõi đồ họa , Sandy Bridge còn có những bộ phận đặc biệt mới như mã hóa và giải mã video những định dạng thông dụng : MPEG2 , VC1 và AVC .
Tất nhiên việc giải mã video bằng phần cứng không phải chỉ bây giờ mới có mà lõi đồ họa trong Clarkdale đã làm việc này rất tốt . Nhưng những hoạt động của Shader sẽ có thêm những nhiệm vụ mới và những phần đặc biệt nhất là liên qua nền tảng ới những video 3D . Intel cho biết lõi đồ họa mới có thể giải mã bằng phần cứng nội dung 3D Blu-Ray hoặc MVC .
Một điều có thể quan tâm đó là việc Sandy Bridge có thêm Codec phần cứng có thể giải mã video thành định dạng AVC , có nghĩa là tất cả tài nguyên cần để chuyển mã video nhanh không cần tới sức mạnh của x86 truyền thống .
Một điều cần nhớ đó là những bộ vi xử lí Intel thông dụng ngày nay được sự hỗ trợ tích cực từ những nhà phát triển phần mềm nhất là những Bộ phận giải mã và mã hóa bằng phần cứng đã được dùng trong những hệ thống dựa trên Chipset Intel P67 , có nghĩa là trong những hệ thống dùng Card màn hình rời .
Có thể lấy ví dụ những tính năng hỗ trợ Media trong Sandy Bridge đã được các phần mềm thông dụng hỗ trợ như : ArcSoft MediaConverter, Corel DVD Factory, CyberLink MediaEspresso, Movavi Video Converter, Roxio Creator, …Nói một cách khác khi những bộ phận Multimedia trong lõi đồ họa của Sandy Bridge được dùng để chuyển mã video thì khi đó những lõi Shader hoàn toàn được giải phóng , do đó chúng có thể tham gia vào những công việc khác để tạo ra những hiệu ứng đặc biệt .
Những bộ vi xử lí khác nhau dựa trên cấu trúc Sandy Bridge sẽ có lõi đồ họa Intel HD 2000 hoặc Intel HD 3000 . Chúng khác nhau số lõi Shader . Model GPU cao cấp nhất trong giải pháp mobile và cao cấp nhất cho hệ thống để bàn có 12 lõi Shader đó là Intel HD 3000 còn Intel HD 2000 chỉ có 6 lõi Shader và làm việc với tần số thấp hơn . Tuy nhiên những bộ phận khác như Mã hóa và giải mã bằng phần cứng không có gì khác trong cả HD 2000 và HD 3000 .
System Agent – North Bridge mới
Trong Sandy Bridge có Bộ phận chức năng cần bàn tới có tên gọi System Agent , có chứa những mạch điều khiển giao diện ngoài như : PCI Express , DMI , bộ nhớ và giao diện hiển thị .
System Agent tương tự như những gì chúng ta đã biết ở Uncore trong Nehalem nhưng không phải hoàn toàn tương tự . Nó không chứa Cache L3 , là bộ phận chức năng duy nhất làm việc cùng với tần số của bộ vi xử lí trong vi cấu trúc mới . Và đặc điểm phân biệt khác của System Agent là nó cũng dùng Ring Bus để trao đổi dữ liệu với lõi x86 và lõi đồ họa cũng như với Cache L3 .
Khi nói tới sự sáng tạo trong System Agent , đầu tiên phải để cập tới sự cải tiến trong mạch điều khiển bộ nhớ . Mạch điều khiển bộ nhớ trong những bộ vi xử lí Westmere ( Clarkdale ) được kết hợp với lõi đồ họa và giải pháp này không chứng tỏ sự thành công . Vấn đề của Westmere được giải quyết trong Sandy Bridge : mạch điều khiển bộ nhớ mới làm việc nhanh như mạch điều khiển trong những bộ vi xử lí Lynnfield , hỗ trợ bộ nhớ 2-kênh DDR3-1067 hoặc DDR3-1333 . Nhưng với Sandy Bridge hỗ trợ thêm khả năng Overclock lên tới 1600 , 1866 và 2133 MHz .
Bạn có thể xem mạch điều khiển bộ nhớ nhanh như thế nào trong Sandy Bridge từ kết quả kiểm nghiệm của AIDA64
Thời gian trễ trong mạch điều khiển bộ nhớ CPU Sandy Bridge có thể so sánh với nền tảng LGA1156 Core i7 tương tự nhưng Sandy Bridge lại có băng thông lớn hơn .
Điều khiển Bus PCIe trong Sandy Bridge cũng tương tự như mạch điều khiển trong những bộ vi xử lí LGA1156 . Nó hỗ trợ 16 Lane PCIe 2.0 , hỗ trợ một bus PCIe x16 hoặc 2 bus PCIe x8 .
Sự thay đổi quan trọng trong giao diện hiển thị đó là lõi đồ họa của Sandy Bridge hỗ trợ HDMI 1.4 , đóng vai trò quan trọng hỗ trợ 3D .
Bộ phận điều khiển điện năng và tính năng Overclock
Bên cạnh những mạch điều khiển giao diện ngoài , phần quan trọng khác trong System Agent của Sandy Bridge đó là PCU ( Power Control Unit ) . Như bộ vi xử lí Nehalem , PCU là một siêu điều khiển có khả năng lập trình , thu thập thông tin về nhiệt độ , cường độ dòng điện hiện tại trong những phần khác nhau của bộ vi xử lí và có thể điều khiển điện áp và tần số tương tác .
PCU thực hiện những chức năng tiết kiệm điện năng và mode Turbo , được phát triển tinh vi hơn nữa trong vi cấu trúc Sandy Bridge .
Tất cả những bộ phận chức năng trong Sandy Bridge được chia thành 3 vùng , mỗi vùng dùng tốc độ và thuật toán điện năng riêng biệt . Vùng đầu tiên có chứa lõi x86 , Cache L3 và làm việc với cùng tần số và điện áp . Vùng thứ hai là lõi điều khiển làm việc với tần số riêng . Vùng thứ ba là System Agent .
Với cấu trúc như vậy cho phép Intel thực hiện những công nghệ Enhanced Intel SpeedStep và Turbo Boost cùng một lúc và những lõi x86 và lõi đồ họa độc lập . Chúng cũng đã được dùng cùng theo cách thức như vậy trong những bộ vi xử lí mobile Arrandale nhưng thực hiện theo cách đơn giản : làm việc qua Driver .
Sandy Bridge là giải pháp hoàn toàn bằng phần cứng và điều khiển tần số của lõi x86 và lõi đồ họa hoàn toàn riêng biệt dựa trên dòng điện tiêu thụ trong từng thành phần . Theo cách như vậy lõi x86 có thể Overclock hiệu quả hơn trong mode Turbo khi những lõi đồ họa trong trạng thái nghỉ và lõi đồ họa có thể Overclock mạnh khi lõi x86 không làm gì .
Hình dưới cho thấy khả năng hoạt động trong mode Turbo của Sandy Bridge cho thấy tần số làm việc của cả 4-lõi x86 và lõi GPU đều tăng . Ở Arrandale , trong mode Turbo cho thấy khả năng Overclock khi một lõi x86 nghỉ , khi GPU nghỉ và khi x86 nghỉ . Còn Sandy Bridge thì tất cả tần số của các lõi đều tăng .
PCU mới trong Sandy Bridge có thể điều khiển tần số theo nhiều cánh một cách linh hoạt . Nó thu thập nhiệt độ thực tế của CPU và không chỉ công suất tiêu thụ trên từng bộ phận . Điều đó có nghĩa là CPU làm việc dựa trên những điều kiện nhiệt độ và TDP không vượt qua TDP lớn nhất cho phép .
Bộ vi xử lí làm việc trong những công việc hàng ngày thông thường không đều . Hầu hết thời gian CPU đều ở trạng thái tiết kiệm điện năng và cần làm việc cực nhanh chỉ trong một khoảng thời gian ngắn . Bộ vi xử lí không bị quá nhiệt trong những chu kì ngắn và PCU trong Sandy Bridge điều khiển tần số để khi Overclock không bao giờ vượt qua ngưỡng cho phép . Khi nhiệt độ CPU đạt tới mức ngưỡng thì tần số làm việc sẽ giảm xuống để giữ mức an toàn .
Rõ ràng việc tự động như vậy sẽ có lợi cho hệ thống làm mát trong Sandy Bridge vì nó không bao giờ vượt quá mức cho phép .
Trên thực tế , lõi x86 trong Sandy Bridge được chạy Overclock theo từng mức tăng 100MHz , của GPU tăng theo mức 560MHz , của bộ nhớ tăng 266MHz .Intel cho biết theo lí thuyết tốc độ lõi x86 của Sandy Bridge có thể lên tới 5.7GHz .