Athlon XP 2800+: 333МГц FSB и nForce 2

Автор: manager Вторник, Апрель 1st, 2008 Нет комментариев

Рубрика: Hardware

Введение

Новая модификация, как и Athlon 2600+, имеет увеличенную габаритную высоту. С принудительной вентиляцией обычный Athlon XP 2400+ или 2600+ разгоняется до 2,3 – 2,4 ГГц. AMD использовала это пространство, чтобы представить сегодня Athlon XP 2400+ (2.25 ГГц) и 2700+ (2.16 ГГц).

К сожалению, это не означает, что вы сможете купить самый быстрый процессор AMD уже через пару недель. В ноябре, 2700+ будет доступен только для OEM и в декабре новейший AMD процессор дойдет до обывателя. Athlon XP 2800+ будет доступен в малом количестве в конце 2002, и в тоже время AMD планирует широкое распространение в начале 2003. Это, конечно, смягчает ситуацию…

Последнее время Athlon XP 2600+ сравнивают c Pentium 4 2,53 ГГц. Несомненно, что Athlon XP 2600+ достиг рейтинга “2600”, но были сомнения относительно рейтинга “+”. Теперь, самый быстрый Athlon будет сравнен с более продвинутым процессором Intel, а именно Pentium 4 2,8 ГГц.

AMD, понимает что простое увеличение скорости не сделает Athlon XP 2800+ конкурентоспособным. Часть новых процессоров Athlon 2800+ и 2700+ работают с шиной процессора 166 МГц DDR (333 МГц). И AMD указывает, что новый чипсет Force 2 сделает производительность Athlon еще выше.

Глубже взглянем на баталию между Pentium 4 и Athlon. И для начала исследуем, как сравнивают платформы Athlon и Pentium 4.

Состязание процессоров

Хотя тема «Intel Prescott против AMD Hammer» и обсуждается, но Athlon и Pentium 4 еще минимум год будут основными актерами в нынешней войне процессоров AMD и Intel. Скорости шины процессора и памяти, а также оптимизация SSE-2 существенно влияют на эту баталию.

Этот обзор не будет полон без некоторого анализа этих важных факторов. И мы нашли прекрасный инструмент для такого анализа: ScienceMark 2.0. «Лучшие вещи в жизни бесплатны», и ScienceMark 2.0 лучший тому пример. MemBench позволяет определить время ожидания и пропускную способность для каждой платформы.

Athlon XP 2800+ тестировали, во-первых, на “нормальной” KT333 платформе с множителем 17, шиной процессора 133 МГц DDR (266 МГц), памятью 166 МГц DDR (333 МГц), CAS – 2, “RAS to CAS” – 3, “Precharge” – 3. Вторая KT333 платформа была ASUS A7V333 с шиной процессора 166МГц (333МГц) и множителем – 13,5.

С чего начать? В этой таблице находится большой объем информации. Давайте начнем со сравнения 266 МГц и 333 МГц шин процессора.

Было много сообщений о том, что Athlon не сильно выиграл от увеличения скорости шины с 266МГц до 333МГц. MemBench дает точное объяснение этому факту. Во-первых, сравним время задержки KT333 при 64-байтной шаге. Все установки BIOS были одинаковыми, кроме скорости шины и связанного с ней множителя. Можно ожидать, что при всех остальных равных условиях, Athlon с шиной 166 МГц уменьшит задержку на 25%, но процессор на практике только увеличивает её! Это показывает, что в ASUS KT333 для увеличения стабильности увеличено время ожидания памяти. При этом пропускная способность увеличена меньше ожидаемого, только на 14%.

Что происходит с “реальной” производительностью? Многие программы или не получат или получат очень малый прирост производительности. Задержка, а не пропускная способность, наиболее важна для этого. Давайте разберемся более детально.

Выбор с упреждением … AMD еще работает?

Для лучшего понимания того, что происходит, вы должны понимать разницу между задержкой при 64-байтном и 128-байтном шагах. Когда идет выборка данных и инструкций 64-байтными шагами или точнее кэшируется строка памяти, выборка информации высокоорганизованна. В лучшем случае это нужно хорошо написанному оптимальному коду, работающему с памятью (движок Quake 3, Kribi и др.). Это очень легко позволит «выборщику» выдать и получить информацию до того как она понадобится. На самом деле такая выборка эффективна только для простых структур. Например, в массивах, можно параллельно ссылаться на разные элементы.

Однако значение задержки при 128-байтном или большем шаге показывает работу процессора при остановке «выборщика». Иногда программист использует структуры данных связанные с другими структурами. И вы можете получить цепочку связанных данных («Указатель на указатель объекта»), что (почти) не позволит при выборке угадать следующий кусок данных.

Давайте, сравним Athlon и Pentium 4. Pentium 4 3,06 ГГц скоро уже будет доступен, и вероятно в больших количествах, чем Athlon 2700+. Intel уже представил процессор на 4,7 ГГц с экзотическим охлаждением. Почему я об этом говорю? Потому что может показаться, из-за безумия с «ГГц», что архитектура «демонов скорости» идеальна, позволяя достигать максимальных частот в ущерб количеству операций за такт (IPC). И она предпочтительней более «Разумных» решений с большим IPC. Если Pentium 4 и выиграет битву процессоров, то конечно не только из-за больших скоростей.

Кроме ошибок при прогнозе переходов, «демоны скорости» имеют проблемы с ожиданием памяти. Чтобы понять это, давайте забудем о «выборщиках» и допустим, что Athlon и Pentium 4 работают на одной платформе и материнской плате, как это было с процессорами Intel и AMD в 1997. Далее предположим, что Athlon 2800+ выполняет программы из кэш также быстро, как и 2,8 ГГц Pentium 4. Тогда Athlon имеет преимущество, так как 2,25 ГГц ядро работает только в 6,75 раз быстрее памяти (333 МГц). Ядро Pentium 4 работает в 8,4 раза быстрее, чем память и поэтому время ожидания процессора должно быть теоретически на 25% больше. В связи с этим, Athlon должен иметь меньшее время ожидания памяти.

Но что мы видим на самом деле?

Таблица 2.

Реальность противоречит нашей теории. Задержка при 128-байтном шаге показывает, что лучшая поддержка чипсета и более быстрая шина (533 МГц) Pentium 4 компенсирует преимущество Athlon в разнице скоростей между процессором и памятью. И у «интеллектуального» Athlon нет преимущества во времени ожидания.

При 64-байтном шаге и того хуже. Измерения показывают, что «выборщик» Pentium 4 гораздо лучше, чем у Athlon XP. Вспомним что для одинакового уменьшения задержки, «выборщик» Pentium 4 должен быть или «умнее», то есть лучше опознавать области необходимой памяти, или он должен быть быстрее, чем у Athlon. Значения задержки Pentium 4 отличаются от Athlon. Они в два раза лучше!

AMD нужно еще работать над «выборщиком», если она хочет сравняться с Intel, которая тоже хочет уменьшить задержки в том коде, где «выборщик» не работает. Теоретическая оценка Intel дает скачок производительности в небольшом коде от 7 до 45%! Из-за заурядного «выборщика» в Athlon XP можно думать, что у Hammer он будет усовершенствован. Но вернемся к Athlon XP 2800+…

Другими словами, Athlon не имеет преимуществ на более скоростных шинах процессора, потому что:

Чипсеты (типа KT333) работают с более консервативными параметрами (166 ГГц).

«Выборщик» Athlon имеет заурядную производительность.

Nvidia nForce2 против VIA KT333/KT400

Приятным сюрпризом было то, что плата ASUS A7V333 (KT333) может быть легко обновлена с Athlon XP 2800+. Просто обновив BIOS до версии 1.013, подтвердилась хорошая разработка платы ASUS и поддержка BIOS.

Плата была неизменна во всех тестах. Но как вы увидите ниже, производительность практически не улучшилась.

Да, комплект обзоров, присланный AMD, пришел с прототипом платы ASUS nForce 2. Отметим слово «прототип». Иногда приятно быть обозревателем «железа» из-за доступа к новейшему оборудованию. Но бывает, что сидишь перед экраном с красными глазами и головной болью кучу времени, потому что некоторые прототипы оборудования ведут себя «нестабильно» и нелогично. Прототип платы был довольно упрям и ненадежен при нагрузках на «железо» во многих играх, особенно при использовании звука. Поэтому вы не найдете контрольных тестов звука на платформе nForce 2.

И Nvidia и ASUS уверяли много раз, что настоящая серийная модель, которая будет доступна публике в конце октября, будет работать идеально и стабильно на все 100%. Nvidia сообщила, что AMD послала нам «ранний прототип» платы, «которые возможно трудно» заставить надежно работать. Так почему же AMD послал эту плату, не смотря на ее незавершенность? Взглянув на результаты ScienceMark 2.0, понимаешь, что контроллер памяти nForce 2 просто быстрее работает.

Таблица 3.

У чипсета nForce 2 пропускная способность на 10% лучше и что важнее время ожидания ниже на 16%, выделяя его при сравнении с KT333 166 ГГц. Хотя KT333 на 166 ГГц не много быстрее чем на 133 ГГц, далее вы увидите, что nForce2 в сочетании с более быстрой шиной процессора обладает превосходной производительностью.

Плате MSI KT400 для работы с Athlon XP 2800+ требуется обновлении BIOS. Так как это обновление BIOS еще не доступно то и сравнение KT400 и nForce 2 пока невозможно. По некоторым сведениям KT400 лишь немного уменьшает время ожидания.

Так или иначе, отложим пока обзор nForce 2на потом, так как невозможно выносить суждения по нестабильному прототипу. Ведь возможно, что задержки в BIOS могут оказаться менее агрессивными для достижения промышленного качества стабильности. Но если промышленный образец платы будет обладать текущей производительностью и будет более стабилен, то NVIDIA nForce 2 имеет большое будущее.

Чипсет nForce 2 очень похож на nForce. Ниже показаны новшества в чипсете NVIDIA:

Dual Channel DDR333 вместо Dual Channel DDR266

USB 2.0 (6 портов)

IEEE-1394a (3 порта)

UltraATA 133

Интегрированный TV декодер (IGP)

Интегрированный Geforce 4 MX вместо Geforce 2 MX

AGP 8x

Материнские платы на основе nForce 2 будут выпускать ABIT, ASUS, Chaintech EPOX, MSI и Leadtek.

Тестируемые конфигурации

Все системы тестировались с драйверами NVIDIA Detonator 30.82. Экран имел разрешение 1024х768х32 с частотой 85 Гц. Вертикальная синхронизация была выключена.

Использовались Corsair XMS 3200 CAS 2 DDR (DDR400) для максимально возможного разгона и стабильности. Модули XMS3200 работали на 166 МГц DDR (333 МГц) и настроены для работы во всех системах с CAS задержкой – 2.

Системы

Athlon XP 2000+, Athlon XP 2200+, Athlon XP 2600+, Athlon XP 2800+

ASUS A7V333 версия BIOS 1.013

ASUS прототип nForce 2 версия BIOS 1.08 (только с Athlon XP 2800+)

Pentium 4 (Northwood) 2 ГГц (400 МГц FSB), 2.4 ГГц (400 МГц FSB), 2.4 ГГц (533 МГц FSB), 2.53 ГГц (533 МГц FSB) и 2.8 ГГц

MSI 845G-MAX (чипсет i845G) версия BIOS 1.4

ASUS P4T 533 версия BIOS 1.004 с 512 Мб RIMM4200 на 1066 МГц (только с Pentium 4 2.8 ГГц)

Общие компоненты

512 Мб Corsair PC3200 XMS (DDR-SDRAM) работающий на 333 МГц CAS 2 (2-3-3-6)

Seagate Barracuda ATA III ST320414A Модель ST320414A (7200 об/м, ATA-100)

ASUS Geforce Ti4400 128 Мб

AT 2700 10/100 Мбит NIC

Sound Blaster Live!

Программное обеспечение

Via 4 in 1 Drivers 4.42

Intel chipset inf update 4.09.1011

Windows XP

DirectX 8.1

Благодарности людям за их поддержку и важный вклад в этот обзор:

Лучано Алибранди и Брайен Дэль Ризайо (Nvidia) за отличную поддержку

Джерджен Эимбертс и Крайстоф Семхк (Intel) за помощь в тестировании Pentium 4 2,0A ГГц, 2,4, 2,53 и 2,8 ГГц.

Огастин Чен, Кэрол Чанг (ASUS) и Шарон Тан (BAS computers Netherlands) за ASUS A7V333 и ASUS P4T533

Анджелик Берден и Саския Верхаппен (MSI) предоставившие MSI 845 GMax

Дамон Мазнай (AMD) предоставивший для тестов Athlon XP 2600+ и Athlon XP 2200+ Thoroughbred.

Роберт Перс (Corsair) предоставивший Corsair PC3200 CAS2 XMS

Игровые тесты

Перед разбором тестов поясним некоторые вещи:

«KT333 (266)» означает, что шина процессора VIA KT333 работает на 266МГц, а DDR память на 333МГц

Все системы Pentium 4 кроме «i850E» базируются на «i845G» плате с DDR памятью работающей на 333 МГц. Контрольные тесты платформы nForce 2 во многих случаях были невозможны, особенно требующие звук.

Первый тест — Comanche 4, симулятор боевого вертолета.

Comanche 4 (800x600x32, звук включен)

Comanche содержит SSE-2 оптимизацию, но хорошие показатели Pentium 4 достигаются малыми задержками «выбранной» памяти. Платформа nForce 2 будет работать только с отключенным звуком.

Результаты теста подтверждают, что SSE-2 не единственная причина низкой производительности Athlon по сравнению с Pentium 4. Уменьшение времени задержки nForce 2 на 16% делают эту платформу на 5% быстрее KT333. В результате производительность Athlon XP 2800+ лучше P4 2,6 ГГц с DDR памятью. Но Athlon не имеет шансов перед P4 с Rambus 1066 МГц, который лидирует в этом тесте.

Обычно для тестирования используется также NASCAR 2002. Однако было обнаружено, что один из пяти тестов для платформы Pentium 4 выдает очень низкие результаты и эта проблема еще исследуется, чтобы сделать тест более воспроизводимым. Работа идет …

Но не беспокойтесь, Pentium 4 без сомнений лучший процессор для NASCAR 2002, оптимизированной для SSE-2.

Другие игровые тесты

В противоположность гонкам NASCAR результаты C&C Renegade более воспроизводим. Как наиболее популярная «стрелялка» C&C может быть достойным тестовым инструментом, даже притом, что нагрузка в нем больше на видеокарту, чем на процессор (сравнивая с Comanche).

На этот раз даже RIMM4200 не спасла Pentium 4, и Athlon лидирует. Похоже, что Athlon заставляет Geforce 4 Ti4400 работать на пределе, даже Athlon XP 2800+ не может преодолеть значение в 120 кадр/с. К сожалению, не удалось протестировать платформу nForce 2, так как она зависала.

Pentium 4 уже хорошо зарекомендовал себя с Quake 3. Многие отмечали, что это произошло благодаря отличному «выборщику» и хорошо написанному коду, что было в последствии подтверждено. Пропускная способность не является главной причиной хорошей производительности Pentium 4 на движке Quake 3. Действительная причина выяснится в следующем тесте (с отключенным звуком), включающем платформу nForce 2.

Движок Quake 3 основан на упорядоченном доступе к памяти. Последовательности данных и кода находятся в смежных адресах. Чтобы понять, почему задержка при «выборе» в 64-байтном шаге кажется очень важным фактором для движка Quake 3, сравним тест Jedi Knight со значениями MemBench. Давайте снова взглянем на них.

Таблица 4.

Хотя KT333 166 МГц предоставляет большую пропускную способность, производительность KT333 133 МГц чуть лучше или точнее такая же в пределах ошибки. Чуть большая частота (2266 МГц против 2251 МГц) и несколько меньшая задержка делает 133 МГц шину препятствием теоретическим рассуждениям. Это показывает что пропускная способность не главное для движка Quake 3.

В то же время nForce 2 просто вне конкуренции с KT333 с увеличенной производительности на 15,4%. Это разность в производительности идентична измеренной в MemBench разности времен задержки. Поэтому можно считать, что 10% преимущество в пропускной способности по сравнению со временем задержки дает меньший вклад в производительность.

Это подтверждает то, что P4 с 1066 МГц RDRAM лишь на 7% быстрее. Пропускная способность PC1066 имеет 20% преимущество перед DDR333, но по времени ожидания только на 6,8% лучше.

1066 МГц RDRAM также демонстрирует хорошую организацию памяти движка Quake 3. Если бы память была хаотична, то производительность RDRAM была бы ниже DDR333.

Тесты с RPG

RPG игры довольно популярны и потому здесь приводится тест на Dungeon Siege от Криса Тейлора.

Кажется, жанр RPG предпочитает Athlon XP. Пока ошибка измерения в этом тесте очень высока (+/- 1,5 кадр/с) Athlon XP 2800+ работает лучше.

Стратегии

Далее попробуем RTS игру. Warrior Kings возможно одна из самых продвинутых RTS на сегодня, так как имеет 3D ландшафт и уровень деталей (LOD), масштабируемый относительно размера объекта на экране.

Pentium 4 2,8 ГГц с 1066 МГц RDRAM уверено лидирует во многих тестах. Основываясь на предыдущем опыте с nForce 2, можно утверждать что Athlon XP на этой платформе должен показывать близкие результаты.

3DSMax

Тест был на архитектурной сцене SPECapc 3DS MAX R4.2. В тесте движущаяся камера показывает сложное здание, виртуальный тур масштабируемой модели. Это сложная сцена содержит не меньше 600.000 многоугольников и 7 источников света. Включен показ лучей и туман. От 20 до 22 кадров 500х300 представлены в буфере памяти.

И снова nForce 2. Так как тест 3DSMax не делает большой нагрузки на память, nForce 2 выигрывает испытания с 7% преимуществом! Это делает Athlon XP 2800+ лучшим для 3DSMax.

AutoCAD

Для тестирования AutoCAD был использован AUGI Gauge тест от AutoDesk Users Group International. С AUGI Gauge сайта:

AUGI Gauge – это тестовый инструмент производительности, необходимый разработчикам скриптов, тестирующих разные операции и рисунки. Инструмент содержит интерфейс Visual Basic и тестовый движок AutoLISP. AUGI Gauge записывал хронологию хода теста в текстовый файл, импортируемый в таблицу для манипуляций с данными. AUGI Gauge разработан для работы с AutoCAD Release 12 (DOS), Release 13 (Windows) и Release 14. Текущая версия работает с AutoCAD Release 14 и AutoCAD 2000.

Сам тест состоял из двух разделов и использовал реалистичный тест с 30 операциями, изменения файлов, редактирования и воспроизведения, на каждую серию из 15 картинок по 2 Мб.

К сожалению, тест AutoCAD 2002 занимает много времени, и не было возможности его завершить. Но первые шаги показывают небольшое преимущество Athlon в производительности 2D задач.

Рисующая программа

Для чего необходима мощность процессора? Вы сэкономите на OpenGL плате, используя Kribi. Этот продукт от Adept Development, очень мощная программа с 3D-рисующим движком. Изначально разработанная Эриком Броном, она предназначена для управления 10 млрд. многоугольников и их фото реалистичного отображения в реальном времени. Движок Kribi — 100% программный рисовальщик (чистый тест процессора), работающий с SSE. Это своеобразный SSE и FPU тест.

Движок предназначен для разработчиков полнофункционального 3D приложения. Тест был на KribiBench версии 1.1.

Производительность SSE за высокочастотными Pentium 4. Выигрывает процессор с наибольшей частотой, не озадаченный ошибками предугадывания переходов или зависимостей.

Профессиональные тесты: Научные расчеты

ScienceMark 2.0 (16/08/2002) конечно больше чем MemBench. Хорошо оптимизированный тест и для Athlon, и для Pentium 4, определяющий производительность процессоров при научных расчетах.

Методами молекулярной термодинамики моделируется поведение вещества вычислением сил действующих на его молекулы. В этой модели вычисляется динамика 216 атомов аргона при 140 К. Дополнительная информация на web.physics.uiuc.edu

Следующий тест – Primordia с sciencemark.org:

Этот код вычисляет квантовомеханические орбитали Хартри-Фока для каждого электрона элементов периодической таблицы. Проблема расчета орбиталей здесь подробно рассматривается. Выполняется вложенный цикл. При каждом шаге в цикле Хартри происходит обмен, и коррелируются потенциалы. Пользователь может выбрать алгоритм, вычисляющий потенциалы.

nForce 2 снова играет мускулами и опережает KT333 на целых 9%. На самом деле интересно, смогут ли промышленные платы nForce2 показать такую же хорошую производительность.

Заключение

Вопреки общему мнению, Athlon вполне может извлечь пользу из 166 МГц шины. nForce2 показал, что точно настроенный чипсет может увеличить производительность Athlon XP на 15%. Что вполне достаточно для конкурентоспособности Athlon 2800+ с 2.8 ГГц Pentium 4.

Однако это всего лишь предварительный обзор nForce 2. Контроллер памяти силен, но остается открытым вопросом, сможет ли быть настроена промышленная плата так же, как и нестабильный прототип. Кажется, об этом говорить еще рано. Хотелось бы провести тесты на полностью стабильной платформе nForce 2 с процессором Athlon XP, который будет доступен читателю позже.

Тем не менее, этот обзор показывает, что платформа Athlon может конкурировать с Pentium 4. AMD маленьким кэш L2 и заурядным выборщиком сильно снижает производительность. AMD может устранить эти изъяны с будущими версиями Athlon или/и Hammer.

Источник: «Железная Столица», http://tech.stolica.ru/

Оставить комментарий

Чтобы оставлять комментарии Вы должны быть авторизованы.

Похожие посты