Четвертая инкарнация

Автор: manager Суббота, Март 29th, 2008 Нет комментариев

Рубрика: Hardware

Увеличение тактовой частоты процессора на сотни мегагерц c каждой новой моделью уже стало явлением заурядным. Но мало кто задумывается о том, что рост частот не может происходить бесконечно: вступают в действие законы физики, ограничивающие, в частности, скорость движения электронов в проводниках. Тогда приходится что-то менять, причем менять серьезно и продуманно.

Изменения в архитектуре процессоров происходят гораздо реже, чем повышение тактовой частоты или даже выход нового чипа — как правило, одну архитектуру имеют несколько чипов, которые по этому признаку и разделяют на поколения.

Если говорить о процессорах компании Intel, то последний раз кардинальные изменения в архитектуру процессоров были внесены целых пять лет тому назад — это настоящая вечность для компьютерной индустрии. Тогда, в конце 1995 года был представлен первый процессор шестого поколения — Pentium Pro.
Чем дальше, тем труднее

В пределах одного технологического процесса наращивать тактовую частоту процессора можно лишь до определенного предела, за которым возникают проблемы, среди которых самые явные знакомы каждому, кто хоть когда-то пытался «разогнать» свой процессор: стабильность работы и перегрев.
Прежде всего за счет постоянно совершенствующейся технологии (начиналось все с 0,6 мкм технологического процесса) шестое поколение процессоров x86 нарастило тактовую частоту со 150 МГц до 1 ГГц и получило встроенную в кристалл кэш-память второго уровня, работающую на полной частоте ядра. Но сейчас мы можем говорить, что архитектура P6 в сочетании с 0,18 мкм процессом производства находятся если не на грани, то очень близко к пределу своих возможностей. В то же время, говорить о переходе к следующей ступеньке в 0,13 мкм рано — промышленных мощностей такого класса пока нет, и появятся они не ранее середины будущего года.
С другой стороны, при росте тактовой частоты реальная производительность процессора возрастает далеко не линейно, то есть не пропорционально росту частоты, и чем больше повышается частота, тем более нелинейно растет производительность. Чаще всего это вызвано тем, что процессор просто не успевает получать данные для обработки и команды для выполнения: не справляется ОЗУ и кэш-память, функционирование которой прочно завязано на архитектуре процессора.

«Разгонять» или обновлять?
При создании новой модели процессора всегда встает проблема выбора: либо продолжать «выжимать» из старого, проверенного временем ядра все возможное, дождаться доступности новой технологии производства и без значительных доработок повысить тактовые частоты чипов, либо создать новое ядро, которое способно работать на более высоких частотах при использовании той же технологии производства.
Из этих двух вариантов развития компания Intel выбрала оба. Представителями первого станут наследники Pentium III Coppermine, которые появятся в следующем году и будут изготавливаться по 0,13 мкм технологии, а воплощением новой микроархитектуры (NetBurst) стал Pentium 4 — первый представитель седьмого поколения х86 от Intel.
Архитектура эпохи Internet
NetBurst станет базой для будущих процессоров Intel семейства х86 на протяжении ближайших 4-5 лет, пока 32-разрядная архитектура не будет полностью вытеснена 64-разрядной. Сразу следует сказать, что новая архитектура не имеет ничего общего с сетями, а, как утверждает Intel, создана для технологий, популярность которых растет одновременно с Internet.
К слову, защитники анонимности в Internet должны быть довольны Pentium 4, так как он вовсе не поддерживает функции определения серийного номера процессора, из-за которой было много споров после выхода Pentium III.
Если отложить в сторону детали технической реализации, то можно сказать, что Pentium 4 приносит на платформу ПК значительно более высокие тактовые частоты и новый набор команд SSE2. Впрочем, Pentium 4 ярко иллюстрирует тот факт, что о производительности процессора нельзя однозначно судить по его тактовой частоте, даже если речь идет о процессорах с совместимым набором команд.
Cтруктура процессора претерпела далеко не косметические изменения по сравнению с Pentium III.
Системная шина теперь имеет результирующую частоту 400 МГц, которая достигается передачей четырех слов данных за один физический такт — аналогичное решение уже применяется в шине AGP и памяти DDR. Если следовать аналогии с DDR, то такую шину можно было бы назвать QDR (Quad Data Rate).
Если умножить разрядность шины (64 бита) на результирующую частоту (400 МГц), то получим скорость передачи данных 3,2 ГБ/с, что в точности соответствует скорости передачи данных двухканальной памяти RDRAM PC800. Безусловно, такое совпадение не является случайным — Pentium 4 создавался для работы с этим типом памяти и будет работать только с ним, по крайней мере до тех пор, пока не существует чипсета, альтернативного i850 (Tehama). Кроме того, на сегодняшний день DDR SDRAM все еще не обеспечивает пропускной способности двухканальной RDRAM.
Наиболее неоднозначные оценки приходится слышать по поводу новой реализации конвейера в Pentium 4, а точнее касательно количества его стадий. Если в семействе P5 конвейер имел длину 5 микроопераций, а в роду P6 содержал 10, то микроархитектура NetBurst предусматривает ни много ни мало — 20 стадий выполнения. Двукратное увеличение количества стадий в конвейере позволяет намного сократить время выполнения каждой стадии, а значит позволяет достичь более высоких тактовых частот. С другой стороны, эффективно использовать такой конвейер намного сложнее, чем более короткий.
Чтобы конвейер работал на максимуме возможностей, его необходимо постоянно «подпитывать» достаточным объемом команд, требующих выполнения, а значит нужна высокая скорость работы подсистемы памяти и более четкая работа системы предсказания переходов, которая позволяет процессору просчитать заранее, какие участки программы будут выполняться, а какие нет в зависимости от соответствующих логических условий в теле программы.

Если переход предсказан неверно, процессор с 20-ступенчатым конвейером выполнит намного больше лишней работы, чем аналогичный с более коротким конвейером, а значит общая эффективность и полезная производительность будут ниже.
Для сведения к минимуму негативных сторон длинного конвейера разработчики сделали немало. Так, объем буфера, используемого для предсказания переходов, увеличен в 8 раз по сравнению с Pentium III, а сам алгоритм предсказания позволяет исключить треть неправильных переходов по сравнению с Coppermine.
Кроме того, полностью изменена концепция построения кэш-памяти команд L1, которая теперь носит название Execution Trace Cache. В отличие от предыдущих реализаций, кэш-память первого уровня хранит не код программы, а команды, уже декодированные в микрооперации (всего 12 тысяч микроопераций) и расположенные в порядке, определенном при предсказании переходов.
Среди других нововведений Pentium 4 нельзя не обратить внимания на блок целочисленной арифметики, два модуля которого работают на удвоенной частоте процессора, обеспечивая выполнение арифметических и логических операций за половину такта — Rapid Execution Engine.
Блок «классической» обработки чисел с плавающей запятой остался практически без изменений по сравнению с ядром Coppermine, однако дальнейшее развитие получили SIMD-команды, комплекс которых теперь имеет название SSE2.
Являясь логическим продолжением технологий MMX и SSE, SSE2 представляет собой функционально полный набор команд, позволяющий полностью отказаться от старых инструкций математического сопроцессора. При этом программист может весьма гибко использовать очень широкий диапазон типов данных, как целочисленных, так и с плавающей запятой (см. рисунок слева). Благодаря SSE2 в архитектуре x86 впервые появляется возможность оперировать с числами двойной точности — от этого безусловно выигрывают алгоритмы моделирования и научные задачи.
Хотя специальной поддержки операционной системы для использования команд SSE2 не требуется, сами программы придется перекомпилировать.
Братья, но не соперники
Предварительные результаты тестов позволяют сделать вывод, что Pentium 4, выпущенный с тактовыми частотами 1,4 и 1,5 ГГц, в существующих приложениях едва уловимо опережает своего предшественника, работающего на частоте 1 ГГц, таким образом, если бы была возможность сравнить Pentium III и Pentium 4 на одной тактовой частоте, то преимущество было бы не на стороне последнего.
В то же время, такое сравнение фактически является бессмысленным, так как Pentium III и Pentium 4 с одинаковыми тактовыми частотами одновременно выпускаться не будут. Во второй половине 2001 года, когда 0,13 мкм обновленный Pentium III достигнет частоты 1,26 ГГц, Pentium 4 будет доступен уже с частотами порядка 2 ГГц.
Поддержка ПО — залог успеха
Значительный выигрыш в производительности Pentium 4 по сравнению с предшественником способны обеспечить команды SSE2. Несомненно, текстовый редактор вряд ли выиграет от использования этих команд, однако Pentium 4 и ориентирован преимущественно на ресурсоемкие задачи, среди которых первые места занимают игры, видео, анимация в реальном времени.
Однако для того, чтобы SSE2-оптимизации появились во многих будущих приложениях, разработчики, естественно, должны быть в этом заинтересованы. А такую заинтересованность способны обеспечить либо мощная поддержка со стороны Intel, либо широкое распространение процессоров с командами SSE2 среди пользователей.

Если с поддержкой разработчиков все более или менее понятно — тут наверняка будет сделано все возможное, то о быстром распространении Pentium 4 в течение ближайших месяцев вряд ли придется говорить.
Основных причин этого видится две. Во-первых, требуется время для создания сопутствующей инфраструктуры — корпусов, соответствующих спецификации ATX 2.03 для обеспечения достаточного питания процессора, и абсолютно новых материнских плат на чипсете i850. Кстати, частой смены материнских плат и с Pentium 4, судя по всему, не избежать: дебютирует новый процессор в исполнении PGA-432, с 423 контактами вместо 370 в Pentium III, а со временем обновленные модели будут упаковываться уже в PGA-478, в то время как серверный вариант Pentium 4 (кодовое имя Foster) будет иметь целых 603 контакта.
Наращивание количества контактов служит преимущественно все той же цели стабильности на более высоких тактовых частотах, что требует большего количества контактов питания и заземления.
Однако более серьезное влияние на то, как скоро ПК с Pentium 4 можно будет увидеть на столах украинских пользователей, скорее всего, окажет существующая на сегодняшний день зависимость Pentium 4 от памяти RDRAM. Чтобы компенсировать дороговизну RDRAM, Intel создала специальную программу дотирования производителей, собирающих ПК на основе Pentium 4 и чипсета i850.
Однако эта программа касается только крупных мировых производителей, то есть практически не повлияет на доступность Pentium 4 для отечественного пользователя. Единственное, на что остается рассчитывать сейчас, так это на агрессивную ценовую политику Intel на сами процессоры, так как чипсеты для Pentium 4 с поддержкой SDRAM от Intel и VIA, скорее всего, появятся не раньше середины следующего года.
Само будущее «памяти будущего», придуманной компанией Rambus, сейчас выглядит весьма туманно, от нее открестилась даже Intel в лице самого президента Крейга Баррета. Хотя, если отбросить эмоции, RDRAM является обычной технологией, со своими достоинствами и недостатками, и основной ее недостаток — высокая цена по сравнению с DDR SDRAM при сравнимом уровне производительности. К сожалению, нивелировать этот недостаток Rambus пытается совсем не технологичными и не рыночными способами, а путем заключения закулисных соглашений и судебных разбирательств.
Самое интересное — впереди
Уже сейчас ясно, что в том виде, в каком он выпущен сейчас, Pentium 4 не станет массовым процессором, а скорее найдет место в ПК тех, кто хочет быть на гребне High-Tech-волны. Поэтому, говоря сегодня о Pentium 4, имеет смысл акцентировать внимание прежде всего на технологиях и решениях, которые он несет в себе как представитель последнего поколения 32-разрядных процессоров семейства х86. У основного конкурента Intel в области процессоров — AMD — пока нет ответа на NetBurst и Pentium 4, но если он появится, все станет еще более интересно.
Евгений Литвинов

Преодолевая границы
Патрик Гелсингер, вице-президент Intel
и технический директор Intel Architecture Group

Если посмотреть на историю создания наших процессоров, то каждое новое их поколение требовало от разработчиков каких-то радикальных, абсолютно новых решений, новых подходов.
Для иллюстрации этого я мог бы привести такую аналогию. Представьте себе огромное полотно, на котором вы изображаете все те новые идеи, которые у вас возникли. Как только вам кажется, что все уже вырисовывается, все создает какую-то единую гармоничную структуру или картину, как появляются новые идеи, которые уже не вписываются в рамки этого полотна, и вам уже требуется больше пространства, чтобы добавить эти новые идеи.
И каждый раз, когда вам кажется, что уже все, все идеи истощились, появляется что-то новое, что не вписывается в предыдущую схему, предыдущую картину, требующее большего простора, большего полета фантазии, но взять и просто добавить это к уже существующей структуре невозможно в силу ограниченности пространства. И так происходило с каждым новым поколением процессоров.

Если же посмотреть немного в будущее, то мы абсолютно уверены в том, что в ближайшие 10 лет еще можно будет заниматься разработками и совершенствованиями кремниевых чипов. А это значит, что еще как минимум 15 лет наш основной бизнес будет продолжаться. В то же время уже сегодня Intel проводит исследования в области биотранзисторов.

Источник: CHIP, http://www.chip.com.ua

Оставить комментарий

Чтобы оставлять комментарии Вы должны быть авторизованы.

Похожие посты