Двухъядерный процессор intel pentium 2 4 ггц

Алексей Шобанов

Продолжая череду весенних премьер, компания Intel представила очередную модель в линейке процессоров для высокопроизводительных систем для дома и офиса - процессор Intel Pentium 4 с тактовой частотой 2,4 ГГц. Переход на 0,13-микронный технологический процесс значительно расширил «частотные горизонты», открывающиеся перед флагманом процессорного рынка от компании Intel, и теперь нам кажутся вполне обыденными ежеквартальные презентации новых, все более быстрых процессоров. Как и его предшественники - Pentium 4 2 ГГц и 2,2 ГГц, также построенные на основе ядра Northwood по 0,13-микронной технологии, новый процессор имеет кэш второго уровня размером 512 Кбайт, что вдвое превышает размер L2-кэша у младших моделей этой линейки, созданных на основе ядра Willamette (0,18-микронный техпроцесс). Pentium 4 2,4 ГГц выполнен в формфакторе mPGA-478 с использованием корпуса FC-PGA2 (Flip-Chip Pin Grid Array), который на сегодняшний день имеет наиболее совершенную схему теплового рассеивания. Говоря о тепловом режиме процессора Pentium 4 на новом ядре Northwood, нельзя не отметить тот факт, что переход на новую 0,13-микронную технологию позволил не только увеличить количество транзисторов до 55 млн. на кристалле, при этом уменьшив его размеры, но и снизить напряжение питания ядра до 1,5 В, тем самым сократив тепловыделение. Так, у первых процессоров на этом ядре, которые работают на тактовой частоте 2 ГГц и 2,2 ГГц, оно составляет соответственно 52 Вт и 55 Вт, а у нового Intel Pentium 4 2,4 ГГц не превышает 58 Вт. Для температурного контроля в процессоре используется так называемая технология «Thermal Monitor», суть которой сводится к использованию термодатчика и блока TCC (thermal control circuit), управляющего подачей тактовых импульсов на процессор. При этом предусмотрены два режима функционирования: автоматический (Automatic mode) и по требованию (On-Demand mode). Автоматический режим может быть активизирован через BIOS системной платы. В этом режиме при повышении температуры процессора до определенного значения блок TCC активизируется и генерирует импульсы, блокирующие подачу тактовых импульсов, что фактически вызывает понижение тактовой частоты процессора на 30-50% (в соответствии с заводскими установками), увеличивая время его простоя, что, в свою очередь, позволяет снизить температуру. Работа блока TCC в режиме «по требованию» определяется содержимым регистра температурного контроля (ACPI Thermal Monitor Control Register). В соответствии с его состоянием блок TCC может быть активизирован независимо от температуры процессора, при этом длительность холостого хода процессора можно варьировать более гибко в диапазоне между 12,5% и 87,5%. И, конечно же, реализована возможность отключения компьютера при катастрофическом нагреве кристалла процессора до 135 °С; в этом случае на системную шину выдается сигнал THERMTRIP#, инициирующий отключение питания. Как и все его предшественники, новый процессор построен в соответствии с микроархитектурой Intel NetBurst, которая подразумевает следующие нововведения:

  • 400-мегагерцевая системная шина;
  • Hyper-Pipelined Technology;
  • Advanced Dynamic Execution;
  • Execution Trace Cache;
  • Rapid Execution Engine;
  • Advanced Transfer Cache;
  • Streaming SIMD Extensions 2 (SSE2).

В нескольких словах опишем эти особенности архитектуры процессоров Intel Pentium 4. 400-мегагерцевая шина (как ее еще называют - Quad Pumped Bus) позволяет за счет особой организации на физическом уровне передавать 4 пакета данных за один такт по системной шине с частотой FSB 100 МГц. Таким образом, эта 64-битная шина имеет пиковую пропускную способность 3,2 Гбайт/с, обеспечивая высокоскоростной обмен данными процессора с другими устройствами. В скором времени ожидается реализация 533-мегагерцевой Quad Pumped-шины, что соответствует работе системной шине на физической частоте FSB 133 МГц, при этом, как несложно предположить, скорость обмена данными по ней превысит казавшуюся прежде недостижимой величину 4 Гбайт/с. Hyper-Pipelined Technology подразумевает использование беспрецедентно длинного 20-ступенчатого гиперконвейера (напомним, что процессоры семейства Р6 имели вдвое меньший конвейер). Такой подход позволяет значительно увеличить тактовую частоту процессора, хотя и приводит к столь негативному последствию, как увеличение времени перезагрузки конвейера в случае ошибки предсказания перехода. Для того чтобы уменьшить вероятность возникновения подобной ситуации, в процессорах Pentium 4 применена технология Advanced Dynamic Execution, которая подразумевает увеличение пула команд до 126 (в Pentium III пул команд содержал 42 команды) и увеличение до 4 Кбайт буфера ветвлений, хранящего адреса уже выполненных переходов. Это, вкупе с усовершенствованным алгоритмом предсказания, позволяет повысить вероятность предсказания переходов на 33% по сравнению с процессорами семейства Р6 и довести его до 90-95%. В процессорах Pentium 4 реализован несколько нетрадиционный подход к организации кэша первого уровня L1. Хотя L1, как и у большинства современных процессоров, состоит из двух частей: кэша данных (8 Кбайт) и кэша инструкций, особенность последнего состоит в том, что теперь он хранит до 12 тыс. уже декодированных микроопераций, причем расположенных в порядке их выполнения, определенном на основе предсказаний переходов ветвлений. Кэш инструкций процессора Intel Pentium 4 с такой организацией получил название Execution Trace Cache. Rapid Execution Engine - это два блока арифметической логики (ALU), которые работают на удвоенной частоте процессора. В случае описываемого нами процессора, тактовая частота которого равна 2,4 ГГц, это означает, что блоки ALU работают на частоте 4,8 ГГц, а учитывая, что функционируют они в параллельном режиме, нетрудно подсчитать, что процессор может выполнять четыре целочисленные операции за такт (чуть более 0,4 мкс). Кэш второго уровня L2 процессоров семейства Pentium 4 получил название Advanced Transfer Cache. Имеющий 256-битную шину, работающую на частоте ядра, и усовершенствованную схему передачи данных, этот кэш обеспечивает высочайшую пропускную способность, столь важную для потоковых процессов обработки. Как уже отмечалось выше, первоначально процессоры на ядре Willamette имели кэш L2 размером 256 Мбайт, переход на 0,13-микронную технологию позволил увеличить кэш второго уровня до 512 Мбайт. Такое увеличение кэша L2 благотворно сказалось на производительности процессора, позволяя снизить вероятность промаха при обращении. В процессорах Pentium 4 реализована поддержка увеличенного набора инструкций потоковых SIMD-расширений (Streaming SIMD Extensions), получившего название SSE 2. В этом наборе к уже существующим 70 SIMD-инструкциям было добавлено еще 144 новые инструкции. Эти инструкции позволяют выполнять 128-разрядные операции как с целыми числами, так и с числами с плавающей точкой, давая значительный прирост производительности на целом ряде задач, использующих потоковую обработку данных. Здесь существует только одно «но» - код выполняемой задачи должен быть соответствующим образом оптимизирован и откомпилирован.

При всех вышеперечисленных усовершенствованиях в основу процессоров модельной линейки Pentium 4 положена все та же 32-битная архитектура Intel (IA-32), и новый процессор не является исключением. Как следствие, Pentium 4 2,4 ГГц оптимизирован на работу с 32-битным программным обеспечением и показывает традиционно стабильную и высокопроизводительную работу с такими операционными системами, как Windows 98, Windows Me, Windows 2000, Windows XP и ОС семейства UNIX. У нас была возможность протестировать работу нового процессора от компании Intel, при этом использовалась следующая конфигурация тестового стенда:

Для тестирования нами использовалась операционная система Microsoft Windows XP. Результаты тестирования приведены в таблице .

Возможно, кто-то задаст вопрос: сколько же можно увеличивать производительность процессора и вообще насколько необходимы для современного персонального компьютера столь мощные центральные процессоры? На это нам хочется ответить, что работа центральному процессору всегда найдется. Его вычислительные мощности можно задействовать, переложив на него работу логики других подсистем компьютера, тем самым снизив стоимость последних. Некоторые эксперты поднимают вопрос о том, что при дальнейшем росте быстродействия центрального процессора можно было бы переложить на него и вычислительную нагрузку процессора графической карты (что уже делалось в прошлом, но с совершенно иными мотивациями).

В заключение хотелось бы отметить, что новый процессор от Intel - Pentium 4 2,4 ГГц демонстрирует стабильную работу и отличную производительность на приложениях, работающих со звуком, видео, 3D-графикой, на офисных приложениях и играх, а также при выполнении сложных вычислительных задач. Одним словом, на базе этого процессора могут быть созданы высокопроизводительные станции для дома и офиса, способные удовлетворять самые взыскательные запросы пользователей и решать задачи, предъявляющие максимально высокие требования к вычислительным мощностям вашего персонального компьютера.

КомпьютерПресс 5"2002

«топовых» на тот момент настольных процессоров, перешагнувших 2-гигагерцовый рубеж. К сегодняшнему дню в линейках у обеих компаний появилось по новой модели, а значит, есть повод провести очередное сравнение или исправить недочеты старого. Исследование новых моделей всегда интересно, если те различаются архитектурно, но сегодня не тот случай. Старые ядра, следующая ступень коэффициентов умножения — вот и «новые процессоры». Заслуживает внимания «обратный» факт: Athlon XP 2100+ — это последняя модель на ядре Palomino, даже не значившаяся ранее в плане выпуска и прикрывающая место до выхода нового ядра Thoroughbred.

У процессоров Intel тоже грядут изменения. Совсем скоро состоится переход на шину 533 МГц, так что имеющийся у нас экземпляр тоже в некотором роде «прощальный».

Что ж, постараемся извлечь максимальную пользу из этого тестирования. Во-первых, можно сравнить новую модель с предшествующей, и по разнице показателей в тестах оценивать масштабируемость. Во-вторых, можно ввести в строй свежие версии используемых тестов и добавить новые — благо, такие статьи обычно для промежуточного сравнения не используют. Наконец, в-третьих, всегда остаются актуальными совершенно бесполезные и совершенно беспроигрышные попытки выявить абсолютного лидера по скорости.

Для решения первой задачи добавим в пару к Intel Pentium 4 2,4 ГГц 2,2-гигагерцовую модель, а к AMD Athlon XP 2100+ — Athlon XP 2000+, и протестируем каждую пару на одном и том же своем чипсете. Опираясь на опыт уже упомянутого большого сравнения, для решения третьей задачи выберем для процессора Intel три наиболее интересные платформы, а для процессора AMD ограничимся одной — самой быстрой практически везде VIA KT333 + DDR333. Что же до обновления тестового набора — пожалуйте в главу с результатами.

Условия тестирования

Тестовый стенд:

  • Процессоры:
    • Intel Pentium 4 2,2 ГГц, Socket 478
    • Intel Pentium 4 2,4 ГГц , Socket 478
    • AMD Athlon XP 2000+ (1667 МГц), Socket 462
    • AMD Athlon XP 2100+ (1733 МГц), Socket 462
  • Материнские платы:
    • EPoX 4BDA2+ (BIOS от 05/02/2002) на базе i845D
    • ASUS P4T-E (версия BIOS 1005E) на базе i850
    • Abit SD7-533 (версия BIOS 7R) на базе SiS 645
    • Soltek 75DRV5 (версия BIOS T1.1) на базе VIA KT333
  • 256 МБ PC2700 DDR SDRAM DIMM Samsung, CL 2 (использовалась как DDR266 на i845D)
  • 2x256 МБ PC800 RDRAM RIMM Samsung
  • ASUS 8200 T5 Deluxe GeForce3 Ti500
  • IBM IC35L040AVER07-0, 7200 об/мин, 40 ГБ
  • CD-ROM ASUS 50x

Программное обеспечение:

  • Windows 2000 Professional SP2
  • DirectX 8.1
  • Intel chipset software installation utility 3.20.1008
  • Intel Application Accelerator 2.0
  • SiS AGP Driver 1.09
  • VIA 4-in-1 driver 4.38
  • NVIDIA Detonator v22.50 (VSync=Off)
  • CPU RightMark RC0.99
  • RazorLame 1.1.4 + Lame codec 3.89
  • RazorLame 1.1.4 + Lame codec 3.91
  • VirtualDub 1.4.7 + DivX codec 4.12
  • VirtualDub 1.4.7 + DivX codec 5.0 Pro
  • WinAce 2.11
  • WinZip 8.1
  • eTestingLabs Business Winstone 2001
  • eTestingLabs Content Creation Winstone 2002
  • BAPCo & MadOnion SYSmark 2001 Office Productivity
  • BAPCo & MadOnion SYSmark 2001 Internet Content Creation
  • BAPCo & MadOnion SYSmark 2002 Office Productivity
  • BAPCo & MadOnion SYSmark 2002 Internet Content Creation
  • 3DStudio MAX 4.26
  • SPECviewperf 6.1.2
  • MadOnion 3DMark 2001 SE
  • idSoftware Quake III Arena v1.30
  • Gray Matter Studios & Nerve Software Return to Castle Wolfenstein v1.1
  • Expendable Demo
  • DroneZmarK
Плата EPoX 4BDA2+ ASUS P4T-E Abit SD7-533 Soltek 75DRV5
Чипсет i845D (RG82845 + FW82801BA) i850 (KC82850 + FW82801BA) SiS 645 (SiS 645 + SiS 961) VIA KT333 (KT333 + VT8233A)
Поддержка процессоров Socket 478, Intel Pentium 4 Socket 462, AMD Duron, AMD Athlon, AMD Athlon XP
Память 2 DDR 4 RDRAM 3 DDR 3 DDR
Слоты расширения AGP/ 6 PCI/ CNR AGP/ 5 PCI/ CNR AGP/ 5 PCI AGP/ 5 PCI/ CNR
Порты ввода/ вывода 1 FDD, 2 COM, 1 LPT, 2 PS/2
USB 2 USB 1.1 + 1 разъем на 2 USB 1.1 2 USB 1.1 + 2 разъема по 2 USB 1.1 2 USB 1.1 + 1 разъем на 2 USB 1.1
Интегрированный IDE-контроллер ATA100 ATA100 ATA100 ATA133
Внешний IDE-контроллер HighPoint HPT372 - - -
Звук AC"97 codec, Avance Logic ALC201A PCI Audio, C-Media CMI8738/PCI-6ch-MX AC"97 codec, VIA VT1611A
Встроенный сетевой контроллер - - - -
I/O-контроллер Winbond W83627HF-AW Winbond W83627GF-AW Winbond W83697HF ITE IT8705F
BIOS 2 Мбит Award Medallion BIOS v.6.00 2 Мбит Award Modular BIOS v.6.00PG 2 Мбит Award Modular BIOS v. 6.00PG
Форм-фактор, размеры ATX, 30,5x24,5 см ATX, 30,5x24,5 см ATX, 30,5x23 см ATX, 30,5x22,5 см

Результаты тестов

Мы уже не раз пытались сформулировать критерии оптимального процессорного теста. Конечно, идеал недостижим, но сегодня мы делаем свой первый шаг в его направлении — запускаем проект CPU RightMark (). За подробностями и новостями проекта отсылаем вас на его сайт, здесь же приведем краткие разъяснения, которые должны помочь вам понять суть тестового эксперимента и его инструментарий.

Итак, CPU RightMark — это тест процессора и подсистемы памяти, осуществляющий численное моделирование физических процессов и решение задач из области трехмерной графики. Говоря очень кратко, один блок программы численно решает систему дифференциальных уравнений, соответствующую моделированию в реальном времени поведения системы многих тел, другой же блок визуализирует найденные решения также в режиме реального времени. Каждый блок реализован в нескольких вариантах, оптимизированных под различные системы процессорных команд. Важно отметить, что тест не является чисто синтетическим, а написан с использованием приемов и средств программирования, типичных для задач своей области (трехмерных графических приложений).

Блок решения системы дифференциальных уравнений написан с использованием набора команд сопроцессора x87, а также имеет вариант, оптимизированный для набора SSE2 (c векторизацией цикла: две итерации цикла заменяются одной, но все операции производятся с двухэлементными векторами). Скорость работы этого блока свидетельствует о производительности связки процессор+память при выполнении математических расчетов с использованием действительных чисел двойной точности (характерно для современных научных задач: геометрических, статистических, задач моделирования).

Результаты данного подтеста показывают, что скорость работы с инструкциями x87 FPU у Athlon XP выше, однако за счет поддержки набора SSE2 (естественно, отсутствующей у Athlon XP) Pentium 4 оказывается гораздо быстрее. Подчеркнем, что в данном блоке не используются SSE-команды, поэтому результаты прогона теста в режимах с задействованием SSE опущены (они просто совпадают с соответствующими MMX/FPU и MMX/SSE2). Отметим почти идеальную масштабируемость теста по частоте CPU — здесь влияние памяти почти сведено к нулю за счет эффективного кэширования и характера работы блока с интенсивными вычислениями при сравнительно малом объеме обмена данными.

Блок визуализации в свою очередь состоит из двух частей: блока предварительной обработки сцены и блока трассировки лучей и отрисовки. Первый написан на С++ и откомпилирован с использованием набора команд сопроцессора x87. Второй написан на ассемблере и имеет несколько вариантов, оптимизированных под различные наборы инструкций: FPU+GeneralMMX, FPU+EnhancedMMX и SSE+EnhancedMMX (подобное разделение на блоки является типичным для имеющихся реализаций задач визуализации в реальном времени). Суммарная скорость работы блока визуализации свидетельствует о производительности связки процессор+память при выполнении геометрических расчетов с использованием действительных чисел одинарной точности (типично для трехмерных графических программ, оптимизированных под SSE и Enhanced MMX).

Опять же, скорость работы с инструкциями x87 FPU у Athlon XP оказывается значительно выше, однако использование при вычислениях SSE вновь выводит вперед Pentium 4, несмотря на поддержку этого набора процессорами Athlon XP. При этом по производительности на мегагерц оба процессора идут практически вровень, по суммарной же — Pentium 4 получает отрыв, соответствующий его более высокой частоте. Подчеркнем, что в данном блоке не используются SSE2-команды, поэтому результаты прогона теста в режимах с задействованием SSE2 опущены (они просто совпадают с соответствующими MMX/FPU и SSE/FPU). Отметим отличную производительность связки Pentium 4 + SiS 645, вызванную, очевидно, наибольшей скоростью доступа к памяти при малой латентности. Вообще, процесс рендеринга сопровождается довольно активной пересылкой данных, что делает вклад чипсета и типа используемой памяти в суммарную производительность системы значительным.

Суммарная производительность системы рассчитывается по формуле: Overall = 1/(1/MathSolving + 1/Rendering), так что очень значительный выигрыш Pentium 4 при использовании SSE2 в блоке расчета физической модели почти не дает прироста производительности без задействования SSE в блоке визуализатора. Зато при выполнении вычислений с помощью SSE добавка от включения SSE2 составляет вполне внушительную величину. (Отметим, что данная характеристика справедлива для конкретных выбранных условий тестирования, возможности же настройки теста позволяют задать практически любое соотношение времени просчета физической модели и визуализации (путем смены экранного разрешения или точности расчетов).) Так как Athlon XP не поддерживает набор SSE2, его производительность достаточно очевидно зависит от скорости отрисовки сцен, где он уступает Pentium 4 при использовании набора SSE, хотя и остается абсолютным чемпионом по «чистой» скорости выполнения операций при помощи только MMX и FPU. Отметим, что из протестированных чипсетов под Pentium 4 i845D смотрится чуть получше i850 (вероятно, из-за большей латентности у последнего), а чемпионом является SiS 645 по причине, указанной выше.

Довольно давно уже доступна новая версия популярного кодировщика Lame, но у нас все не было случая ее применить. В рамках подготовки данной статьи было проведено тестирование и старой, использовавшейся нами до сих пор версии 3.89, и последней официально доступной версии 3.91. Результаты совпали полностью (в пределах погрешности), что вполне согласуется с отсутствием упоминания о скоростной оптимизации кода в списке нововведений программы. (Кстати, кодировщик уже больше полугода корректно поддерживает работу со всеми доступными расширенными мультимедийными наборами команд и регистров.) Тест, как видите, превосходно масштабируется по частоте процессора, так как и здесь осуществляется эффективное предварительное кэширование данных, но остается ряд вопросов по довольно низкой производительности Pentium 4 на i850 и SiS 645. Самым разумным нам кажется предположение, что такое влияние на производительность оказывает BIOS плат: продукт от Abit мы еще не видели в деле, а вот плата от ASUS на i850 нам хорошо знакома, причем при использовании предыдущей версии прошивки (еще раз отсылаем вас к прошлому ) подобного спада не наблюдалось. Athlon XP в этом тесте по-прежнему лидер, причем для победы вполне хватает и версии 2000+.

Новая версия 5.0 кодека DivX вышла совсем недавно, но учитывая огромную популярность этого продукта, нетрудно предсказать его активное использование уже в ближайшее время, без ожидания выпуска новых релизов с исправлениями ошибок. Что ж, мы следуем в русле народных пожеланий и переходим к применению версии DivX 5.0 Pro. Мы также провели аналогичное тестирование c версией DivX 4.12, и результаты сравнения кодеков таковы: операция кодирования ускоряется весьма ощутимо — более чем на минуту, причем вне зависимости от процессора, чипсета и типа памяти. Также отметим, что DivX 5.0 Pro формирует чуть больший выходной видеофайл. К сравнению же собственно процессоров в этом тесте нам добавить нечего — все уже было сказано в прошлой статье, а вот на неплохую масштабируемость кодирования стоит обратить внимание.

В архивировании WinAce, как и при кодировании MPEG4, влияние подсистемы памяти (вследствие большого объема пересылаемых данных) примерно в два раза скрадывает эффект от увеличения частоты процессора. Athlon XP в этом тесте все еще лучше своего визави.

В архивировании WinZip отметим разве что некоторое отставание Pentium 4 на SiS 645 и полное равенство в остальных случаях.

Результаты Winstones выглядят на редкость логично и понятно, но памятуя о частых необъяснимых провалах и всплесках в этих тестах в прошлом, мы, пожалуй, воздержимся от комментариев.

Напомню, что до сих пор нам приходилось говорить решительное «не верим!» результатам Athlon XP в тесте SYSmark, так как в силу криворукости отдельных программистов версия WME 7.0, входящая в состав приложений группы Internet Content Creation этого теста, не умела определять поддержку набора инструкций SSE у Athlon XP. К счастью, мы наконец начинаем тестирование в обновленной версии бенчмарка — SYSmark 2002, в которой эта проблема решена.

Вкратце об отличиях в составе приложений тестов:

SYSmark 2001 SYSmark 2002
Office Productivity
Dragon NaturallySpeaking Preferred 5
McAfee VirusScan 5.13
Microsoft Access 2000 Microsoft Access 2002
Microsoft Excel 2000 Microsoft Excel 2002
Microsoft Outlook 2000 Microsoft Outlook 2002
Microsoft PowerPoint 2000 Microsoft PowerPoint 2002
Microsoft Word 2000 Microsoft Word 2002
Netscape Communicator 6.0
WinZip 8.0
Internet Content Creation
Adobe Photoshop 6.0 Adobe Photoshop 6.0.1
Adobe Premiere 6.0
Macromedia Dreamweaver 4
Macromedia Flash 5
Microsoft Windows Media Encoder 7.0 Microsoft Windows Media Encoder 7.1

Как видите, никаких замен нет, только обновления версий. Алгоритм подсчета итоговых баллов официально известных изменений не претерпел, хотя мы бы предположили пересчет некоторых коэффициентов пропорциональности.

Интересно сравнение результатов старого и нового пакетов в офисном подтесте: во-первых, был, вероятно, введен некий корректирующий коэффициент, что привело к уменьшению показателей обеих сторон. Во-вторых, очевидно, в силу переделанного пакета Microsoft Office, Pentium 4 начал выигрывать в этом подтесте, хотя в SYSmark 2001 обе процессорные платформы шли вровень.

В создающем контент подтесте ситуация еще интереснее: за счет нормального распознавания SSE у Athlon XP в MS WME 7.1 процессор AMD прибавил, но зато в состав подтеста нового пакета входит переписанная для поддержки SSE2 версия Adobe Photoshop 6.0.1, так что Pentium 4 получает даже больший прирост.

В итоге, от сомнительного лидерства в SYSmark Pentium 4 переходит к лидерству очевидному. Обратите также внимание на то, как здорово растет производительность Pentium-систем в этом тесте с ростом частоты процессора, и на почти отсутствующий аналогичный эффект для Athlon-системы.

Рендеринг в 3DStudio MAX отлично масштабируется и обычно не демонстрирует признаков зависимости от скорости работы с памятью, так что нам остается только гадать, что же такое наворотили в последней прошивке BIOS для ASUS P4T-E инженеры компании. На диаграмме хорошо видно, что рендеринг на Athlon XP ускоряется пропорционально увеличению частоты процессора, но как раз за счет гораздо более высокой частоты Pentium 4 2,4 ГГц уходит в этом тесте в отрыв, хотя скорость еще 2,2-гигагерцовой модели была примерно равна Athlon XP 2000+.

В SPECviewperf, в общем, ничего интересного: результаты почти везде равные, с легким перевесом Pentium 4, и лишь в DX-06 заметно впереди Athlon XP. Обратите внимание на то, что скорость тестов практически не зависит от скорости процессоров.

При переходе на новый процессор Intel игровой бенчмарк делает небольшой рывок, но это не помогает ему дотянуть даже до результатов Athlon XP 2000+.

Добавление к тестовым играм Return to Castle Wolfenstein, основанной на движке Quake III, ситуацию, естественно, никак не изменило. Более того, относительные показатели в этих двух играх похожи практически один в один. Приплюсуем сюда же DroneZ, отличающуюся движком, но не характером результатов, и остается только древняя Expendable — негусто для Athlon XP… Отметим, что все игры примерно одинаково неплохо масштабируются по частоте процессора, что тоже играет на руку Intel.

Выводы

Прощание ядру Palomino не слишком удалось: нельзя сказать, что Athlon XP так уж сильно отстает от своего соперника, да и далеко не везде это отставание вообще имеет место, но тенденции налицо. С реальной ли частотой, с PR-рейтингом ли — AMD отстает от Intel по волшебным цифрам в названии процессоров, а прирост производительности на увеличение частоты (какой бы «дутой» ее ни считали у Pentium 4) в большинстве наших тестов дает преимущество в абсолютных показателях именно линейке Pentium 4. Многие приложения «узнали», наконец, про поддержку SSE в Athlon XP, что дало некоторый всплеск, но это тупик, а вот оптимизация под SSE2 еще далеко не завершена, и чем дальше — тем больше приложений будет переходить из «лагеря AMD» в «лагерь Intel».

Впрочем, пост свой Palomino оставляет все же в приличном состоянии. Отставание последней модели от имеющихся конкурентов отнюдь не катастрофическое, цена привлекательная, а мы с больши м интересом будет наблюдать за попытками AMD вернуть лидерство с новым ядром.

Tray Processor

Tray Processor

Intel ships these processors to Original Equipment Manufacturers (OEMs), and the OEMs typically pre-install the processor. Intel refers to these processors as tray or OEM processors. Intel doesn"t provide direct warranty support. Contact your OEM or reseller for warranty support.

Tray Processor

Intel ships these processors to Original Equipment Manufacturers (OEMs), and the OEMs typically pre-install the processor. Intel refers to these processors as tray or OEM processors. Intel doesn"t provide direct warranty support. Contact your OEM or reseller for warranty support.

Boxed Processor

Intel Authorized Distributors sell Intel processors in clearly marked boxes from Intel. We refer to these processors as boxed processors. They typically carry a three-year warranty.

Boxed Processor

Intel Authorized Distributors sell Intel processors in clearly marked boxes from Intel. We refer to these processors as boxed processors. They typically carry a three-year warranty.

Tray Processor

Intel ships these processors to Original Equipment Manufacturers (OEMs), and the OEMs typically pre-install the processor. Intel refers to these processors as tray or OEM processors. Intel doesn"t provide direct warranty support. Contact your OEM or reseller for warranty support.

Boxed Processor

Intel Authorized Distributors sell Intel processors in clearly marked boxes from Intel. We refer to these processors as boxed processors. They typically carry a three-year warranty.

Tray Processor

Intel ships these processors to Original Equipment Manufacturers (OEMs), and the OEMs typically pre-install the processor. Intel refers to these processors as tray or OEM processors. Intel doesn"t provide direct warranty support. Contact your OEM or reseller for warranty support.

Tray Processor

Intel ships these processors to Original Equipment Manufacturers (OEMs), and the OEMs typically pre-install the processor. Intel refers to these processors as tray or OEM processors. Intel doesn"t provide direct warranty support. Contact your OEM or reseller for warranty support.

Boxed Processor

Intel Authorized Distributors sell Intel processors in clearly marked boxes from Intel. We refer to these processors as boxed processors. They typically carry a three-year warranty.

Tray Processor

Intel ships these processors to Original Equipment Manufacturers (OEMs), and the OEMs typically pre-install the processor. Intel refers to these processors as tray or OEM processors. Intel doesn"t provide direct warranty support. Contact your OEM or reseller for warranty support.

Tray Processor

Intel ships these processors to Original Equipment Manufacturers (OEMs), and the OEMs typically pre-install the processor. Intel refers to these processors as tray or OEM processors. Intel doesn"t provide direct warranty support. Contact your OEM or reseller for warranty support.

Tray Processor

Intel ships these processors to Original Equipment Manufacturers (OEMs), and the OEMs typically pre-install the processor. Intel refers to these processors as tray or OEM processors. Intel doesn"t provide direct warranty support. Contact your OEM or reseller for warranty support.

Boxed Processor

Intel Authorized Distributors sell Intel processors in clearly marked boxes from Intel. We refer to these processors as boxed processors. They typically carry a three-year warranty.

Boxed Processor

Intel Authorized Distributors sell Intel processors in clearly marked boxes from Intel. We refer to these processors as boxed processors. They typically carry a three-year warranty.

Boxed Processor

Intel Authorized Distributors sell Intel processors in clearly marked boxes from Intel. We refer to these processors as boxed processors. They typically carry a three-year warranty.

Tray Processor

Intel ships these processors to Original Equipment Manufacturers (OEMs), and the OEMs typically pre-install the processor. Intel refers to these processors as tray or OEM processors. Intel doesn"t provide direct warranty support. Contact your OEM or reseller for warranty support.

Процессор Pentium 4 2.40GHz

Количество ядер - 1.

Базовая частота ядер Pentium 4 2.40GHz - 2.4 ГГц.

Цена в России

Хотите купить Pentium 4 2.40GHz дёшево? Посмотрите список магазинов, которые уже продают процессор у вас в городе.

Семейство

Показать

Тест Intel Pentium 4 2.40GHz

Данные получены из тестов пользователей, которые тестировали свои системы как в разгоне, так и без. Таким образом, вы видите усреднённые значения, соответствующие процессору.

Скорость числовых операций

Для разных задач требуются разные сильные стороны CPU. Система с малым количеством быстрых ядер отлично подойдёт для игр, но уступит системе с большим количеством медленных ядер в сценарии рендеринга.

Мы считаем, что для бюджетного игрового компьютера подходит процессор с минимум 4 ядрами/4 потоками. При этом отдельные игры могут загружать его на 100% и тормозить, а выполнение любых задач в фоне приведёт к просадке ФПС.

В идеале покупатель должен стремиться к минимум 6/6 или 6/12, но учитывать, что системы с более чем 16 потоками сейчас применимы только в профессиональных задачах.

Данные получены из тестов пользователей, которые тестировали свои системы как в разгоне (максимальное значение в таблице), так и без (минимальное). Типичный результат указан посередине, в цветной полосе указана позиция среди всех протестированных систем.

Комплектующие

Мы собрали список комплектующих, которые пользователи наиболее часто выбирают, собирая компьютер на базе Pentium 4 2.40GHz. Также с этими комплектующими достигаются наилучшие результаты в тестах и стабильная работа.

Самый популярный конфиг: материнская плата для Intel Pentium 4 2.40GHz - Asus P8Z68-V, видеокарта - GeForce GT 525M.

Сравнение показателей IPC

Для тех, кто не знает: IPC (Instructions Per Cycle, количество исполняемых инструкций за такт) – это хороший показатель того, насколько быстро работает процессор, и одновременное сочетание высоких значений IPC и тактовой частоты обеспечивает максимальную производительность. Именно это мы наблюдаем у процессоров Intel Coffee Lake 8 поколения, и хотя AMD явно отстает, когда речь идет о частотах, эта компания реально приближается к показателям Intel в части IPC. Возможно, по этой причине многие из вас интересуются данным аспектом тестирования CPU.

Чтобы понять, насколько далеко AMD продвинулась в этом направлении, мы решили минимизировать количество параметров тестирования и в то же время максимально приблизить ситуацию к реальным условиям работы. Первый и наиболее очевидный шаг здесь – привести частоты ядер к единому постоянному значению, что мы и сделали, зафиксировав все ядра CPU на частоте 4 ГГц. Все опции технологии Boost были отключены, и, таким образом, частоты ядер не могли уйти за пределы 4 ГГц.

Процессоры 2 поколения Ryzen тестировались на материнской плате Asrock X470 Taichi Ultimate, а процессоры Coffee Lake – на плате Asrock Z370 Taichi . В обеих конфигурациях во всех тестах использовалась одна и та же память G.Skill FlareX DDR4-3200 с профилем памяти "Xtreme" и одна и та же видеокарта MSI GTX 1080 Ti Gaming X Trio .

Мы сразу можем сказать, что эта статья не содержит рекомендаций для потенциальных покупателей – мы проводили тестирование в чисто исследовательских целях.

Процессоры Coffee Lake изначально имеют явное преимущество в тактовой частоте.

В данный обзор мы включили результаты тестирования процессоров Intel Core i7-8700K , Core i5-8600K и AMD Ryzen 7 2700X, Ryzen 5 2600X и Ryzen 7 1800X , Ryzen 5 1600X .

Итак, теперь процессоры 1600X, 2600X и 8700K имеют одинаковый ресурс: 6 ядер и 12 потоков.

Процессоры 1800X и 2700X имеют преимущество – 8 ядер и 16 потоков, в то время как 8600K с 6 ядрами и 6 потоками, напротив, находится в невыгодном положении.

Все это следует иметь в виду, когда мы пойдем дальше. Приступим к результатам.

Бенчмарки

Начнем с теста на непрерывную пропускную способность памяти. Здесь мы видим, что процессоры 1 и 2 поколений Ryzen имеют практически одинаковую пропускную способность – около 39 ГБ/с. Между тем процессоры Coffee Lake, работая с той же самой памятью, ограничиваются значением пропускной способности около 33 ГБ/с, что на 15% меньше по сравнению с процессорами Ryzen.

Переходим к тесту Cinebench R15. Тут мы видим, что процессор 2600X показывает более высокие результаты по сравнению с 1600X – на 4% больше в многопоточном режиме и на 3% больше в однопоточном. А если мы посмотрим на 8700K, то увидим, что он на 4% быстрее 2600X в однопоточном режиме и на 4% медленнее в многопоточном.

Как вы могли ожидать, при одинаковой тактовой частоте процессоры Ryzen с 8 ядрами и 16 потоками в многопоточном режиме легко обходят 8700K. Я привел здесь эти результаты просто потому, что они у меня были. При соответствующем запросе я мог бы провести этот тест, например, с Core i7-7820X.

Следующий пункт – редактирование видео в PCMark 10, и этот тест дает более четкие результаты, хотя и до этого мы наблюдали заметную разницу между процессорами 1600X и 1800X. А здесь мы видим уверенный 10%-й прогресс при переходе от 1600X к 2600X, и это ставит AMD на один уровень с Intel в части производительности IPC (по крайней мере, в этом тесте).

Как показывают результаты Cinebench R15, используемая по максимуму технология AMD SMT (Simultaneous Multi-Threading) выглядит более эффективной, чем технология Intel HT (Hyper-Threading). Здесь процессор 1600X был быстрее 8700K на 3,5%, а 2600X – на целых 8%, и для данного примера это существенная разница.

Продуктивность / Производительность в приложениях

Для следующего теста мы взяли Excel, и здесь процессор 8700K был примерно на 3% быстрее, чем 1600X, – на той же тактовой частоте. Однако 2600X способен соревноваться с 8700K: он показал такое же время завершения при выполнении тестовой задачи – 2,85 с – впечатляющий результат.

В тесте HandBrake результаты процессоров AMD Ryzen были не столь блестящими: здесь мы видим, что 2600X может состязаться только с 8600K, а в сравнении с 8700K оказывается на 15% медленнее.

Переходим к бенчмарку Corona. Тут мы видим, что процессор 2600X может уменьшить время рендеринга на 8% по сравнению с 1600X, и при этом оказывается всего на 3% медленнее, чем 8700K. Таким образом, в этом тесте Intel пока удерживает преимущество в IPC, но оно минимально.

Следующий тест – Blender, и здесь 2600X был всего на 2,5% быстрее, чем 1600X, и на 4% медленнее, чем 8700K. Не слишком большая разница, и снова Intel удерживает преимущество в IPC – в этом тесте оно менее 5%.

В бенчмарке V-Ray мы видим, что процессор 2600X превзошел результат 1600X на 4% и был всего на один процент медленнее, чем 8700K, т.е. по существу оказался с ним на одном уровне.

Игровые бенчмарки

Настало время рассмотреть ряд игровых результатов, и здесь процессоры AMD отваливаются. Как я уже неоднократно говорил ранее, кольцевая шина Intel Ring Bus с низкой задержкой просто лучше подходит для игр, и мы это видим даже при сравнении этого решения Intel с их собственной архитектурой на базе Mesh Interconnect, разработанной для процессоров с большим числом ядер. Внутренняя шина AMD Infinity Fabric испытывает ряд проблем, и эти проблемы останутся до тех пор, пока игровые процессоры не потребуют большего количества ядер.

Таким образом, хотя процессор 2600X и превосходит 1600X на 8% в игре Ashes of the Singularity , он в то же время заметно проигрывает 8700K – на целых 11% медленнее. То обстоятельство, что процессоры Intel работают со значительно более высокой тактовой частотой, разом увеличит это разницу до 20% или даже больше.

В игре Assassin"s Creed: Origins мы видим небольшое 2%-е превосходство процессора 2600X над 1600X, в то время как процессор 8700K на целых 14% быстрее.

Эта разница слегка уменьшилась при установке высоких графических настроек, но все равно, когда мы сравниваем средние значения частоты кадров, 8700K оказывается на 12% быстрее процессора 2600X.

В Battlefield 1 с настройками ультра мы видим, что процессор 2600X на 9% быстрее процессора 1600X, но все-таки на 7% медленнее, чем процессор 8700K.

Эта разница становится еще больше при средних настройках, поскольку уменьшается влияние видеокарты GTX 1080 Ti. Здесь процессор 2600X снова демонстрирует 9% роста производительности относительно 1600X, но теперь он на 10% медленнее 8700K, что даже при этих настройках выглядит как ограничение производительности GPU.

Похожую картину мы наблюдаем в игре Far Cry , где процессор 2600X на 10% быстрее 1600X – это очень большой прогресс, но даже тут он оказывается на 8% медленнее, чем 8700K.

Сравнение энергопотребления

Этот тест на энергопотребление проводился не в самых реалистичных условиях, поскольку при установке единой тактовой частоты 4 ГГц многие энергосберегающие опции были отключены. С научной точки зрения это также не вполне чистый эксперимент, потому что мне пришлось повысить напряжение на процессорах Ryzen сверх номинального значения – для стабилизации всех ядер на повышенной частоте 4 ГГц.

Приняв во внимание всё вышесказанное, мы видим, что системы с процессорами 1600X и 2600X потребляют в точности одинаковое количество энергии, в то время как система с 8700K потребляет на 3% меньше, т.е. при указанных условиях этот процессор чуть более эффективен.

В тестировании с Far Cry потребляемая мощность везде была почти одинаковой – все процессоры доводят общее энергопотребление системы примерно до 380 Вт.

В тесте Blender мы видим снижение энергопотребления на 10% при переходе от процессора 1600X к 2600X. Для процессора 2600X это впечатляющее достижение, но при этом все равно он потребляет на 21% больше мощности, чем процессор 8700K.

На этот раз в тесте HandBrake система с процессором 2600X продемонстрировала на 7% большее энергопотребление, чем система с 1600X, и на ужасающие 32% большее, чем система с 8700K.

Заключение

Несмотря на достаточно большой дефицит тактовой частоты (по сравнению с аналогами от Intel), процессоры 2 поколения Ryzen в тестовых приложениях не так уж часто остаются далеко позади своих конкурентов, и теперь мы можем понять, почему – сравнив их на одной и той же тактовой частоте 4 ГГц. Например, в приложении Cinebench R15 мы видим, что в одноядерном режиме их производительность ниже всего на 3%, зато в многоядерном режиме технология SMT помогает процессорам AMD работать до 4% быстрее по сравнению с Intel.

В нашем исследовании процессоры AMD были на 3% медленнее Intel в тесте Corona, но в таких бенчмарках, как V-Ray, Excel и редактирование видео показали почти одинаковый с ними результат. В HandBrake они были на 15% медленнее, зато в PCMark 10 (тест на изображение в играх физических явлений) – на 8% быстрее. Конечно, это вопрос гейминга, и я готов поспорить – некоторые поклонники AMD надеялись на то, что мы спишем дефицит игровой производительности главным образом на тактовую частоту. К сожалению, это не так.

Основная проблема здесь – в способе соединения между собой ядер процессоров AMD, или, вернее, модулей CCX. Шина Intel Ring Bus отличается очень низкой задержкой и при распределении ресурсов всегда выбирает кратчайшие пути. Однако, как только мы добавляем дополнительные ядра, кольцевая шина увеличивается в размерах – для соединения всех ядер требуется больше колец – и ее эффективность снижается. Таким образом, процессоры Intel с большим числом ядер (например, 28) нуждаются в более оптимальном способе соединения ядер между собой. И в этих случаях отлично работает архитектура с Mesh Interconnect.

Однако мы уже знаем, что для 6-, 8- и 10-ядерных процессоров это не самое лучшее решение, и именно поэтому процессоры Core i7-7800X, 7820X и 7900X в играх заметно уступают 8700K. Процессор 8700K имеет среднее время задержки между ядрами около 40 нс, а у 7800X это время составляет от 70 до 80 нс.

Процессоры Ryzen устроены немного сложнее: внутри модуля CCX задержка между ядрами близка к тому, что мы видим у процессора 8700K, и не зависит от скорости работы памяти DDR4. Однако, как только мы выходим за пределы CCX, задержка между ядрами возрастает до 110 нс, и это уже связано с памятью DDR4-3200. С более быстрой памятью задержка между ядрами модулей CCX снижается, так как шина AMD Infinity Fabric привязана к тактовой частоте памяти, и DRAM с низкой задержкой здесь также очень помогает.

Еще одна проблема заключается в самих играх, поскольку почти все популярные игры разработаны в расчете на CPU всего лишь с несколькими ядрами, и мы только начинаем наблюдать некоторые шаги, предпринимаемые в направлении разбиения задач на части для параллельной обработки их ядрами CPU. До появления процессоров Ryzen игры разрабатывались и оптимизировались почти исключительно под процессоры Intel. Сейчас ситуация постепенно изменяется, так как улучшаются игровые характеристики процессоров Ryzen, но вряд ли мы в ближайшее время увидим их на одном уровне с процессорами Intel с шиной Ring Bus.

Однако в части производительности IPC AMD определенно сократила разрыв. Кэш с уменьшенной задержкой также реально помогает, и, таким образом, покупка процессора 2 поколения Ryzen несет в себе некоторые преимущества перед покупкой процессора Coffee Lake. Будет интересно понаблюдать за битвой между этими процессорами, которая развернется в 2018 г. и далее.




Top