Intel Sandy Bridge 10 лет. Что старый i7 может сейчас?

10 лет — это много

На дворе 2021 год, а значит своего первого крупного юбилея дождался очень важный продукт компании intel, который одновременно можно считать и большим достижением и огромным проклятием компании, в конечном счёте именно этот процессор виноват в том, что в то время как AMD активно развивали свои решения — intel топтались на месте.

Естественно далее мы сравним старый i7 с новым i7, чтобы понять как сильно изменилась производительность за это время. Но для начала давайте погрузимся в пусть и не очень далёкий, но всё же 10 летний исторический экскурс.

Шёл 2011 году, в России милицию переименовали в полицию.

Завершилась программа спейсшатл.

Из-за землетрясения разрушилась атомная электростанция фукусима 1.

Запретили продажи лампочек на 100 Ватт и более.

И примерно в это время вышли процессоры intel 2-го поколения, кстати, с максимальным потреблением в стоке до 95 Ватт, так что, как лампочки их использовать тоже можно, только светить они не будут.

Что же было такого примечательного, что этому юбилею я решил посвятить отдельную статью?

Что было важного?

Этот процессор стал очень важной вехой для продуктов intel и в целом для процессоров для домашних компьютеров.

Интеграция компонентов

Напомню, что изначально центральный процессор назывался центральным не просто так. Это сейчас мы их так называем по привычки. А раньше вокруг центрального процессора было очень много вспомогательных систем.

Отдельным устройством был контроллер памяти, а когда-то даже кеш L2 процессора был внешним устройством. Внешним были контроллеры ввода вывода, внешними были контроллеры экрана, внешним был ускоритель графики, если он вообще в компьютере был. И со временем всё больше и больше компонентов собиралось всё ближе и ближе к центральному процессору, потому что скорости работы росли и потребность в ресурсах и скорость доступа к этим ресурсам становилась всё более важной. И именно сенди брич для настольных решений стал первым массовым продуктом с полной интеграцией всего, что необходимо для работы в единый кристалл.

Кольцевая шина и работа с кешем L3

Важным была и организация соединений всех этих блоков на едином кристалле. Именно в сенди брич появились такие знакомые многим названия как кольцевая шина и системный агент.

Иерархически в процессоре осталось деление на ядерную и внеядерную часть, последнюю как раз и назвали системным агентом. При этом кеш L2 уже давно был интегрирован в ядра, а тут к этой интеграции добавился и кеш L3, который хоть для ядер и является как бы внешним устройством, но всё равно к нему организован быстрый доступ как непосредственно у каждого из ядер к своей части кеша, так и к чужому кешу, через кольцевую шину. К слову, хоть по характеристикам кешей первое и второе поколение процессоров похоже, но доступ к L3 у процессоров совершенно разный. Более того общение ядер очень органично через кеш L3 так до сих пор и работает благодаря сквозной адресации данных через все ядра. Так до сих пор работает и сама кольцевая шина. Правда её увеличили по ширине в два раза в 2015 году, при переходе на скайлейк. Но суть вещей за 10 лет не изменилась.

И достижения по скорости взаимодействия блоков процессора между собой конкуренты до сих пор не смогли превзойти. AMD с райзенами не пошли по этому же пути, и столь быстрых взаимодействий получить не смогли. Причины у такого решения AMD тоже есть, и об этом чуть позже я тоже расскажу.

Оптимизация питания

Но скоростью работы интеграция не ограничилась. Так как всё собрано в кучу, то сильно изменилась организация питания и экономии энергии.

А это уже стало заявкой на долгую работу ноутбуков, а также и переход на 32 нм помог улучшить энергоэффективность, давая в рамках старых TDP получать намного больше производительности.

Со временем, конечно, настройки питания и перехода в энергосберегающие состояния развивалась. В сенди брич самый глубокий из рабочих режимов был C7, сейчас же процессоры могут отключать свои часть сильнее уже до C10.

Современные процессоры могут отключать больше элементов

Но именно в сенди брич в плане питания совершен был огромный шаг вперёд.

Встроенная графика во всех процессорах

Помимо системного агента, который включает в себя все контроллеры, то есть бывший северный мост, а также контроллеры PCI-e и DMI, который на самом деле по сути тоже PCI-e, на общий кристалл встроилась и графика.

Сама графика тоже имеет не только современный с OpenGL и DX 3D ускоритель, но ещё и ряд аппаратных ускорителей для кодирования и декодирования изображений и видео. Таким образом это позволило разобраться и с программной частью. Раньше графика могла быть, а могло её и не быть, а если она была, то была не известно какая одного из нескольких производителей, одного из многих поколения.

В десктопных intel процессорах теперь всегда есть набор аппаратных ускорителей для самых частых медиа задач. Это систематизировало работу и для партнёров intel в части написания софта. Начиная от программ для видеомонтажа и стриминга, заканчивая видеоплеерами и плеерами в браузерах везде есть поддержка аппаратного ускорения для intel графики. Распространение этой графики как неотъемлемой части всего ассортимента продуктов не могли повлиять на софт как-то иначе. Естественно со временем и графика тоже менялась, добавлялись новые кодировщики и декодеры, изменялся и состав самих блоков графики.

Но если у вас процессор intel, то вы вообще можете не беспокоиться — если у софта поддержка хоть чего-то аппаратного существует, то среди поддерживаемых аппаратных средств Intel Quick Sync там точно есть. За исключением Apple экосистемы и приближенных к ним камера создателям, там сама Apple ускорители за много тысяч долларов продаёт для своих же форматов видео и им норм, и макаводы тоже не возмущаются, им тоже норм.

Кроме того это позволило сильно увеличить время автономной работы для ноутбуков. Аппаратные ускорения вместо софтверных на ядрах — и вот уже ноутбук может воспроизводить видео от батареи не полтора часа, а шесть.

Turbo Boost 2.0

Кроме того, улучшенное питание позволило перераспределять энергоресурсы между компонентами процессора.

Так появился Turbo Boost, вернее он появился в первом поколении, а в сенди брич появился Turbo Boost 2.0 и этот самый Turbo Boost 2.0 та до сих пор на всех современных процессорах и остаётся 2.0.

У процессоров стало много ядер, много внешних устройств. Одновременно это всё задействуется на полную редко, поэтому если используется не всё, то остальному можно давать больше питания и увеличивать производительность, а когда что-то не задействовано, то у этого можно забирать питание, переводя эти части в режимы пониженного питания.

Единый для всего процессора тактовый генератор

Но у интеграции есть и обратные стороны. Во первых отныне весь процессор задаёт частоты от единого тактового генератора, а это значит, что при изменении его частоты — меняется скорость работы всего процессора, включая контроллеры памяти, кеша, контроллерs PCI-e, кольцевой шины и естественно самих ядер.

С этого момента — разгон по шине для intel практически перестал существовать.

Тут есть, правда, два но.

Разгон проще, но за деньги

Во первых на самом деле не перестал, но чем сложнее и быстрее контроллеры, тем диапазон разгона становится меньше. Если с PCI-e второй версии ещё сохранялась нормальная работа при увеличении частоты генератора на 5%, то при переходе на PCI-e третий версии уже проблемой могут стать изменения на 2%. Тогда как ядра бы могли ещё гнаться и гнаться.

А второе “но” заключается в том, что всё же на ядра можно подать другую частоту с внешнего тактового генератора, но возможность эта, скорее просто атавизм и дополнительная фича. Однако топовые платы под разгон довольно быстро стали снабжаться дополнительным внешним тактовым генератором именно для ядер процессора.

Частоты для разных частей процессора задавались всё равно отдельно, но уже за счёт множителей. В общем-то множители для базовой частоты — не новое нововведение, но всё же за неимением возможности разгона по шине — изменение множителя стало основным способом разгона. Одновременно с этим — разгон стал проще и понятнее для пользователя.

Типичный оверклокер начиная с сенди брич в глазах Intel

Можно гнать отдельно ядра, отдельно память и не трогать ничего остального, что тоже требует изменений и напряжений и имело ограничения по частотам. Иными словами — настройка частоты стала очень простой и доступной для массового пользователя. 

Одновременно с этим — и тот факт, что просто так разогнать процессоры стало невозможно, то именно со второго поколения intel начали продавать разгон за отдельный прайс.

Формально — процессоры с индексом «k» начали появляться уже в первом поколении, а не во втором. Но кому какое было до этого дело, если и процессоры без индекса k на первом поколении можно было разогнать до тех же частот, но только за счёт шины, а не множителя.

Слишком хорошая микроархитектура — причина застоя Intel

Ну и конечно же — огромный недостаток системы с высокой степенью интеграции в том, что этот продукт сложно изменять. Относительно легко можно вносить несерёзные изменения. Допустим — увеличивать размеры регистров, увеличивать очереди в конвейере, или увеличивать ширину отдельных шин.

Относительно отдельными частями процессора остались исполнительные блоки и микрокод, поэтому их состав и версии можно было менять хоть каждый год, что, в общем-то прошедшие 10 лет и происходило. В общем — можно по чуть-чуть что-то менять, глобально ничего не трогая, что большой плюс, но глобально что-то трогать — это большая проблема. То есть чтобы сделать что-то реально новое нужен какой-то огромный стимул, потому что для более значимых изменений для начала придётся всё уничтожить и начать делать заново.

И по сути — за 10 лет intel так и не решались сделать хоть какие-то весомые изменения.

Вот только в 11 поколении настольных процессоров уже необходимость этих изменений стала слишком острой. Были значительно присобраны исполнительные устройства в новые конфигурации за портами и с поддержкой новых инструкций, но куда необычнее будет изменение в части работы с кешем L1 данных, который пришлось уже переделывать.

И это первый раз за 10 лет, когда взяли кусок который не изолирован как какая-то часть внутри процессора, а является частью всей системы по соединению всего в процессоре.

А так — 10 лет лишь добавляли новые инструкции, добавляя для них исполнительные устройства, меняли под новые нужды размеры регистров, увеличивали ширины некоторых соединений, обновляли графику и её встроенные аппаратные средства, корректировали некоторые логические поведения из-за аппаратных уязвимостей, переводили процессор на новые литографические нормы, с новыми особенностями компоновки транзисторов и их производства и масштабировали процессоры увеличением числа ядер, но по сути 10 лет мы видим именно сенди брич, просто в улучшенном виде.

При этом время идёт, меняются требования к железу.

Если раньше софт едва мог занимать два потока и скорее много ядер нужно было для активной работы фоновых задач, то сейчас, спустя 10 лет для сложных алгоритмов уже существуют средства по оптимизации кода самими компиляторами, чтобы занимать много потоков на одну задачу, опять же — простое общение ядер позволяло этому направлению эффективно развиваться. Изменилась и частота использования векторных команд, а кстати, AVX инструкции в десктопах и исполнительные устройства для их выполнения тоже появились в сенди брич.

И если в то время они задумывались как некая оптимизированная конструкция больше для каких-то вычислительных станций, то сейчас AVX часто применяется и в обычном прикладном софте, а не только в суперкомпьютерах, в том числе и при автоматической замене компиляторами последовательностей старых SSE команд для оптимизации скорости выполнения кода процессорами.

Но подход когда изначально расчёт был либо на векторные либо на обычные — остался. И если 10 лет назад это было нормой, то сейчас векторные и int’овые операции летят в перемешку, а процессоры intel рассчитаны на то, что будут преимущественно либо одни, либо другие. 10 лет прошло, мир изменился, а процессоры intel — нет.

Это и есть та ловушка, в которую intel сами себя и загнали. Отличная микроархитектура. Долгое время ей не было равных, и заменить её чем-то лучшим ещё сложнее, опять же потому что её можно долго было понемногу модифицировать, что intel и делали. В отличие, например от AMD, где процессор изначально решили собирать как конструктор, выделяя отдельные независимые части, которые проще поменять не трогая ничего остальное.

В любом случае — имеем то, что имеем.

Что дальше?

Впрочим — время потомкам сенди брич скорее всего уже осталось не так много. Микроархитектура достигла своего предела по масштабированию. Кольцевая шина задыхается от числа адресатов и количества данных на ней, туда где должно было быть 4 ядра запихали 10, да ещё и с инструкциями, которые намного оптимальнее работают, то есть требуют больше данных за такт (переделка работы с L1D скорее всего и связана с переходом на 512 битныеAVX инструкции). Опять же и работа векторных и обычных инструкций мешают друг другу, тогда как в новенькой свеженькой микроархитектуре tremont от Intel для мобильных селеронов и пентиумов — работает уже всё совсем иначе, правда нет поддержки AVX, а только SSE.

Но я и не удивлюсь, если эти процессоры — это натурный эксперимент для будущих совершенно новых ядер, которые заменят текущие модификации сенди брич.

Сравнение производительности с современными intel процессорами

Ну а сейчас предлагаю посмотреть насколько удалось прокачать сенди брич за 10 лет, имея и новые литографические нормы и технологии, а также и за счёт памяти. Это не будет сравнения скорости работы за такт, то есть и число ядер будет разным и частоты будут разными.

i7 vs i7

Я предлагаю столкнуть лбами i7 из 2011 года и i7 из 2021, ну правда уже через несколько недель будут новые i7, но в 2011 году новые i7 появились в январе, а у нас тут на 10 летний юбилей новых i7 представить не успели, так что второе поколение i7, будет против 10-го i7.

За второе поколение будет отдуваться Xeon E3 1245.

Но он на 100 МГц медленнее, чем его клон в виде i7 2600, так что процессор будет с шиной 103 МГц, которая и даст дополнительные 100 МГц, то есть процессор получается практически идентичным i7 2600.

BCLK 103 МГц
Базовая частота получилась 33х103=3,4 ГГц, на скрине результат турбо буста на все ядра — 34х103=3,5 ГГц

За i7 10-го поколения у нас будет i9 9-го поколения.

С 6-го поколения в части скорости работы на такт все процессоры у intel вообще одинаковые. Так что i9 9-го поколения и i7 — десятого — это клоны друг друга. Единственное i7 10700 на 200 МГц медленнее, чем i9 9900k.

Так что придётся немного призадушить i9 о частоте, кроме того у этого процессора TDP 65 Ватт, которые я и выставлю вместо штатных для i9 95 Ватт.

Тут уже, почему старый i7 2011 года на 95 Ватт, а новый на 65 — вопрос не ко мне, я лишь делаю так, чтобы было всё по заявленным характеристикам. 

Ещё сложнее дела обстоят с памятью. Для старого i7 — это штатные 1333 МГц со всеми таймингами согласно JEDEC стандарту.

А вот для десятого поколения нужно выставить заявленные 2933 МГц и проблема в том, что сколько бы я не искал — ни одной планки памяти в продаже именно с JEDEC таймингами на частоте 2933 МГц я не нашёл, чтобы посмотреть что там выставляется.

В самом стандарте для 2933 МГц несколько модификаций, и какая была бы в обычных планках в продаже я без понятия, потому что все планки на 2933 не JEDEC, а с XMP профилями. Я возьму за основу ту, что даёт время до ответа менее 15 нс.

В других частотах именно такой стандарт основной, но прочих субтаймингов для памяти не указано, так что всё остальное я отдал на откуп своей материнской плате.

Синтетические тесты

Cinebench R15

8 поточный дестилетный i7 набрал почти 600 баллов

Современный, уже 16 поточный i7 набрал больше 1500 баллов.

Прирост почти +162%.

Для понимания — показания старого i7 во всех тестах — это 100%, а я буду называть в процентах значения свыше этих базовых 100. То есть, если кто не понял — +100% — это увеличение производительности в два раза. +200 процентов в три раза и т.д.

В общем — тут работает всё как в РПГ играх когда прокачивается персонаж. Тут 5%, там 5%, потом всякие масштабирующие скилы — типа урон сразу двум врагам. Ну и вот так вот жили, вроде каждый год по 5%, частоты по 100-200 МГц в год, когда-то ядер поднасыпали. И вроде как каждый год по чуть-чуть рост был, а в итоге — всё же появился значимый прирост.

Cinebench R20

В более новом Cb R20 ситуация похожа — прирост +189%, то есть новый i7 почти в три раза быстрее старого.

Дальше пройдёмся по бенчмаркам, которые ещё любят низкие задержки памяти и быструю память. Всё же не только сами процессоры менялись. Менялись и платформы, в том числе с поддержкой DDR4.

7-Zip архиватор

7 Zip архиватор. Прирост примерно те же +188%, то есть опять почти в три раза.

Win-rar архиватор

2gen
10gen

В Win-rar прирост и того больше — почти +218%, то есть более, чем в три раза.

В общем — если брать в расчёт ещё и переход на DDR4, то преимущество новинок становится ещё заметнее.

Сравнение в играх

Я брал только игры с бенчмарками для большей повторяемости результатов. Во всех играх (кроме RDR2) настройки максимальные или пресетом максимальные, но со сниженным разрешением и, если такие настройки есть, то со снижением разрешения рендеринга до минимально доступного этими настройками. В тесте использовалась RTX 2070. Всё это для того чтобы не ограничиваться видеокартой, но при этом использовать все технологии в играх, так как часть технологий может отдельно параллелится на ядрах и поэтому максимальные настройки важны.

CPU тест 3D Mark TS

GTA V

Я брал в расчёт только последнюю сцену с полётом на самолёте и далее проезд через город.

По медианному FPS новый i7 обходит старый на 94%, то есть почти в два раза около 100 FPS против примерно 50.

Far Cry 5

Тоже уже далеко не новинка.

Прирост практически ровно в два раза. 66 против 132 FPS. Эти две игры не очень хорошо работают с 16 потоками, но зато хорошо работают с высокими частотами ядер.

Дальше же будут игры по новее.

Shadow of the Tomb Raider

Данные по последней сцене с горами и рынком.

На старом i7 сцена не успела погрузиться в самом начале, так что есть затуп, который видно на графиках времени кадров.

53 против 121 кадра в секунду.

Или + почти 129% к производительности.

Tom Clancy’s The Division 2

В ней у меня не записался лог времени кадра на старом i7, так что довольствуемся только результатами из бенчмарка

78 FPS на старом i7 и 171 на новом. Разница +119%. То есть тоже более, чем в два раза.

World War Z

Старый i7 — примерно 107 FPS. новый — около 185. Прирост +73%.

То есть поменьше, чем в два раза.

Red Dead Redemption 2

Учитывалась в тесте только последняя сцена с проездом через город и перестрелкой.

Правда нет у меня уверенности, что с новым i7 удалось не упираться в видеокарту. Загрузка карты уже приближалась к максимальной. И это единственная игра, в которой настройки стояли далёкие от максимальных, опять же из-за того, что не удавалось разгрузить карту чтобы сравнивать именно процессоры.

Старый i7 смог выдать около 70 FPS, новый около 124. И пророст +83%.

То есть опять меньше, чем в два раза.

Выводы

Ну и теперь к выводам именно по тестам.

В играх, можно говорить о приросте примерно в два раза. Много это или мало за десять лет — сказать сложно. Вроде как в два раза — это много. Но как вспоминаешь чем занимался 10 лет назад, и как давно это было — вроде как прирост в два раза — не так уж и много.

Что касается чистой производительности, то есть без скидок на невозможность оптимизации игр под 16 потоков, то прирост уже доходит до трехкратного. опять же — вроде как и много, но глядя на то, что это за 10 лет — не так уж и много.

С другой стороны — надо понимать, что все эти краты выжимались по сути из одной и той же микроархитектуры небольшими изменениями, которые диктовало время и позволяли реализовывать новые техпроцессы и особенности литографии и более быстрая память. То что из уже хорошей микроархитектуры удалось столько выдавить — это не плохо. Другой вопрос — долго ли можно будет ещё из неё что-то выжимать?

Что касается перспективы непосредственно сенди брич в современном мире, то стоит сказать, что особо сложностей система не создаёт, то есть нет проблем с драйверами или чем-то таким. Процессор поддерживает довольно современный набор инструкций, так что с этим процессором ещё не скоро удастся увидеть сообщения о несовместимости с каким-то софтом. По ощущениям в самой операционной системе — отклик, конечно, не столь хороший, как на более частотных процессорах, но всё равно — сносный. В играх, конечно, уже не всё так хорошо, если мы не говорим про i7 под разгон. Разгон на сенди брич процессора и памяти может сильно изменить ситуацию. Если же говорить про обычный i7, то 60 FPS везде он выдать на ультра настройках не может. Надо дальность прорисовки снижать или детализацию мира, если такие настройки в играх есть. В таком случае, получить стабильные 60 FPS можно в текущий момент, наверное, во всех играх за исключением игр с бегающими тысячами мобов.

Ну в общем старичёк, но пока ещё очень бодрый, однако — собирать на нём сейчас что-то с нуля — смысла уже никакого нет. Учитывая сложность найти хорошую материнскую плату, и стоимость этих материнок. Не шибко дороже будет уже что-то более современное из процессоров, но не топовых линеек.

Видео на YouTube канале "Этот компьютер"

Добавить комментарий