Accelerated fix processing via avx2 vector instructions

What is CPU Ratio Offset?

Before we dive into the specifics of AVX, let’s grasp the fundamental concept of CPU ratio offset. The ratio essentially represents the multiplier applied to the base clock frequency to determine the overall operating frequency of the processor. The ratio is a key factor in defining the performance.

source: evga

CPU ratio offset, on the other hand, introduces a dynamic element to this equation. It allows users to adjust the ratio based on specific conditions or workloads. This flexibility is particularly valuable when dealing with tasks that demand varying levels of computational power.

The Different SIMD Instruction Sets on x86 CPUs

The history of SIMD on x86 CPU’s starts with the MMX family of instructions on the Pentium in 1997. But we can skip that early stage and go straight to the SSE2 family. The reason this family is so important is it’s the most recent one guaranteed to be supported by all 64-bit X86 CPU.

SSE2 supports a wide variety of mathematical and logical operations on 4 floating point values and as well as packed 8, 16, 32, and 64bit integer types. All the SIMD from the previous article was limited to SSE2 or earlier instructions as the default settings for the compiler is to produce code that is compatible with all 64-bit X86 CPU’s.

There have been many instruction families released after SSE2. The ones that followed directly are SSE3, SSSE3, SSE4.1, and SSE4.2. As the naming suggests these are all incremental upgrades. They added new instructions that make it easier to optimise a broader variety of applications using SIMD. But the number of floating point values processed by each instruction remained at four.

When Intel introduced AVX in 2011, it was a major change as it introduced registers that are 256 bits wide, meaning instructions could support up to eight floats. AVX2 was introduced in 2016, and while it didn’t increase the size of the registers, it did add new instructions that made using these wider registers easier.

The newest instructions added are in the AVX512 family. As the name suggests it increases the register size to 512 bits, doubling the number of floats that can be processed in a single instruction to sixteen.

Hardware surveys

In evaluating what instructions families we want to support, it can be useful to look at data sets for a large number of users.

The Steam Hardware Survey is the best such available data.

Instruction Family	Percentage of Steam Users with Computers that Support It (April 2020)
SSE2	100%
SSE3	100.00%
SSSE3	98.52%
SSE4.1	97.80%
SSE4.2	97.05%
AVX	92.25%
AVX2	73.88%
AVX512F	0.30%

We can see that because SSE2 first appeared on CPUs in 2000 and is mandatory on 64 bit, its support level in 2020 is at 100%. But the trend is the newer the instruction family the lower its support in CPUs in the wild.

Be aware that this survey largely reflects western gamers and might not capture other types of users well.

Что нужно знать перед разгоном

Разогнать можно не каждый процессор и далеко не на каждой материнской плате. У AMD разгоняются почти все процессоры линейки Ryzen и FX, а у Intel только модели с индексом K или X в конце. Что касается материнских плат, то для AMD Ryzen разгон поддерживают платы на чипсетах B350, B450, X370 и X470. У Intel это платы с буквой Z или X в названии чипсета — например, Z390 или X99.

На производительность процессора оказывают влияние три фактора:

архитектура,
количество ядер и потоков,
частота.

Частота — самый важный показатель. Она представляет собой произведение множителя и частоты шины, которая обычно равна 100 МГц. Это постоянная величина, которая колеблется незначительно. А вот множитель — вещь изменчивая. Во время простоя он уменьшается, чтобы процессор не работал на полную мощность вхолостую и не тратил электроэнергию, а при нагрузке, наоборот, увеличивается, повышая частоту по всем ядрам до максимальной возможного базового значения.

Как высчитывается частота процессора

Современные процессоры используют технологию TurboBoost, которая позволяет за счёт множителя увеличивать частоту одного или нескольких ядер. Но разгоном это назвать сложно, потому что TurboBoost заложен в процессор производителем и работает по умолчанию на всех устройствах, которые его поддерживают.

Тогда что такое разгон? По факту это увеличение частоты вручную, призванное повысить производительность процессора. Разгон предполагает значительное увеличение частоты, чего не может позволить себе TurboBoost.

Технология Intel

Как мы выяснили, влиять на частоту процессора можно через множители или через шину. Обычно процессоры Intel гонят по множителю, потому что точных данных о влиянии на производительность при разгоне по шине нет. Разгон по множителю выполнить намного проще, так что он оптимален для новичков.

Но нельзя просто увеличить частоту и получить максимальную производительность. В дело вступает напряжение. Чем выше частота, тем большее напряжение требуется. При увеличении напряжения процессор начинает сильно греться. Какой-то нагрев кулер сможет компенсировать, но дальше устройство начнёт перегреваться. При перегреве процессор начинает отключаться или пропускать такты — это называется троттлингом.

Максимальная температура для процессоров Intel и AMD Ryzen — около 100 градусов

Но важно понимать, что после разгона даже в жёстком стресс-тесте температура не должна превышать 95 градусов, а при постоянной работе — не быть выше 85 градусов. . Суть процесса разгона сводится к тому, чтобы частота процессора была максимальной, а напряжение и температура — минимальными

Сложность в том, что все процессоры разные, даже если они выпущены в один день в одной партии. Поэтому никто не знает идеальных параметров — их придётся подбирать самостоятельно. Мы будем разгонять процессор от Intel

Суть процесса разгона сводится к тому, чтобы частота процессора была максимальной, а напряжение и температура — минимальными. Сложность в том, что все процессоры разные, даже если они выпущены в один день в одной партии. Поэтому никто не знает идеальных параметров — их придётся подбирать самостоятельно. Мы будем разгонять процессор от Intel.

Приложения

Подходит для вычислений с большим объемом операций с плавающей запятой в мультимедийных, научных и финансовых приложениях (в AVX2 добавлена поддержка целочисленных операций).
Увеличивает параллелизм и пропускную способность в вычислениях SIMD с плавающей запятой .
Уменьшает нагрузку на регистр за счет неразрушающих инструкций.
Повышает производительность программного обеспечения Linux RAID (требуется AVX2, AVX недостаточно)

Программное обеспечение

Blender использует AVX, AVX2 и AVX-512 в движке рендеринга Cycles.
Bloombase использует AVX, AVX2 и AVX-512 в своем криптографическом модуле Bloombase (BCM).
Botan использует как AVX, так и AVX2, когда они доступны, для ускорения некоторых алгоритмов, например ChaCha.
Crypto ++ использует как AVX, так и AVX2, когда они доступны, для ускорения некоторых алгоритмов, таких как Salsa и ChaCha.
OpenSSL использует криптографические функции, оптимизированные для AVX и AVX2, начиная с версии 1.0.2. Эта поддержка также присутствует в различных клонах и форках, таких как LibreSSL.
Prime95 / MPrime, программное обеспечение, используемое для GIMPS , начало использовать инструкции AVX, начиная с версии 27.x.
Декодер dav1d AV1 может использовать AVX2 на поддерживаемых процессорах.
Программное обеспечение dnetc , используемое распределенным.net , имеет ядро AVX2, доступное для его проекта RC5, и скоро выпустит его для своего проекта OGR-28.
Einstein @ Home использует AVX в некоторых из своих распределенных приложений, которые ищут гравитационные волны .
Folding @ home использует AVX на вычислительных ядрах, реализованных с помощью библиотеки GROMACS .
Helios использует аппаратное ускорение AVX и AVX2 на 64-битном оборудовании x86.
Horizon: Zero Dawn использует AVX1 в своем игровом движке Decima.
RPCS3 , эмулятор PlayStation 3 с открытым исходным кодом, использует инструкции AVX2 и AVX-512 для эмуляции игр для PS3.
Интерфейс сетевого устройства , IP-видео / аудиопротокол, разработанный NewTek для производства прямых трансляций, использует AVX и AVX2 для повышения производительности.
Для TensorFlow, начиная с версии 1.6, и для тензорных потоков выше версий требуется, чтобы ЦП поддерживал как минимум AVX.
Видеокодеры x264 , x265 и VTM могут использовать AVX2 или AVX-512 для ускорения кодирования.
Различные майнеры криптовалюты на базе ЦП (например, пулер для биткойнов и лайткойнов ) используют AVX и AVX2 для различных процедур, связанных с криптографией, включая SHA-256 и scrypt .
libsodium использует AVX в реализации скалярного умножения для алгоритмов Curve25519 и Ed25519 , AVX2 для BLAKE2b , Salsa20 , ChaCha20 , а также AVX2 и AVX-512 в реализации алгоритма Argon2 .
Эталонная реализация кодировщика / декодера VP8 / VP9 с открытым исходным кодом libvpx , использует AVX2 или AVX-512, если они доступны.
FFTW может использовать AVX, AVX2 и AVX-512, когда они доступны.
LLVMpipe, программный модуль рендеринга OpenGL в Mesa, использующий инфраструктуру Gallium и LLVM , использует AVX2, когда он доступен.
Glibc использует AVX2 (с FMA ) для оптимизированной реализации (т.е. , , , , ) различных математических функций в LIBC .
Ядро Linux может использовать AVX или AVX2 вместе с AES-NI в качестве оптимизированной реализации криптографического алгоритма AES-GCM .
Ядро Linux использует AVX или AVX2, когда они доступны, в оптимизированной реализации нескольких других криптографических шифров: Camellia , CAST5 , CAST6 , Serpent , Twofish , MORUS-1280 и других примитивов: Poly1305 , SHA-1 , SHA-256 , SHA-512 , ChaCha20 .
POCL, переносимый язык вычислений, который обеспечивает реализацию OpenCL , по возможности использует AVX, AVX2 и AVX512.
.NET и .NET Framework могут использовать AVX, AVX2 через общее пространство имен.
.NET Core , начиная с версии 2.1 и в большей степени после версии 3.0, может напрямую использовать все встроенные функции AVX, AVX2 через пространство имен.
EmEditor 19.0 и выше использует AVX-2 для ускорения обработки.
Софтсинт Massive X от Native Instruments требует наличия AVX.
Microsoft Teams использует инструкции AVX2 для создания размытого или настраиваемого фона позади участников видеочата и для подавления фонового шума.
simdjson, библиотека синтаксического анализа JSON , использует AVX2 для повышения скорости декодирования.

Do I need AVX?

AVX is an extension to x86 that allows a (quite drastic) speed up in certain floating point operations. AVX will primarily impact media transcoding where it is used in a home server. As just a streaming box, there will be no impact.

Should I disable AVX?

Disabling AVX and FMA3 in the latest version of Prime95 is preferable to using an older version, you’re missing out on a lot of memory handling improvements and bug fixes by deliberately opting to use software that old.

Do I need AVX offset?

If all your pc is used for is games there’s no need for any AVX offset at all. Also the offset has reported issues, it not only drops the cpu speed, but also vcore voltages and this can and will cause instability in some systems, especially if vcore is barely into stable voltages.

What is the difference between AVX and AVX2?

AVX provides new features, new instructions and a new coding scheme. AVX2 (also known as Haswell New Instructions) expands most integer commands to 256 bits and introduces fused multiply-accumulate (FMA) operations.

What is VNNI?

Based on Intel Advanced Vector Extensions 512 (Intel AVX-512), the Intel DL Boost Vector Neural Network Instructions (VNNI) delivers a significant performance improvement by combining three instructions into one—thereby maximizing the use of compute resources, utilizing the cache better, and avoiding potential …

Avx2 ratio offset: что это и как использовать

Avx2 ratio offset (от перевода с англ. «смещение коэффициента Avx2») — это функция, предоставляемая процессорами Intel, позволяющая управлять режимом работы инструкций AVX2 (Advanced Vector Extensions 2). Она позволяет программистам оптимизировать производительность вычислений, учитывая энергетический баланс и обеспечивая более эффективное использование ресурсов процессора.

Когда инструкции AVX2 запускаются на процессоре, они потребляют больше энергии и производят большее тепло, чем другие инструкции. Это особенно актуально для мобильных устройств, таких как ноутбуки и смартфоны, где энергопотребление и тепловыделение являются важными факторами. Avx2 ratio offset позволяет программистам управлять этими параметрами, чтобы достичь оптимального баланса между производительностью и энергоэффективностью.

Для использования avx2 ratio offset необходимо иметь доступ к управлению процессором с помощью операционной системы или библиотеки. Как правило, это требует привилегированных прав пользовательской сессии, поэтому использование avx2 ratio offset может быть ограничено.

Программисту нужно определить цель, которую он хочет достичь с помощью avx2 ratio offset. Например, он может попытаться увеличить производительность при сохранении разумного уровня энергопотребления.
Программист должен узнать, поддерживает ли его процессор функцию avx2 ratio offset, и если да, то какие диапазоны смещения доступны. Это можно сделать, обратившись к документации процессора или с помощью специальной утилиты.
После получения доступа к управлению процессором программист может установить желаемое смещение аппаратного коэффициента AVX2. Это может быть сделано с помощью системного вызова или API. Смещение может быть выражено в процентах или числовых значениях, в зависимости от реализации.
После установки смещения avx2 ratio offset, программист может запустить свои вычисления, используя инструкции AVX2. Процессор будет автоматически управлять режимом работы AVX2, основываясь на установленном смещении, чтобы достичь оптимального баланса производительности и энергоэффективности.

Использование avx2 ratio offset требует внимания и тестирования, чтобы найти оптимальное значение смещения для конкретной задачи и конкретного процессора. Неправильная настройка смещения может привести к снижению производительности или увеличению энергопотребления.

Avx2 ratio offset является мощным инструментом для оптимизации производительности и энергоэффективности вычислений на процессорах Intel с поддержкой инструкций AVX2. Он позволяет программистам точно настраивать режим работы инструкций AVX2, чтобы достичь оптимального баланса между производительностью и энергоэффективностью.

Преимущества и возможности использования

1. Увеличение производительности

Использование инструкций AVX позволяет значительно увеличить производительность программы. Эти инструкции предоставляют доступ к расширенным наборам команд, которые эффективно выполняют параллельные вычисления на множестве данных. Это особенно полезно при работе с матрицами, векторами и другими массивами данных, где можно одновременно обрабатывать несколько элементов за один такт.

При использовании набора инструкций AVX можно значительно снизить время выполнения вычислений, что позволяет значительно ускорить работу программы и повысить ее производительность.

2. Улучшение точности вычислений

AVX инструкции обеспечивают поддержку расширенной арифметики с повышенной точностью

Это особенно важно при работе с числами с плавающей точкой, где даже небольшие погрешности могут оказать существенное влияние на результаты вычислений. Использование AVX позволяет проводить более точные вычисления и увеличивает стабильность и надежность работы программы

3. Параллельная обработка данных

Основной преимуществом AVX инструкций является возможность одновременной обработки нескольких данных. Набор инструкций предоставляет широкий спектр команд для выполнения операций над массивами данных, включая скалярные операции, операции с памятью и математические операции.

Благодаря параллельной обработке данных можно существенно повысить скорость выполнения программы, особенно при работе с большими объемами данных или при выполнении сложных алгоритмов обработки информации.

4. Совместимость с предыдущими версиями

AVX инструкции совместимы с предыдущими версиями инструкций MMX, SSE и SSE2. Это означает, что код, написанный с использованием этих предыдущих наборов инструкций, может быть легко адаптирован для работы с AVX.

Это позволяет максимально использовать возможности новых инструкций без необходимости полной переделки существующего кода, что значительно упрощает процесс оптимизации и улучшения производительности программы.

5. Поддержка различных операционных систем

AVX инструкции поддерживаются различными операционными системами, включая Windows, Linux и macOS. Это обеспечивает возможность использования и оптимизации AVX в различных средах разработки и выполнения программ.

Благодаря широкой поддержке различных операционных систем, AVX инструкции доступны для использования в разнообразных проектах и платформах, что открывает новые возможности для оптимизации и ускорения работы программ.

What is Intel DL boost?

Intel’s Deep Learning Boost (DL Boost) is a marketing name for instruction set architecture features on the x86-64 designed to improve performance on deep learning tasks such as training and inference. DL Boost consists of two sets of features: VNNI — an extension to AVX-512.

Does Ryzen support AVX?

Currently (April 2020) AMD has no processors which support AVX-512 on the market; AMDs current “Zen2” microarchitecture does not support it.

What is my CPU Linux?

You can use one of the following command to find the number of physical CPU cores including all cores on Linux:

lscpu command.
cat /proc/cpuinfo.
top or htop command.
nproc command.
hwinfo command.
dmidecode -t processor command.
getconf _NPROCESSORS_ONLN command.

How many GB is my CPU Linux?

9 Commands to Check CPU Information on Linux

1. /proc/cpuinfo. The /proc/cpuinfo file contains details about individual cpu cores.
lscpu – display information about the CPU architecture. lscpu is a small and quick command that does not need any options.
hardinfo.
lshw.
nproc.
dmidecode.
cpuid.
inxi.

AVX-512

AVX-512 — это 512-битные расширения для 256-битных инструкций SIMD Advanced Vector Extensions для архитектуры набора команд x86, предложенные Intel в июле 2013 года, и поддерживаются процессором Intel Knights Landing .

Инструкции AVX-512 кодируются с новым префиксом EVEX . Он позволяет использовать 4 операнда, 8 новых 64-битных , режим скалярной памяти с автоматическим широковещанием, явное управление округлением и режим адресации сжатой памяти смещения . Ширина файла регистров увеличивается до 512 бит, а общее количество регистров увеличивается до 32 (регистры ZMM0-ZMM31) в режиме x86-64.

AVX-512 состоит из нескольких расширений, не все из которых должны поддерживаться всеми процессорами, их реализующими. Набор инструкций состоит из следующего:

AVX-512 Foundation — добавляет несколько новых инструкций и расширяет большинство 32-битных и 64-битных инструкций SSE-SSE4.1 и AVX / AVX2 с плавающей запятой схемой кодирования EVEX для поддержки 512-битных регистров, масок операций, широковещательной передачи параметров и встроенное округление и контроль исключений
AVX-512 Инструкции по обнаружению конфликтов (CD) — эффективное обнаружение конфликтов, позволяющее векторизовать больше циклов, поддерживается Knights Landing
AVX-512 Exponential and Reciprocal Instructions (ER) — экспоненциальные и взаимные операции, предназначенные для помощи в реализации трансцендентных операций, поддерживаемые Knights Landing
AVX-512 Prefetch Instructions (PF) — новые возможности предварительной выборки, поддерживаемые Knights Landing
AVX-512 Vector Length Extensions (VL) — расширяет большинство операций AVX-512 для работы с регистрами XMM (128-бит) и YMM (256-бит) (включая XMM16-XMM31 и YMM16-YMM31 в режиме x86-64)
AVX-512 Byte and Word Instructions (BW) — расширяет AVX-512 для охвата 8-битных и 16-битных целочисленных операций
AVX-512 Doubleword and Quadword Instructions (DQ) — улучшенные 32-битные и 64-битные целочисленные операции
AVX-512 Integer Fused Multiply Add (IFMA) — объединенное сложение умножения для 512-битных целых чисел.
AVX-512 Vector Byte Manipulation Instructions (VBMI) добавляет команды перестановки векторных байтов, которых нет в AVX-512BW.
AVX-512 Vector Neural Network Instructions Word variable precision (4VNNIW) — векторные инструкции для глубокого обучения.
AVX-512 Fused Multiply Accumulation Packed Single precision (4FMAPS) — векторные инструкции для глубокого обучения.
VPOPCNTDQ — количество битов, установленных в 1.
VPCLMULQDQ — умножение четверных слов без переноса.
AVX-512 Vector Neural Network Instructions (VNNI) — векторные инструкции для глубокого обучения.
AVX-512 Galois Field New Instructions (GFNI) — векторные инструкции для вычисления поля Галуа .
AVX-512 Векторные инструкции AES (VAES) — векторные инструкции для кодирования AES .
AVX-512 Vector Byte Manipulation Instructions 2 (VBMI2) — загрузка байта / слова, сохранение и объединение со сдвигом.
AVX-512 Bit Algorithms (BITALG) — инструкции по манипулированию битами байтов / слов, расширяющие VPOPCNTDQ.
AVX-512 Bfloat16 Floating-Point Instructions (BF16) — векторные инструкции для ускорения AI.
AVX-512 Half-Precision Floating-Point Instructions (FP16) — векторные инструкции для работы с плавающей запятой и комплексными числами с пониженной точностью.

Для всех реализаций требуется только расширение ядра AVX-512F (AVX-512 Foundation), хотя все текущие процессоры также поддерживают CD (обнаружение конфликтов); вычислительные сопроцессоры будут дополнительно поддерживать ER, PF, 4VNNIW, 4FMAPS и VPOPCNTDQ, а центральные процессоры будут поддерживать VL, DQ, BW, IFMA, VBMI, VPOPCNTDQ, VPCLMULQDQ и т. д.

Обновленные инструкции SSE / AVX в AVX-512F используют ту же мнемонику, что и версии AVX; они могут работать с 512-битными регистрами ZMM, а также будут поддерживать 128/256-битные регистры XMM / YMM (с AVX-512VL) и целочисленные операнды байта, слова, двойного слова и четверного слова (с AVX-512BW / DQ и VBMI).

Процессоры с AVX-512

Подмножество AVX-512	F	CD	ER
Intel (2016)	да	да	Нет
Intel Knights Mill (2017)	да	Нет
Intel Skylake-SP , Skylake-X (2017)	Нет	да	Нет
Intel Cannon Lake (2018)	да	Нет
Intel Cascade Lake-SP (2019)	Нет	да	Нет
Intel Ice Lake (2019)	Нет	да	Нет
Intel Tiger Lake (2020 г.)	да
Intel Rocket Lake (2021 год)	Нет

Подготовка к разгону

Все действия по разгону выполняются в BIOS материнской платы. Чтобы в него попасть, при включении компьютера зажимаем клавишу Delete. В BIOS переходим в расширенный (Advanced) режим. Иногда он называется классическим (Classic).

Так выглядит UEFI

Первым делом отключаем все интеловские технологии сохранения энергии. При разгоне они будут только мешать и негативно влиять на стабильность процессора:

Intel Speed Shift Technology.
CPU Enhanced Halt (C1E).
C3 State Support.
C6/C7 State Support.
C8 State Support.
C10 State Support.

Всем перечисленным технология задаём статус Disabled — выключены. Названия параметров могут отличаться в зависимости от версии BIOS, поэтому нужно быть внимательным и уточнить эти моменты для своей модели материнской платы.

Все эти пункты нужно перевести в режим Disabled

Следующий шаг — выставление значения CPU Load-Line Calibration. Этот параметр позволяет уменьшить разницу между напряжением в простое и в нагрузке, решая проблему падения напряжения. У LLC несколько уровней, каждый из которых всё больше снижает разницу. Рекомендуем выбирать плоский уровень, при котором напряжение в простое и нагрузке примерно одинаковое.

Сейчас стоит в Авто

Главная сложность при выборе значения LLC — определить, какая маркировка использована в BIOS материнской платы. На некоторых моделях нужно выбирать первый уровень, на других моделях те же характеристики достигаются на шестом уровне. Понять, какое значение требуется, поможет такое описание.

Надо пробовать

К сожалению, описание встречается не на всех материнских платах. Поэтому часто приходится подбирать LLC опытным путём. Если в процессе разгона вы видите, что напряжение было одним, а при запуске теста оно сильно упало или выросло, то нужно попробовать другой уровень LLC.

AVX Ratio Offset Asrock:

The AVX Ratio Offset feature on ASRock motherboards emerges as a powerful tool. This technology allows users to fine-tune the processor’s performance, optimizing the delicate balance between speed and stability.

source: vortez

Understanding the intricacies of AVX Ratio Offset is crucial. It permits avx2 ratio offset users to set a specific ratio for AVX-related tasks, ensuring the processor adjusts its frequency dynamically when handling workloads.

This feature becomes particularly useful in maintaining system stability, and preventing crashes or overheating during demanding applications utilizing AVX instructions.

ASRock’s implementation of AVX Offset provides enthusiasts with a user-friendly interface for tweaking these settings, allowing for a tailored overclocking experience.

Возможные проблемы при настройке CPU ratio offset для AVX

При настройке CPU ratio offset для AVX, пользователи могут столкнуться с некоторыми проблемами, которые могут повлиять на производительность и стабильность работы компьютера.

1. Повышение температуры процессора: Когда CPU ratio offset для AVX установлен на значение, отличное от нуля, процессор может потреблять больше энергии и вырабатывать больше тепла. Это может привести к увеличению температуры процессора и возникновению проблем с охлаждением. В таких случаях рекомендуется обеспечить достаточное охлаждение системы.

3. Ухудшение производительности для некоторых приложений: Несмотря на то, что CPU ratio offset для AVX может увеличить производительность при выполнении определенных вычислений, некоторые приложения могут получить прямо противоположный эффект и стать медленнее. Это может быть связано с несовместимостью определенных приложений с оптимизациями, включенными в AVX. В таких случаях рекомендуется отключить настройку или использовать альтернативные методы оптимизации производительности.

4. Необходимость тестирования и настройки: Подбор оптимальной настройки CPU ratio offset для AVX может потребовать проведения тестирования различных значений и наборов работы над приложениями, которые вы используете чаще всего. Это может быть длительной и запутанной задачей, требующей определенного опыта и знаний. Рекомендуется уделить достаточно времени на подбор оптимальных значений и тестирование системы после изменения настроек.

Impact Of Avx Instructions On Cpu Performance:

Increased Power Consumption:

AVX instructions lead to higher power usage because the CPU executes more calculations per clock cycle. This increased power consumption can result in elevated energy costs and require more robust cooling solutions to prevent thermal issues.

Elevated Temperatures And Thermal Throttling:

The intensive nature of AVX workloads can cause the CPU to operate at its maximum capacity for extended periods, leading to elevated temperatures. This can trigger thermal throttling mechanisms designed to protect the CPU from overheating. While effective in preventing damage, thermal throttling also reduces performance during these periods.

Complexity In Processor Design And Optimization:

AVX-enabled processors require intricate engineering to efficiently execute specialized instructions while maintaining compatibility with existing software and hardware. This complexity can result in longer development cycles and higher manufacturing costs for AVX-capable CPUs.

Variable Performance Benefits Across Applications:

While AVX instructions offer significant performance gains in certain applications, their benefits may only be fully realized in some scenarios. Some workloads may need to be optimized for parallel execution or may not heavily utilize floating-point operations, limiting the performance improvements achievable with AVX.

Related: Why Is My CPU Overclocking Itself

Подбор частоты и напряжения

Начинать разгон лучше с той частоты, которую процессор использует в TurboBoost. Это значение мы получили во время стресс-теста в AIDA64. Например, если частота составляет 4700 МГц, то нам нужно установить множитель 47 (*100=4700 МГц). Осталось найти подходящие параметры в BIOS материнской платы:

на платах ASUS настройки находятся на вкладке Ai Tweaker или Extreme Tweaker,
на AsRock это OC Tweaker/CPU Configuration,
на MSI — вкладка OC (Overclocking),
на GigaByte — Advanced Frequency Settings/Advanced CPU Core Settings.

Чтобы получить возможность менять значение множителя, необходимо переключиться в режим ручного управления. Он может называться Manual, Expert, Advanced. Без этой настройки регулировка частот недоступна. Также на части плат нужно выставить для CPU Ratio значение Sync All Cores или All Core. После этого можно задавать значение самого множителя — в нашем случае это 47.

Следующий шаг — выставление напряжения. Его можно задавать разными способами. Мы будем делать это вручную. Обычно параметр называется Manual или Override. Его нужно выбрать в настройках материнской платы. После этого можно выставлять напряжение для CPU Vcore. Для Intel рекомендуем начинать с напряжения 1,15-1,2 В.

Владельцам процессоров Intel на сокете 2066 необходимо выполнить ещё одну настройку — при разгоне задать параметру AVX 512 Instruction Core Ratio Negative Offset значение в районе 10-15. Это нужно, чтобы во время проведения стресс-теста процессор не перегревался. На производительность параметр не повлияет.

На этом первый этап разгона завершен. Переходим в раздел Save&Exit и выбираем сохранение профиля. Резервная копия может понадобиться для быстрого восстановления параметров после сброса BIOS.

Это наш профиль

Подробнее об этом мы поговорим позже, а пока сохраняем профиль и нажимаем F10 для применения конфигурации и выхода из BIOS.

Accelerated fix processing via avx2 vector instructions

What is CPU Ratio Offset?