SSE4

SSE4.
Información sobre la plantilla
SSE.jpg
SSE4 compuesta por SSE4.1, SSE4.2, y SSE4a posee 54 nuevas instrucciones.

SSE4 es un conjunto de instrucciones que amplía la capacidad de las anteriores SSE. Fue formalmente anunciada el 27 de septiembre de 2006 y volviéndose disponible en hardware a principios del 2007 para ambos procesadores Intel y AMD.

Instrucciones

Algunas de las instrucciones de SSE4.1

  • mpsadbw - Suma de las restas absolutas. Calcula 8 sumas de desplazamientos de restas absoultas, 4 a la vez: |x0−y0|+|x1−y1|+|x2−y2|+|x3−y3|,|x0−y1|+|x1−y2|+|x2−y3|+|x3−y4|,...,|x0−y7|+|x1−y8|+|x2−y9|+|x3−y10|)
  • phminposuw - Extracción del índice+mínimo (16bit word).
  • pmuldq - Multiplicación empaquetada.
  • dpps - Producto de punto, de simple precisión.
  • dppd - Producto de punto, de doble precisión.
  • blendps - Copia condicional.
  • inserps - complex data shuffling

Algunas de las instrucciones de SSE4.2

  • CRC32 - Acumula el valor CRC32C usando el polinomio 0x11EDC6F41.
  • pcmpestri - Compara la longitud explícita de cadenas, devuelve el Index.
  • pcmpgtq - Comparación empaquetada, mayor que.
  • popcnt - Conteo de población.

Algunas de las instrucciones de SSE4a

Estas instrucciones solo están presente en la arquitectura Barcelona de AMD.

  • lzcnt - Leading Zero Count.
  • extrq - Operación de Máscara de desplazamiento.
  • movntsd - Movimiento de doble precisión No-temporal.

Véase también

Fuentes