Diferencia entre revisiones de «SSE4»

Línea 1: Línea 1:
{{Desarrollo}}
 
 
{{Ficha Hardware
 
{{Ficha Hardware
 
| nombre = SSE4.
 
| nombre = SSE4.
Línea 16: Línea 15:
  
 
==Instrucciones==
 
==Instrucciones==
 +
===Algunas de las instrucciones de SSE4.1===
 +
*'''mpsadbw''' - Suma de las restas absolutas. Calcula 8 sumas de desplazamientos de restas absoultas, 4 a la vez.
 +
  |x0−y0|+|x1−y1|+|x2−y2|+|x3−y3|,|x0−y1|+|x1−y2|+|x2−y3|+|x3−y4|,...,|x0−y7|+|x1−y8|+|x2−y9|+|x3−y10|)
 +
 +
*'''phminposuw''' - Extracción del índice+mínimo (16bit word).
 +
*'''pmuldq''' - Multiplicación empaquetada.
 +
*'''dpps''' - Producto de punto, de simple precisión.
 +
*'''dppd''' - Producto de punto, de doble precisión.
 +
*'''blendps''' - Copia condicional.
 +
*'''inserps''' - complex data shuffling
 +
===Algunas de las instrucciones de SSE4.2===
 +
 +
*'''CRC32''' - Acumula el valor [[CRC32C]] usando el polinomio 0x11EDC6F41.
 +
*'''pcmpestri''' - Compara la longitud explícita de cadenas, devuelve el Index.
 +
*'''pcmpgtq''' - Comparación empaquetada, mayor que.
 +
*'''popcnt''' - Conteo de población.
 +
 +
===Algunas de las instrucciones de SSE4a===
 +
*'''lzcnt''' - Leading Zero Count.
 +
*'''extrq''' - Operación de Máscara de desplazamiento.
 +
*'''movntsd''' - Movimiento de doble precisión No-temporal.
  
 
==Véase también==
 
==Véase también==
 +
*[[SSE]]
 +
*[[SSE2]]
 +
*[[SSE3]]
 +
*[[SSSE3]]
  
 
==Fuentes==
 
==Fuentes==

Revisión del 09:57 11 may 2011

SSE4.
Información sobre la plantilla
SSE.jpg
SSE4 compuesta por SSE4.1, SSE4.2, y SSE4a posee 54 nuevas instrucciones.

SSE4 es un conjunto de instrucciones que amplía la capacidad de las anteriores SSE. Fue formalmente anunciada el 27 de Septiembre del 2006 y volviéndose disponible en hardware a principios del 2007 para ambos procesadores Intel y AMD.

Instrucciones

Algunas de las instrucciones de SSE4.1

  • mpsadbw - Suma de las restas absolutas. Calcula 8 sumas de desplazamientos de restas absoultas, 4 a la vez.
 |x0−y0|+|x1−y1|+|x2−y2|+|x3−y3|,|x0−y1|+|x1−y2|+|x2−y3|+|x3−y4|,...,|x0−y7|+|x1−y8|+|x2−y9|+|x3−y10|)
  • phminposuw - Extracción del índice+mínimo (16bit word).
  • pmuldq - Multiplicación empaquetada.
  • dpps - Producto de punto, de simple precisión.
  • dppd - Producto de punto, de doble precisión.
  • blendps - Copia condicional.
  • inserps - complex data shuffling

Algunas de las instrucciones de SSE4.2

  • CRC32 - Acumula el valor CRC32C usando el polinomio 0x11EDC6F41.
  • pcmpestri - Compara la longitud explícita de cadenas, devuelve el Index.
  • pcmpgtq - Comparación empaquetada, mayor que.
  • popcnt - Conteo de población.

Algunas de las instrucciones de SSE4a

  • lzcnt - Leading Zero Count.
  • extrq - Operación de Máscara de desplazamiento.
  • movntsd - Movimiento de doble precisión No-temporal.

Véase también

Fuentes