Diferencia entre revisiones de «SSE4»
| Línea 1: | Línea 1: | ||
| − | |||
{{Ficha Hardware | {{Ficha Hardware | ||
| nombre = SSE4. | | nombre = SSE4. | ||
| Línea 16: | Línea 15: | ||
==Instrucciones== | ==Instrucciones== | ||
| + | ===Algunas de las instrucciones de SSE4.1=== | ||
| + | *'''mpsadbw''' - Suma de las restas absolutas. Calcula 8 sumas de desplazamientos de restas absoultas, 4 a la vez. | ||
| + | |x0−y0|+|x1−y1|+|x2−y2|+|x3−y3|,|x0−y1|+|x1−y2|+|x2−y3|+|x3−y4|,...,|x0−y7|+|x1−y8|+|x2−y9|+|x3−y10|) | ||
| + | |||
| + | *'''phminposuw''' - Extracción del índice+mínimo (16bit word). | ||
| + | *'''pmuldq''' - Multiplicación empaquetada. | ||
| + | *'''dpps''' - Producto de punto, de simple precisión. | ||
| + | *'''dppd''' - Producto de punto, de doble precisión. | ||
| + | *'''blendps''' - Copia condicional. | ||
| + | *'''inserps''' - complex data shuffling | ||
| + | ===Algunas de las instrucciones de SSE4.2=== | ||
| + | |||
| + | *'''CRC32''' - Acumula el valor [[CRC32C]] usando el polinomio 0x11EDC6F41. | ||
| + | *'''pcmpestri''' - Compara la longitud explícita de cadenas, devuelve el Index. | ||
| + | *'''pcmpgtq''' - Comparación empaquetada, mayor que. | ||
| + | *'''popcnt''' - Conteo de población. | ||
| + | |||
| + | ===Algunas de las instrucciones de SSE4a=== | ||
| + | *'''lzcnt''' - Leading Zero Count. | ||
| + | *'''extrq''' - Operación de Máscara de desplazamiento. | ||
| + | *'''movntsd''' - Movimiento de doble precisión No-temporal. | ||
==Véase también== | ==Véase también== | ||
| + | *[[SSE]] | ||
| + | *[[SSE2]] | ||
| + | *[[SSE3]] | ||
| + | *[[SSSE3]] | ||
==Fuentes== | ==Fuentes== | ||
Revisión del 09:57 11 may 2011
| ||||
SSE4 es un conjunto de instrucciones que amplía la capacidad de las anteriores SSE. Fue formalmente anunciada el 27 de Septiembre del 2006 y volviéndose disponible en hardware a principios del 2007 para ambos procesadores Intel y AMD.
Sumario
Instrucciones
Algunas de las instrucciones de SSE4.1
- mpsadbw - Suma de las restas absolutas. Calcula 8 sumas de desplazamientos de restas absoultas, 4 a la vez.
|x0−y0|+|x1−y1|+|x2−y2|+|x3−y3|,|x0−y1|+|x1−y2|+|x2−y3|+|x3−y4|,...,|x0−y7|+|x1−y8|+|x2−y9|+|x3−y10|)
- phminposuw - Extracción del índice+mínimo (16bit word).
- pmuldq - Multiplicación empaquetada.
- dpps - Producto de punto, de simple precisión.
- dppd - Producto de punto, de doble precisión.
- blendps - Copia condicional.
- inserps - complex data shuffling
Algunas de las instrucciones de SSE4.2
- CRC32 - Acumula el valor CRC32C usando el polinomio 0x11EDC6F41.
- pcmpestri - Compara la longitud explícita de cadenas, devuelve el Index.
- pcmpgtq - Comparación empaquetada, mayor que.
- popcnt - Conteo de población.
Algunas de las instrucciones de SSE4a
- lzcnt - Leading Zero Count.
- extrq - Operación de Máscara de desplazamiento.
- movntsd - Movimiento de doble precisión No-temporal.