c++ Programming Glossary: movsd

http://stackoverflow.com/questions/4956033/multiply-by-0-optimization

4 15 .globl f .type f @function f .LFB0 .cfi_startproc movsd rdi xmm0 mulsd 8 rdi xmm0 mulsd .LC0 rip xmm0 ret .cfi_endproc..

Is there any advantage to using pow(x,2) instead of x*x, with x double?

http://stackoverflow.com/questions/6321170/is-there-any-advantage-to-using-powx-2-instead-of-xx-with-x-double

y x x x y pow y 2 Assembles to pushq rbp movq rsp rbp movsd rdi xmm0 mulsd xmm0 xmm0 movsd xmm0 rdi movsd rsi xmm0 mulsd.. to pushq rbp movq rsp rbp movsd rdi xmm0 mulsd xmm0 xmm0 movsd xmm0 rdi movsd rsi xmm0 mulsd xmm0 xmm0 movsd xmm0 rsi leave.. movq rsp rbp movsd rdi xmm0 mulsd xmm0 xmm0 movsd xmm0 rdi movsd rsi xmm0 mulsd xmm0 xmm0 movsd xmm0 rsi leave ret So as long..

Fast multiplication/division by 2 for floats and doubles (C/C++)

http://stackoverflow.com/questions/7720668/fast-multiplication-division-by-2-for-floats-and-doubles-c-c

SSE2 is still worse with 3.0 seconds with an inner loop of movsd xmm1 mmword ptr esp eax 8 38h mulsd xmm1 xmm0 movsd mmword ptr.. of movsd xmm1 mmword ptr esp eax 8 38h mulsd xmm1 xmm0 movsd mmword ptr esp eax 8 38h xmm1 inc eax VC10 without arch SSE2..

Why is one loop so much slower than two loops?

http://stackoverflow.com/questions/8547778/why-is-one-loop-so-much-slower-than-two-loops

block is repeated about five times in the full program movsd xmm0 mmword ptr edx 18h addsd xmm0 mmword ptr ecx 20h movsd.. xmm0 mmword ptr edx 18h addsd xmm0 mmword ptr ecx 20h movsd mmword ptr ecx 20h xmm0 movsd xmm0 mmword ptr esi 10h addsd.. xmm0 mmword ptr ecx 20h movsd mmword ptr ecx 20h xmm0 movsd xmm0 mmword ptr esi 10h addsd xmm0 mmword ptr eax 30h movsd..