~jderose/ubuntu/raring/qemu/vde-again

« back to all changes in this revision

Viewing changes to target-i386/ops_sse.h

Committer: Bazaar Package Importer
Author(s): Aurelien Jarno, Aurelien Jarno
Date: 2009-03-07 06:20:34 UTC
mfrom: (1.1.9 upstream)
mto: This revision was merged to the branch mainline in revision 7.
Revision ID: james.westby@ubuntu.com-20090307062034-i3pead4mw653v2el

Tags: 0.10.0-1

http://bugs.debian.org/514462

http://bugs.debian.org/470231

http://bugs.debian.org/415996

http://bugs.debian.org/513210

http://bugs.debian.org/297572

[ Aurelien Jarno ]
* New upstream release:
  - Fix fr-be keyboard mapping (closes: bug#514462).
  - Fix stat64 structure on ppc-linux-user (closes: bug#470231).
  - Add a chroot option (closes: bug#415996).
  - Add evdev support (closes: bug#513210).
  - Fix loop on symlinks in user mode (closes: bug#297572).
  - Bump depends on openbios-sparc.
  - Depends on openbios-ppc.
  - Update 12_signal_powerpc_support.patch.
  - Update 21_net_soopts.patch.
  - Drop 44_socklen_t_check.patch (merged upstream).
  - Drop 49_null_check.patch (merged upstream).
  - Update 64_ppc_asm_constraints.patch.
  - Drop security/CVE-2008-0928-fedora.patch (merged upstream).
  - Drop security/CVE-2007-5730.patch (merged upstream).
* patches/80_stable-branch.patch: add patches from stable branch:
  - Fix race condition between signal handler/execution loop (closes:
    bug#474386, bug#501731).
* debian/copyright: update.
* Compile and install .dtb files:
  - debian/control: build-depends on device-tree-compiler.
  - debian/patches/81_compile_dtb.patch: new patch from upstream.
  - debian/rules: compile and install bamboo.dtb and mpc8544.dtb.

files added:
MAINTAINERS

aio.c

audio/audio_pt_int.c

audio/audio_pt_int.h

audio/esdaudio.c

audio/paaudio.c

balloon.h

block-nbd.c

bsd-user

bsd-user/bsd-mman.h

bsd-user/bsdload.c

bsd-user/elfload.c

bsd-user/errno_defs.h

bsd-user/freebsd

bsd-user/freebsd/strace.list

bsd-user/freebsd/syscall_nr.h

bsd-user/main.c

bsd-user/mmap.c

bsd-user/netbsd

bsd-user/netbsd/strace.list

bsd-user/netbsd/syscall_nr.h

bsd-user/openbsd

bsd-user/openbsd/strace.list

bsd-user/openbsd/syscall_nr.h

bsd-user/path.c

bsd-user/qemu-types.h

bsd-user/qemu.h

bsd-user/signal.c

bsd-user/sparc

bsd-user/sparc/syscall.h

bsd-user/sparc/target_signal.h

bsd-user/sparc64

bsd-user/sparc64/syscall.h

bsd-user/sparc64/target_signal.h

bsd-user/strace.c

bsd-user/syscall.c

bsd-user/syscall_defs.h

bsd-user/uaccess.c

bt-host.c

bt-vhci.c

buffered_file.c

buffered_file.h

cache-utils.c

cache-utils.h

curses.c

curses_keys.h

debian/README.source

debian/libqemu-dev.dirs

debian/libqemu-dev.install

debian/patches/48_signal_terminate.patch

debian/patches/80_stable-branch.patch

debian/patches/81_compile_dtb.patch

debian/patches/security

debian/patches/security/leftover.patch

debian/qemu.dirs

debian/qemu.docs

debian/qemu.install

debian/qemu.links

debian/qemu.manpages

def-helper.h

device_tree.c

device_tree.h

dma-helpers.c

dma.h

feature_to_c.sh

gdb-xml

gdb-xml/arm-core.xml

gdb-xml/arm-neon.xml

gdb-xml/arm-vfp.xml

gdb-xml/arm-vfp3.xml

gdb-xml/cf-core.xml

gdb-xml/cf-fp.xml

gdb-xml/power-altivec.xml

gdb-xml/power-core.xml

gdb-xml/power-fpu.xml

gdb-xml/power-spe.xml

gdb-xml/power64-core.xml

gen-icount.h

hppa-dis.c

hppa.ld

hw/ac97.c

hw/axis_dev88.c

hw/baum.c

hw/baum.h

hw/blizzard.c

hw/blizzard_template.h

hw/bt-hci-csr.c

hw/bt-hci.c

hw/bt-hid.c

hw/bt-l2cap.c

hw/bt-sdp.c

hw/bt.c

hw/bt.h

hw/cbus.c

hw/cs4231a.c

hw/device-hotplug.c

hw/e1000.c

hw/e1000_hw.h

hw/escc.c

hw/escc.h

hw/etraxfs.h

hw/etraxfs_dma.c

hw/etraxfs_dma.h

hw/etraxfs_eth.c

hw/etraxfs_pic.c

hw/fw_cfg.c

hw/fw_cfg.h

hw/g364fb.c

hw/gus.c

hw/gusemu.h

hw/gusemu_hal.c

hw/gusemu_mixer.c

hw/gustate.h

hw/hpet.c

hw/hpet_emul.h

hw/lm832x.c

hw/mac_dbdma.h

hw/mips_jazz.c

hw/msmouse.c

hw/msmouse.h

hw/musicpal.c

hw/nseries.c

hw/omap1.c

hw/omap2.c

hw/omap_clk.c

hw/omap_dma.c

hw/omap_dss.c

hw/omap_sx1.c

hw/onenand.c

hw/openpic.h

hw/pci-hotplug.c

hw/ppc440.c

hw/ppc440.h

hw/ppc440_bamboo.c

hw/ppc4xx_pci.c

hw/ppc_newworld.c

hw/ppce500.h

hw/ppce500_mpc8544ds.c

hw/ppce500_pci.c

hw/rc4030.c

hw/scsi.h

hw/sh_pci.c

hw/sharpsl.h

hw/sm501.c

hw/sm501_template.h

hw/soc_dma.c

hw/soc_dma.h

hw/tc6393xb.c

hw/tc6393xb_template.h

hw/tmp105.c

hw/tosa.c

hw/tsc2005.c

hw/tusb6010.c

hw/twl92230.c

hw/usb-bt.c

hw/usb-musb.c

hw/usb-net.c

hw/usb-serial.c

hw/virtio-balloon.c

hw/virtio-balloon.h

hw/virtio-blk.c

hw/virtio-blk.h

hw/virtio-console.c

hw/virtio-console.h

hw/virtio-net.c

hw/virtio-net.h

hw/virtio.c

hw/virtio.h

hw/zaurus.c

kvm-all.c

kvm.h

libfdt_env.h

linux-user/arm/nwfpe

linux-user/arm/nwfpe/double_cpdo.c

linux-user/arm/nwfpe/extended_cpdo.c

linux-user/arm/nwfpe/fpa11.c

linux-user/arm/nwfpe/fpa11.h

linux-user/arm/nwfpe/fpa11.inl

linux-user/arm/nwfpe/fpa11_cpdo.c

linux-user/arm/nwfpe/fpa11_cpdt.c

linux-user/arm/nwfpe/fpa11_cprt.c

linux-user/arm/nwfpe/fpopcode.c

linux-user/arm/nwfpe/fpopcode.h

linux-user/arm/nwfpe/fpsr.h

linux-user/arm/nwfpe/single_cpdo.c

linux-user/envlist.c

linux-user/envlist.h

linux-user/linux_loop.h

linux-user/qemu-types.h

migration-exec.c

migration-tcp.c

migration.c

migration.h

nbd.c

nbd.h

net-checksum.c

net.c

pc-bios/bamboo.dts

pc-bios/bios-pq

pc-bios/bios-pq/0001_bx-qemu.patch

pc-bios/bios-pq/0002_kvm-bios-update-smbios-table-to-report-memory-above-4g.patch

pc-bios/bios-pq/0003_kvm-bios-generate-mptable-unconditionally.patch

pc-bios/bios-pq/0004_kvm-bios-resolve-memory-device-roll-over-reporting--issues-with-32g-guests.patch

pc-bios/bios-pq/0005_kvm-bios-fix-smbios-memory-device-length-boundary--condition.patch

pc-bios/bios-pq/0006_qemu-bios-use-preprocessor-for-pci-link-routing.patch

pc-bios/bios-pq/0007_bios-add-26-pci-slots,-bringing-the-total-to-32.patch

pc-bios/bios-pq/0008_qemu-bios-provide-gpe-_l0x-methods.patch

pc-bios/bios-pq/0009_qemu-bios-pci-hotplug-support.patch

pc-bios/bios-pq/0010_bios-mark-the-acpi-sci-interrupt-as-connected-to-irq-9.patch

pc-bios/bios-pq/0011_read-additional-acpi-tables-from-a-vm.patch

pc-bios/bios-pq/HEAD

pc-bios/bios-pq/series

pc-bios/mpc8544ds.dts

pc-bios/vgabios-pq

pc-bios/vgabios-pq/HEAD

pc-bios/vgabios-pq/series

pci-ids.txt

posix-aio-compat.c

posix-aio-compat.h

ppc64.ld

qemu-aio.h

qemu-char.c

qemu-lock.h

qemu-log.h

qemu-malloc.c

qemu-nbd.c

qemu-nbd.texi

qemu-sockets.c

qemu-tool.c

rules.mak

savevm.c

softmmu_defs.h

sys-queue.h

target-alpha/helper.h

target-arm/helpers.h

target-arm/iwmmxt_helper.c

target-arm/machine.c

target-arm/neon_helper.c

target-cris/helper.h

target-cris/machine.c

target-i386/TODO

target-i386/helper.h

target-i386/helper_template.h

target-i386/kvm.c

target-i386/machine.c

target-i386/op_helper.c

target-i386/ops_sse_header.h

target-m68k/helpers.h

target-m68k/machine.c

target-mips/helper.h

target-mips/machine.c

target-ppc/helper.h

target-ppc/kvm.c

target-ppc/kvm_ppc.c

target-ppc/kvm_ppc.h

target-ppc/machine.c

target-sh4/helper.h

target-sh4/machine.c

target-sparc/TODO

target-sparc/helper.h

target-sparc/machine.c

tcg/LICENSE

tcg/README

tcg/TODO

tcg/arm

tcg/arm/tcg-target.c

tcg/arm/tcg-target.h

tcg/hppa

tcg/hppa/tcg-target.c

tcg/hppa/tcg-target.h

tcg/i386

tcg/i386/tcg-target.c

tcg/i386/tcg-target.h

tcg/ppc

tcg/ppc/tcg-target.c

tcg/ppc/tcg-target.h

tcg/ppc64

tcg/ppc64/tcg-target.c

tcg/ppc64/tcg-target.h

tcg/sparc

tcg/sparc/tcg-target.c

tcg/sparc/tcg-target.h

tcg/tcg-op.h

tcg/tcg-opc.h

tcg/tcg-runtime.c

tcg/tcg.c

tcg/tcg.h

tcg/x86_64

tcg/x86_64/tcg-target.c

tcg/x86_64/tcg-target.h

tests/alpha

tests/alpha/Makefile

tests/alpha/crt.s

tests/alpha/hello-alpha.c

tests/alpha/test-cond.c

tests/cris/check_ftag.c

tests/cris/check_settls1.c

tests/cris/check_sigalrm.c

tests/test-i386-ssse3.c

tests/test-mmap.c

usb-bsd.c

usb-stub.c

vnc.h

x_keymap.h

files removed:
audio/sys-queue.h

check_ops.sh

debian/docs

debian/install

debian/links

debian/manpages

debian/patches/02_snapshot_use_tmpdir.patch

debian/patches/04_do_not_print_rtc_freq_if_ok.patch

debian/patches/05_non-fatal_if_linux_hd_missing.patch

debian/patches/10_signal_jobs.patch

debian/patches/11_signal_sigaction.patch

debian/patches/22_net_tuntap_stall.patch

debian/patches/31_syscalls.patch

debian/patches/33_syscall_ppc_clone.patch

debian/patches/39_syscall_fadvise64.patch

debian/patches/41_arm_fpa_sigfpe.patch

debian/patches/42_arm_tls.patch

debian/patches/43_arm_cpustate.patch

debian/patches/53_openbios_size.patch

debian/patches/61_pseudotty.patch

debian/patches/62_fix-ptyblocking.patch

debian/patches/63_sparc_build.patch

debian/patches/70_manpage.patch

debian/patches/71_doc.patch

debian/patches/80_ui_curses.patch

debian/patches/81_mips32r2_fpu.patch

debian/patches/82_mips_abs.patch

debian/patches/83_usb-serial.patch

debian/patches/84_rtl8139.patch

debian/patches/85_vvfat.patch

debian/patches/86_df.patch

debian/patches/87_eoi.patch

debian/patches/88_dma.patch

debian/patches/89_braille.patch

debian/patches/90_security.patch

debian/patches/91_security.patch

debian/patches/92_no_shutdown.patch

debian/patches/93_tmpfs.patch

debian/patches/94_security.patch

debian/patches/95_security.patch

debian/patches/96_security.patch

dyngen-op.h

dyngen.c

dyngen.h

hw/mips_pica61.c

hw/omap.c

hw/omap1_clk.c

hw/ppc_chrp.c

hw/slavio_serial.c

i386-vl.ld

linux-user/ppc64

pc-bios/bios.diff

pc-bios/vgabios.diff

target-alpha/op.c

target-alpha/op_helper.h

target-alpha/op_helper_mem.h

target-alpha/op_mem.h

target-alpha/op_template.h

target-arm/nwfpe

target-arm/nwfpe/double_cpdo.c

target-arm/nwfpe/extended_cpdo.c

target-arm/nwfpe/fpa11.c

target-arm/nwfpe/fpa11.h

target-arm/nwfpe/fpa11.inl

target-arm/nwfpe/fpa11_cpdo.c

target-arm/nwfpe/fpa11_cpdt.c

target-arm/nwfpe/fpa11_cprt.c

target-arm/nwfpe/fpopcode.c

target-arm/nwfpe/fpopcode.h

target-arm/nwfpe/fpsr.h

target-arm/nwfpe/single_cpdo.c

target-arm/op.c

target-arm/op_iwmmxt.c

target-arm/op_mem.h

target-arm/op_neon.h

target-arm/op_template.h

target-cris/op.c

target-cris/op_mem.c

target-cris/op_template.h

target-i386/helper2.c

target-i386/op.c

target-i386/opreg_template.h

target-i386/ops_mem.h

target-i386/ops_template.h

target-i386/ops_template_mem.h

target-m68k/op-hacks.h

target-m68k/op.c

target-m68k/op_mem.h

target-mips/fop_template.c

target-mips/op.c

target-mips/op_mem.c

target-mips/op_template.c

target-ppc/op.c

target-ppc/op_helper.h

target-ppc/op_helper_mem.h

target-ppc/op_mem.h

target-ppc/op_mem_access.h

target-ppc/op_template.h

target-sh4/op.c

target-sh4/op_mem.c

target-sparc/fbranch_template.h

target-sparc/fop_template.h

target-sparc/op.c

target-sparc/op_mem.h

target-sparc/op_template.h

translate-op.c

files modified:
COPYING

COPYING.LIB

Changelog

LICENSE

Makefile

Makefile.target

README

TODO

VERSION

a.out.h

alpha-dis.c

arm-semi.c

arm.ld

audio/alsaaudio.c

audio/audio.c

audio/audio.h

audio/audio_int.h

audio/audio_template.h

audio/coreaudio.c

audio/dsound_template.h

audio/dsoundaudio.c

audio/fmodaudio.c

audio/mixeng.c

audio/mixeng.h

audio/mixeng_template.h

audio/noaudio.c

audio/ossaudio.c

audio/rate_template.h

audio/sdlaudio.c

audio/wavaudio.c

audio/wavcapture.c

block-bochs.c

block-cloop.c

block-dmg.c

block-parallels.c

block-qcow.c

block-qcow2.c

block-raw-posix.c

block-raw-win32.c

block-vmdk.c

block-vpc.c

block-vvfat.c

block.c

block.h

block_int.h

bswap.h

cocoa.m

configure

console.c

console.h

cpu-all.h

cpu-defs.h

cpu-exec.c

cris-dis.c

cutils.c

d3des.c

darwin-user/commpage.c

darwin-user/ioctls_types.h

darwin-user/machload.c

darwin-user/main.c

darwin-user/mmap.c

darwin-user/qemu.h

darwin-user/signal.c

darwin-user/syscall.c

debian/changelog

debian/control

debian/copyright

debian/patches/01_nostrip.patch

debian/patches/06_exit_segfault.patch

debian/patches/07_i386_exec_name.patch

debian/patches/12_signal_powerpc_support.patch

debian/patches/21_net_soopts.patch

debian/patches/30_syscall_ipc.patch

debian/patches/32_syscall_sysctl.patch

debian/patches/35_syscall_sockaddr.patch

debian/patches/50_linuxbios_isa_bios_ram.patch

debian/patches/51_linuxbios_piix_ram_size.patch

debian/patches/55_unmux_socketcall.patch

debian/patches/60_ppc_ld.patch

debian/patches/64_ppc_asm_constraints.patch

debian/patches/65_kfreebsd.patch

debian/patches/66_tls_ld.patch

debian/patches/series

debian/qemu-make-debian-root

debian/qemu-make-debian-root.8

debian/qemu-user.1

debian/rules

debian/tundev.c

debian/watch

dis-asm.h

disas.c

disas.h

dyngen-exec.h

elf.h

elf_ops.h

exec-all.h

exec.c

fpu/softfloat-macros.h

fpu/softfloat-native.c

fpu/softfloat-native.h

fpu/softfloat-specialize.h

fpu/softfloat.c

fpu/softfloat.h

gdbstub.c

gdbstub.h

host-utils.h

hostregs_helper.h

hw/acpi.c

hw/adb.c

hw/adlib.c

hw/ads7846.c

hw/alpha_palcode.c

hw/an5206.c

hw/apb_pci.c

hw/apic.c

hw/arm-misc.h

hw/arm_boot.c

hw/arm_gic.c

hw/arm_sysctl.c

hw/arm_timer.c

hw/armv7m.c

hw/armv7m_nvic.c

hw/audiodev.h

hw/boards.h

hw/cdrom.c

hw/cirrus_vga.c

hw/cirrus_vga_rop.h

hw/cs4231.c

hw/cuda.c

hw/devices.h

hw/dma.c

hw/ds1225y.c

hw/dummy_m68k.c

hw/eccmemctl.c *

hw/eepro100.c

hw/es1370.c

hw/esp.c

hw/etraxfs.c

hw/etraxfs_ser.c

hw/etraxfs_timer.c

hw/fdc.c

hw/fdc.h

hw/firmware_abi.h *

hw/flash.h

hw/fmopl.c

hw/grackle_pci.c

hw/gt64xxx.c

hw/gumstix.c

hw/heathrow_pic.c

hw/hw.h

hw/i2c.c

hw/i2c.h

hw/i8254.c

hw/i8259.c

hw/ide.c

hw/integratorcp.c

hw/iommu.c

hw/irq.c

hw/irq.h

hw/isa.h

hw/jazz_led.c

hw/lsi53c895a.c

hw/m48t59.c

hw/mac_dbdma.c

hw/mac_nvram.c

hw/macio.c

hw/mainstone.c

hw/max111x.c

hw/max7310.c

hw/mc146818rtc.c

hw/mcf5206.c

hw/mcf5208.c

hw/mcf_fec.c

hw/mips.h

hw/mips_malta.c

hw/mips_mipssim.c

hw/mips_r4k.c

hw/mips_timer.c

hw/mipsnet.c

hw/mpcore.c

hw/mst_fpga.c

hw/nand.c

hw/ne2000.c

hw/nvram.h

hw/omap.h

hw/omap_i2c.c

hw/omap_lcdc.c

hw/omap_mmc.c

hw/openpic.c

hw/palm.c

hw/parallel.c

hw/pc.c

hw/pc.h

hw/pci.c

hw/pci.h

hw/pci_host.h

hw/pckbd.c

hw/pcmcia.h

hw/pcnet.c

hw/pcspk.c

hw/pflash_cfi01.c

hw/pflash_cfi02.c

hw/piix_pci.c

hw/pl011.c

hw/pl022.c

hw/pl031.c

hw/pl050.c

hw/pl061.c

hw/pl080.c

hw/pl110.c

hw/pl181.c

hw/pl190.c

hw/ppc.c

hw/ppc.h

hw/ppc405.h

hw/ppc405_boards.c

hw/ppc405_uc.c

hw/ppc4xx.h

hw/ppc4xx_devs.c

hw/ppc_mac.h

hw/ppc_oldworld.c

hw/ppc_prep.c

hw/prep_pci.c

hw/primecell.h

hw/ps2.c

hw/ps2.h

hw/ptimer.c

hw/pxa.h

hw/pxa2xx.c

hw/pxa2xx_dma.c

hw/pxa2xx_gpio.c

hw/pxa2xx_keypad.c

hw/pxa2xx_lcd.c

hw/pxa2xx_mmci.c

hw/pxa2xx_pcmcia.c

hw/pxa2xx_pic.c

hw/pxa2xx_template.h

hw/pxa2xx_timer.c

hw/r2d.c

hw/realview.c

hw/realview_gic.c

hw/rtl8139.c

hw/sb16.c

hw/sbi.c

hw/scsi-disk.c

hw/scsi-generic.c

hw/sd.c

hw/sd.h

hw/serial.c

hw/sh.h

hw/sh7750.c

hw/sh7750_regnames.c

hw/sh7750_regs.h

hw/sh_intc.c

hw/sh_intc.h

hw/sh_serial.c

hw/sh_timer.c

hw/shix.c

hw/slavio_intctl.c

hw/slavio_misc.c

hw/slavio_timer.c

hw/smbus.h

hw/smbus_eeprom.c

hw/smc91c111.c

hw/sparc32_dma.c

hw/spitz.c

hw/ssd0303.c

hw/ssd0323.c

hw/ssi-sd.c

hw/stellaris.c

hw/stellaris_enet.c

hw/stellaris_input.c

hw/sun4c_intctl.c

hw/sun4m.c

hw/sun4m.h

hw/sun4u.c

hw/tc58128.c

hw/tcx.c

hw/tsc210x.c

hw/unin_pci.c

hw/usb-hid.c

hw/usb-hub.c

hw/usb-msd.c

hw/usb-ohci.c

hw/usb-uhci.c

hw/usb-wacom.c

hw/usb.c

hw/usb.h

hw/versatile_pci.c

hw/versatilepb.c

hw/vga.c

hw/vga_int.h

hw/vmmouse.c

hw/vmport.c

hw/vmware_vga.c

hw/wm8750.c

i386-dis.c

i386.ld

keymaps.c

keymaps/et

keymaps/fo

keymaps/fr-be

keymaps/is

keymaps/ja

keymaps/modifiers

keymaps/nl

keymaps/sv

kqemu.c

kqemu.h

linux-user/alpha/termbits.h

linux-user/arm/syscall.h

linux-user/arm/termbits.h

linux-user/cris/syscall.h

linux-user/cris/syscall_nr.h

linux-user/cris/termbits.h

linux-user/elfload.c

linux-user/elfload32.c *

linux-user/errno_defs.h

linux-user/flatload.c

linux-user/i386/termbits.h

linux-user/ioctls.h

linux-user/m68k-sim.c

linux-user/m68k/syscall.h

linux-user/m68k/termbits.h

linux-user/main.c

linux-user/mips/target_signal.h

linux-user/mips64/target_signal.h

linux-user/mipsn32/target_signal.h

linux-user/mmap.c

linux-user/path.c

linux-user/ppc/syscall.h

linux-user/ppc/termbits.h

linux-user/qemu.h

linux-user/signal.c

linux-user/sparc/termbits.h

linux-user/sparc64/termbits.h

linux-user/strace.c

linux-user/strace.list

linux-user/syscall.c

linux-user/syscall_defs.h

linux-user/syscall_types.h

linux-user/uaccess.c

linux-user/vm86.c

loader.c

m68k-dis.c

m68k-semi.c

mips-dis.c

monitor.c

net.h

osdep.c

osdep.h

pc-bios/Makefile

pc-bios/README

ppc-dis.c

qemu-char.h

qemu-common.h

qemu-doc.texi

qemu-img.c

qemu-img.texi

qemu-tech.texi

qemu_socket.h

readline.c

s390-dis.c

s390.ld

sdl.c

sdl_keysym.h

sh4-dis.c

slirp/COPYRIGHT

slirp/bootp.c

slirp/cksum.c

slirp/debug.c

slirp/debug.h

slirp/icmp_var.h

slirp/if.c

slirp/ip.h

slirp/ip_icmp.c

slirp/ip_icmp.h

slirp/ip_input.c

slirp/ip_output.c

slirp/libslirp.h

slirp/main.h

slirp/mbuf.c

slirp/mbuf.h

slirp/misc.c

slirp/misc.h

slirp/sbuf.c

slirp/slirp.c

slirp/slirp.h

slirp/slirp_config.h

slirp/socket.c

slirp/socket.h

slirp/tcp.h

slirp/tcp_input.c

slirp/tcp_output.c

slirp/tcp_subr.c

slirp/tcp_timer.c

slirp/tcp_timer.h

slirp/tcp_var.h

slirp/tcpip.h

slirp/tftp.c

slirp/udp.c

slirp/udp.h

softmmu-semi.h

softmmu_exec.h

softmmu_header.h

softmmu_template.h

sparc-dis.c

sparc64.ld

sysemu.h

tap-win32.c

target-alpha/STATUS

target-alpha/cpu.h

target-alpha/exec.h

target-alpha/helper.c

target-alpha/op_helper.c

target-alpha/translate.c

target-arm/cpu.h

target-arm/exec.h

target-arm/helper.c

target-arm/op_addsub.h

target-arm/op_helper.c

target-arm/translate.c

target-cris/cpu.h

target-cris/crisv32-decode.h

target-cris/exec.h

target-cris/helper.c

target-cris/mmu.c

target-cris/mmu.h

target-cris/op_helper.c

target-cris/translate.c

target-i386/cpu.h

target-i386/exec.h

target-i386/helper.c

target-i386/ops_sse.h

target-i386/svm.h

target-i386/translate.c

target-m68k/cpu.h

target-m68k/exec.h

target-m68k/helper.c

target-m68k/m68k-qreg.h

target-m68k/op_helper.c

target-m68k/qregs.def

target-m68k/translate.c

target-mips/TODO

target-mips/cpu.h

target-mips/exec.h

target-mips/helper.c

target-mips/op_helper.c

target-mips/translate.c

target-mips/translate_init.c

target-ppc/cpu.h

target-ppc/exec.h

target-ppc/helper.c

target-ppc/helper_regs.h

target-ppc/op_helper.c

target-ppc/translate.c

target-ppc/translate_init.c

target-sh4/cpu.h

target-sh4/exec.h

target-sh4/helper.c

target-sh4/op_helper.c

target-sh4/translate.c

target-sparc/cpu.h

target-sparc/exec.h

target-sparc/helper.c

target-sparc/op_helper.c

target-sparc/translate.c

tests/Makefile

tests/cris/.gdbinit

tests/cris/Makefile

tests/cris/README

tests/cris/check_btst.s

tests/cris/check_clearfv32.s

tests/cris/check_cmp-2.s

tests/cris/check_movei.s

tests/cris/check_movemr.s

tests/cris/check_movemrv32.s

tests/cris/check_mover.s

tests/cris/check_moverm.s

tests/cris/check_stat3.c

tests/cris/check_stat4.c

tests/cris/check_swap.c

tests/cris/check_xarith.s

tests/cris/crisutils.h

tests/cris/sys.c

tests/cris/testutils.inc

tests/linux-test.c

tests/qruncom.c

tests/sha1.c

tests/test-i386-code16.S

tests/test-i386-shift.h

tests/test-i386.c

tests/test_path.c

texi2pod.pl

thunk.c

thunk.h

translate-all.c

uboot_image.h

usb-linux.c

vgafont.h

vl.c

vnc.c

vnc_keysym.h

vnchextile.h

x_keymap.c

Show diffs side-by-side

added added

removed removed

target-i386/ops_sse.h

* MMX/SSE/SSE2/PNI support

* MMX/3DNow!/SSE/SSE2/SSE3/SSSE3/SSE4/PNI support

* This library is free software; you can redistribute it and/or

* modify it under the terms of the GNU Lesser General Public

* You should have received a copy of the GNU Lesser General Public

* License along with this library; if not, write to the Free Software

* Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA

* Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston MA 02110-1301 USA

#if SHIFT == 0

#define Reg MMXReg

#define SUFFIX _xmm

#endif

void OPPROTO glue(op_psrlw, SUFFIX)(void)

void glue(helper_psrlw, SUFFIX)(Reg *d, Reg *s)

{

Reg *d, *s;

int shift;

d = (Reg *)((char *)env + PARAM1);

s = (Reg *)((char *)env + PARAM2);

if (s->Q(0) > 15) {

d->Q(0) = 0;

#if SHIFT == 1

d->W(7) >>= shift;

#endif

}

FORCE_RET();

}

void OPPROTO glue(op_psraw, SUFFIX)(void)

void glue(helper_psraw, SUFFIX)(Reg *d, Reg *s)

{

Reg *d, *s;

int shift;

d = (Reg *)((char *)env + PARAM1);

s = (Reg *)((char *)env + PARAM2);

if (s->Q(0) > 15) {

shift = 15;

} else {

#endif

}

void OPPROTO glue(op_psllw, SUFFIX)(void)

void glue(helper_psllw, SUFFIX)(Reg *d, Reg *s)

{

Reg *d, *s;

int shift;

d = (Reg *)((char *)env + PARAM1);

s = (Reg *)((char *)env + PARAM2);

100

if (s->Q(0) > 15) {

101

d->Q(0) = 0;

102

#if SHIFT == 1

115

103

d->W(7) <<= shift;

116

104

#endif

117

105

}

118

FORCE_RET();

119

106

}

120

107

121

void OPPROTO glue(op_psrld, SUFFIX)(void)

108

void glue(helper_psrld, SUFFIX)(Reg *d, Reg *s)

122

109

{

123

Reg *d, *s;

124

110

int shift;

125

111

126

d = (Reg *)((char *)env + PARAM1);

127

s = (Reg *)((char *)env + PARAM2);

128

129

112

if (s->Q(0) > 31) {

130

113

d->Q(0) = 0;

131

114

#if SHIFT == 1

140

123

d->L(3) >>= shift;

141

124

#endif

142

125

}

143

FORCE_RET();

144

126

}

145

127

146

void OPPROTO glue(op_psrad, SUFFIX)(void)

128

void glue(helper_psrad, SUFFIX)(Reg *d, Reg *s)

147

129

{

148

Reg *d, *s;

149

130

int shift;

150

131

151

d = (Reg *)((char *)env + PARAM1);

152

s = (Reg *)((char *)env + PARAM2);

153

154

132

if (s->Q(0) > 31) {

155

133

shift = 31;

156

134

} else {

164

142

#endif

165

143

}

166

144

167

void OPPROTO glue(op_pslld, SUFFIX)(void)

145

void glue(helper_pslld, SUFFIX)(Reg *d, Reg *s)

168

146

{

169

Reg *d, *s;

170

147

int shift;

171

148

172

d = (Reg *)((char *)env + PARAM1);

173

s = (Reg *)((char *)env + PARAM2);

174

175

149

if (s->Q(0) > 31) {

176

150

d->Q(0) = 0;

177

151

#if SHIFT == 1

186

160

d->L(3) <<= shift;

187

161

#endif

188

162

}

189

FORCE_RET();

190

163

}

191

164

192

void OPPROTO glue(op_psrlq, SUFFIX)(void)

165

void glue(helper_psrlq, SUFFIX)(Reg *d, Reg *s)

193

166

{

194

Reg *d, *s;

195

167

int shift;

196

168

197

d = (Reg *)((char *)env + PARAM1);

198

s = (Reg *)((char *)env + PARAM2);

199

200

169

if (s->Q(0) > 63) {

201

170

d->Q(0) = 0;

202

171

#if SHIFT == 1

209

178

d->Q(1) >>= shift;

210

179

#endif

211

180

}

212

FORCE_RET();

213

181

}

214

182

215

void OPPROTO glue(op_psllq, SUFFIX)(void)

183

void glue(helper_psllq, SUFFIX)(Reg *d, Reg *s)

216

184

{

217

Reg *d, *s;

218

185

int shift;

219

186

220

d = (Reg *)((char *)env + PARAM1);

221

s = (Reg *)((char *)env + PARAM2);

222

223

187

if (s->Q(0) > 63) {

224

188

d->Q(0) = 0;

225

189

#if SHIFT == 1

232

196

d->Q(1) <<= shift;

233

197

#endif

234

198

}

235

FORCE_RET();

236

199

}

237

200

238

201

#if SHIFT == 1

239

void OPPROTO glue(op_psrldq, SUFFIX)(void)

202

void glue(helper_psrldq, SUFFIX)(Reg *d, Reg *s)

240

203

{

241

Reg *d, *s;

242

204

int shift, i;

243

205

244

d = (Reg *)((char *)env + PARAM1);

245

s = (Reg *)((char *)env + PARAM2);

246

206

shift = s->L(0);

247

207

if (shift > 16)

248

208

shift = 16;

250

210

d->B(i) = d->B(i + shift);

251

211

for(i = 16 - shift; i < 16; i++)

252

212

d->B(i) = 0;

253

FORCE_RET();

254

213

}

255

214

256

void OPPROTO glue(op_pslldq, SUFFIX)(void)

215

void glue(helper_pslldq, SUFFIX)(Reg *d, Reg *s)

257

216

{

258

Reg *d, *s;

259

217

int shift, i;

260

218

261

d = (Reg *)((char *)env + PARAM1);

262

s = (Reg *)((char *)env + PARAM2);

263

219

shift = s->L(0);

264

220

if (shift > 16)

265

221

shift = 16;

267

223

d->B(i) = d->B(i - shift);

268

224

for(i = 0; i < shift; i++)

269

225

d->B(i) = 0;

270

FORCE_RET();

271

226

}

272

227

#endif

273

228

274

#define SSE_OP_B(name, F)\

275

void OPPROTO glue(name, SUFFIX) (void)\

229

#define SSE_HELPER_B(name, F)\

230

void glue(name, SUFFIX) (Reg *d, Reg *s)\

276

231

277

Reg *d, *s;\

278

d = (Reg *)((char *)env + PARAM1);\

279

s = (Reg *)((char *)env + PARAM2);\

280

232

d->B(0) = F(d->B(0), s->B(0));\

281

233

d->B(1) = F(d->B(1), s->B(1));\

282

234

d->B(2) = F(d->B(2), s->B(2));\

297

249

298

250

}

299

251

300

#define SSE_OP_W(name, F)\

301

void OPPROTO glue(name, SUFFIX) (void)\

252

#define SSE_HELPER_W(name, F)\

253

void glue(name, SUFFIX) (Reg *d, Reg *s)\

302

254

303

Reg *d, *s;\

304

d = (Reg *)((char *)env + PARAM1);\

305

s = (Reg *)((char *)env + PARAM2);\

306

255

d->W(0) = F(d->W(0), s->W(0));\

307

256

d->W(1) = F(d->W(1), s->W(1));\

308

257

d->W(2) = F(d->W(2), s->W(2));\

315

264

316

265

}

317

266

318

#define SSE_OP_L(name, F)\

319

void OPPROTO glue(name, SUFFIX) (void)\

267

#define SSE_HELPER_L(name, F)\

268

void glue(name, SUFFIX) (Reg *d, Reg *s)\

320

269

321

Reg *d, *s;\

322

d = (Reg *)((char *)env + PARAM1);\

323

s = (Reg *)((char *)env + PARAM2);\

324

270

d->L(0) = F(d->L(0), s->L(0));\

325

271

d->L(1) = F(d->L(1), s->L(1));\

326

272

XMM_ONLY(\

329

275

330

276

}

331

277

332

#define SSE_OP_Q(name, F)\

333

void OPPROTO glue(name, SUFFIX) (void)\

278

#define SSE_HELPER_Q(name, F)\

279

void glue(name, SUFFIX) (Reg *d, Reg *s)\

334

280

335

Reg *d, *s;\

336

d = (Reg *)((char *)env + PARAM1);\

337

s = (Reg *)((char *)env + PARAM2);\

338

281

d->Q(0) = F(d->Q(0), s->Q(0));\

339

282

XMM_ONLY(\

340

283

d->Q(1) = F(d->Q(1), s->Q(1));\

409

352

#define FCMPEQ(a, b) (a) == (b) ? -1 : 0

410

353

411

354

#define FMULLW(a, b) (a) * (b)

355

#define FMULHRW(a, b) ((int16_t)(a) * (int16_t)(b) + 0x8000) >> 16

412

356

#define FMULHUW(a, b) (a) * (b) >> 16

413

357

#define FMULHW(a, b) (int16_t)(a) * (int16_t)(b) >> 16

414

358

415

359

#define FAVG(a, b) ((a) + (b) + 1) >> 1

416

360

#endif

417

361

418

SSE_OP_B(op_paddb, FADD)

419

SSE_OP_W(op_paddw, FADD)

420

SSE_OP_L(op_paddl, FADD)

421

SSE_OP_Q(op_paddq, FADD)

422

423

SSE_OP_B(op_psubb, FSUB)

424

SSE_OP_W(op_psubw, FSUB)

425

SSE_OP_L(op_psubl, FSUB)

426

SSE_OP_Q(op_psubq, FSUB)

427

428

SSE_OP_B(op_paddusb, FADDUB)

429

SSE_OP_B(op_paddsb, FADDSB)

430

SSE_OP_B(op_psubusb, FSUBUB)

431

SSE_OP_B(op_psubsb, FSUBSB)

432

433

SSE_OP_W(op_paddusw, FADDUW)

434

SSE_OP_W(op_paddsw, FADDSW)

435

SSE_OP_W(op_psubusw, FSUBUW)

436

SSE_OP_W(op_psubsw, FSUBSW)

437

438

SSE_OP_B(op_pminub, FMINUB)

439

SSE_OP_B(op_pmaxub, FMAXUB)

440

441

SSE_OP_W(op_pminsw, FMINSW)

442

SSE_OP_W(op_pmaxsw, FMAXSW)

443

444

SSE_OP_Q(op_pand, FAND)

445

SSE_OP_Q(op_pandn, FANDN)

446

SSE_OP_Q(op_por, FOR)

447

SSE_OP_Q(op_pxor, FXOR)

448

449

SSE_OP_B(op_pcmpgtb, FCMPGTB)

450

SSE_OP_W(op_pcmpgtw, FCMPGTW)

451

SSE_OP_L(op_pcmpgtl, FCMPGTL)

452

453

SSE_OP_B(op_pcmpeqb, FCMPEQ)

454

SSE_OP_W(op_pcmpeqw, FCMPEQ)

455

SSE_OP_L(op_pcmpeql, FCMPEQ)

456

457

SSE_OP_W(op_pmullw, FMULLW)

458

SSE_OP_W(op_pmulhuw, FMULHUW)

459

SSE_OP_W(op_pmulhw, FMULHW)

460

461

SSE_OP_B(op_pavgb, FAVG)

462

SSE_OP_W(op_pavgw, FAVG)

463

464

void OPPROTO glue(op_pmuludq, SUFFIX) (void)

362

SSE_HELPER_B(helper_paddb, FADD)

363

SSE_HELPER_W(helper_paddw, FADD)

364

SSE_HELPER_L(helper_paddl, FADD)

365

SSE_HELPER_Q(helper_paddq, FADD)

366

367

SSE_HELPER_B(helper_psubb, FSUB)

368

SSE_HELPER_W(helper_psubw, FSUB)

369

SSE_HELPER_L(helper_psubl, FSUB)

370

SSE_HELPER_Q(helper_psubq, FSUB)

371

372

SSE_HELPER_B(helper_paddusb, FADDUB)

373

SSE_HELPER_B(helper_paddsb, FADDSB)

374

SSE_HELPER_B(helper_psubusb, FSUBUB)

375

SSE_HELPER_B(helper_psubsb, FSUBSB)

376

377

SSE_HELPER_W(helper_paddusw, FADDUW)

378

SSE_HELPER_W(helper_paddsw, FADDSW)

379

SSE_HELPER_W(helper_psubusw, FSUBUW)

380

SSE_HELPER_W(helper_psubsw, FSUBSW)

381

382

SSE_HELPER_B(helper_pminub, FMINUB)

383

SSE_HELPER_B(helper_pmaxub, FMAXUB)

384

385

SSE_HELPER_W(helper_pminsw, FMINSW)

386

SSE_HELPER_W(helper_pmaxsw, FMAXSW)

387

388

SSE_HELPER_Q(helper_pand, FAND)

389

SSE_HELPER_Q(helper_pandn, FANDN)

390

SSE_HELPER_Q(helper_por, FOR)

391

SSE_HELPER_Q(helper_pxor, FXOR)

392

393

SSE_HELPER_B(helper_pcmpgtb, FCMPGTB)

394

SSE_HELPER_W(helper_pcmpgtw, FCMPGTW)

395

SSE_HELPER_L(helper_pcmpgtl, FCMPGTL)

396

397

SSE_HELPER_B(helper_pcmpeqb, FCMPEQ)

398

SSE_HELPER_W(helper_pcmpeqw, FCMPEQ)

399

SSE_HELPER_L(helper_pcmpeql, FCMPEQ)

400

401

SSE_HELPER_W(helper_pmullw, FMULLW)

402

#if SHIFT == 0

403

SSE_HELPER_W(helper_pmulhrw, FMULHRW)

404

#endif

405

SSE_HELPER_W(helper_pmulhuw, FMULHUW)

406

SSE_HELPER_W(helper_pmulhw, FMULHW)

407

408

SSE_HELPER_B(helper_pavgb, FAVG)

409

SSE_HELPER_W(helper_pavgw, FAVG)

410

411

void glue(helper_pmuludq, SUFFIX) (Reg *d, Reg *s)

465

412

{

466

Reg *d, *s;

467

d = (Reg *)((char *)env + PARAM1);

468

s = (Reg *)((char *)env + PARAM2);

469

470

413

d->Q(0) = (uint64_t)s->L(0) * (uint64_t)d->L(0);

471

414

#if SHIFT == 1

472

415

d->Q(1) = (uint64_t)s->L(2) * (uint64_t)d->L(2);

473

416

#endif

474

417

}

475

418

476

void OPPROTO glue(op_pmaddwd, SUFFIX) (void)

419

void glue(helper_pmaddwd, SUFFIX) (Reg *d, Reg *s)

477

420

{

478

421

int i;

479

Reg *d, *s;

480

d = (Reg *)((char *)env + PARAM1);

481

s = (Reg *)((char *)env + PARAM2);

482

422

483

423

for(i = 0; i < (2 << SHIFT); i++) {

484

424

d->L(i) = (int16_t)s->W(2*i) * (int16_t)d->W(2*i) +

485

425

(int16_t)s->W(2*i+1) * (int16_t)d->W(2*i+1);

486

426

}

487

FORCE_RET();

488

427

}

489

428

490

429

#if SHIFT == 0

496

435

return a;

497

436

}

498

437

#endif

499

void OPPROTO glue(op_psadbw, SUFFIX) (void)

438

void glue(helper_psadbw, SUFFIX) (Reg *d, Reg *s)

500

439

{

501

440

unsigned int val;

502

Reg *d, *s;

503

d = (Reg *)((char *)env + PARAM1);

504

s = (Reg *)((char *)env + PARAM2);

505

441

506

442

val = 0;

507

443

val += abs1(d->B(0) - s->B(0));

527

463

#endif

528

464

}

529

465

530

void OPPROTO glue(op_maskmov, SUFFIX) (void)

466

void glue(helper_maskmov, SUFFIX) (Reg *d, Reg *s, target_ulong a0)

531

467

{

532

468

int i;

533

Reg *d, *s;

534

d = (Reg *)((char *)env + PARAM1);

535

s = (Reg *)((char *)env + PARAM2);

536

469

for(i = 0; i < (8 << SHIFT); i++) {

537

470

if (s->B(i) & 0x80)

538

stb(A0 + i, d->B(i));

471

stb(a0 + i, d->B(i));

539

472

}

540

FORCE_RET();

541

473

}

542

474

543

void OPPROTO glue(op_movl_mm_T0, SUFFIX) (void)

475

void glue(helper_movl_mm_T0, SUFFIX) (Reg *d, uint32_t val)

544

476

{

545

Reg *d;

546

d = (Reg *)((char *)env + PARAM1);

547

d->L(0) = T0;

477

d->L(0) = val;

548

478

d->L(1) = 0;

549

479

#if SHIFT == 1

550

480

d->Q(1) = 0;

551

481

#endif

552

482

}

553

483

554

void OPPROTO glue(op_movl_T0_mm, SUFFIX) (void)

555

{

556

Reg *s;

557

s = (Reg *)((char *)env + PARAM1);

558

T0 = s->L(0);

559

}

560

561

484

#ifdef TARGET_X86_64

562

void OPPROTO glue(op_movq_mm_T0, SUFFIX) (void)

485

void glue(helper_movq_mm_T0, SUFFIX) (Reg *d, uint64_t val)

563

486

{

564

Reg *d;

565

d = (Reg *)((char *)env + PARAM1);

566

d->Q(0) = T0;

487

d->Q(0) = val;

567

488

#if SHIFT == 1

568

489

d->Q(1) = 0;

569

490

#endif

570

491

}

571

572

void OPPROTO glue(op_movq_T0_mm, SUFFIX) (void)

573

{

574

Reg *s;

575

s = (Reg *)((char *)env + PARAM1);

576

T0 = s->Q(0);

577

}

578

492

#endif

579

493

580

494

#if SHIFT == 0

581

void OPPROTO glue(op_pshufw, SUFFIX) (void)

495

void glue(helper_pshufw, SUFFIX) (Reg *d, Reg *s, int order)

582

496

{

583

Reg r, *d, *s;

584

int order;

585

d = (Reg *)((char *)env + PARAM1);

586

s = (Reg *)((char *)env + PARAM2);

587

order = PARAM3;

497

Reg r;

588

498

r.W(0) = s->W(order & 3);

589

499

r.W(1) = s->W((order >> 2) & 3);

590

500

r.W(2) = s->W((order >> 4) & 3);

592

502

*d = r;

593

503

}

594

504

#else

595

void OPPROTO op_shufps(void)

505

void helper_shufps(Reg *d, Reg *s, int order)

596

506

{

597

Reg r, *d, *s;

598

int order;

599

d = (Reg *)((char *)env + PARAM1);

600

s = (Reg *)((char *)env + PARAM2);

601

order = PARAM3;

507

Reg r;

602

508

r.L(0) = d->L(order & 3);

603

509

r.L(1) = d->L((order >> 2) & 3);

604

510

r.L(2) = s->L((order >> 4) & 3);

606

512

*d = r;

607

513

}

608

514

609

void OPPROTO op_shufpd(void)

515

void helper_shufpd(Reg *d, Reg *s, int order)

610

516

{

611

Reg r, *d, *s;

612

int order;

613

d = (Reg *)((char *)env + PARAM1);

614

s = (Reg *)((char *)env + PARAM2);

615

order = PARAM3;

517

Reg r;

616

518

r.Q(0) = d->Q(order & 1);

617

519

r.Q(1) = s->Q((order >> 1) & 1);

618

520

*d = r;

619

521

}

620

522

621

void OPPROTO glue(op_pshufd, SUFFIX) (void)

523

void glue(helper_pshufd, SUFFIX) (Reg *d, Reg *s, int order)

622

524

{

623

Reg r, *d, *s;

624

int order;

625

d = (Reg *)((char *)env + PARAM1);

626

s = (Reg *)((char *)env + PARAM2);

627

order = PARAM3;

525

Reg r;

628

526

r.L(0) = s->L(order & 3);

629

527

r.L(1) = s->L((order >> 2) & 3);

630

528

r.L(2) = s->L((order >> 4) & 3);

632

530

*d = r;

633

531

}

634

532

635

void OPPROTO glue(op_pshuflw, SUFFIX) (void)

533

void glue(helper_pshuflw, SUFFIX) (Reg *d, Reg *s, int order)

636

534

{

637

Reg r, *d, *s;

638

int order;

639

d = (Reg *)((char *)env + PARAM1);

640

s = (Reg *)((char *)env + PARAM2);

641

order = PARAM3;

535

Reg r;

642

536

r.W(0) = s->W(order & 3);

643

537

r.W(1) = s->W((order >> 2) & 3);

644

538

r.W(2) = s->W((order >> 4) & 3);

647

541

*d = r;

648

542

}

649

543

650

void OPPROTO glue(op_pshufhw, SUFFIX) (void)

544

void glue(helper_pshufhw, SUFFIX) (Reg *d, Reg *s, int order)

651

545

{

652

Reg r, *d, *s;

653

int order;

654

d = (Reg *)((char *)env + PARAM1);

655

s = (Reg *)((char *)env + PARAM2);

656

order = PARAM3;

546

Reg r;

657

547

r.Q(0) = s->Q(0);

658

548

r.W(4) = s->W(4 + (order & 3));

659

549

r.W(5) = s->W(4 + ((order >> 2) & 3));

667

557

/* FPU ops */

668

558

/* XXX: not accurate */

669

559

670

#define SSE_OP_S(name, F)\

671

void OPPROTO op_ ## name ## ps (void)\

560

#define SSE_HELPER_S(name, F)\

561

void helper_ ## name ## ps (Reg *d, Reg *s)\

672

562

673

Reg *d, *s;\

674

d = (Reg *)((char *)env + PARAM1);\

675

s = (Reg *)((char *)env + PARAM2);\

676

563

d->XMM_S(0) = F(32, d->XMM_S(0), s->XMM_S(0));\

677

564

d->XMM_S(1) = F(32, d->XMM_S(1), s->XMM_S(1));\

678

565

d->XMM_S(2) = F(32, d->XMM_S(2), s->XMM_S(2));\

679

566

d->XMM_S(3) = F(32, d->XMM_S(3), s->XMM_S(3));\

680

567

681

568

682

void OPPROTO op_ ## name ## ss (void)\

569

void helper_ ## name ## ss (Reg *d, Reg *s)\

683

570

684

Reg *d, *s;\

685

d = (Reg *)((char *)env + PARAM1);\

686

s = (Reg *)((char *)env + PARAM2);\

687

571

d->XMM_S(0) = F(32, d->XMM_S(0), s->XMM_S(0));\

688

572

689

void OPPROTO op_ ## name ## pd (void)\

573

void helper_ ## name ## pd (Reg *d, Reg *s)\

690

574

691

Reg *d, *s;\

692

d = (Reg *)((char *)env + PARAM1);\

693

s = (Reg *)((char *)env + PARAM2);\

694

575

d->XMM_D(0) = F(64, d->XMM_D(0), s->XMM_D(0));\

695

576

d->XMM_D(1) = F(64, d->XMM_D(1), s->XMM_D(1));\

696

577

697

578

698

void OPPROTO op_ ## name ## sd (void)\

579

void helper_ ## name ## sd (Reg *d, Reg *s)\

699

580

700

Reg *d, *s;\

701

d = (Reg *)((char *)env + PARAM1);\

702

s = (Reg *)((char *)env + PARAM2);\

703

581

d->XMM_D(0) = F(64, d->XMM_D(0), s->XMM_D(0));\

704

582

}

705

583

711

589

#define FPU_MAX(size, a, b) (a) > (b) ? (a) : (b)

712

590

#define FPU_SQRT(size, a, b) float ## size ## _sqrt(b, &env->sse_status)

713

591

714

SSE_OP_S(add, FPU_ADD)

715

SSE_OP_S(sub, FPU_SUB)

716

SSE_OP_S(mul, FPU_MUL)

717

SSE_OP_S(div, FPU_DIV)

718

SSE_OP_S(min, FPU_MIN)

719

SSE_OP_S(max, FPU_MAX)

720

SSE_OP_S(sqrt, FPU_SQRT)

592

SSE_HELPER_S(add, FPU_ADD)

593

SSE_HELPER_S(sub, FPU_SUB)

594

SSE_HELPER_S(mul, FPU_MUL)

595

SSE_HELPER_S(div, FPU_DIV)

596

SSE_HELPER_S(min, FPU_MIN)

597

SSE_HELPER_S(max, FPU_MAX)

598

SSE_HELPER_S(sqrt, FPU_SQRT)

721

599

722

600

723

601

/* float to float conversions */

724

void OPPROTO op_cvtps2pd(void)

602

void helper_cvtps2pd(Reg *d, Reg *s)

725

603

{

726

604

float32 s0, s1;

727

Reg *d, *s;

728

d = (Reg *)((char *)env + PARAM1);

729

s = (Reg *)((char *)env + PARAM2);

730

605

s0 = s->XMM_S(0);

731

606

s1 = s->XMM_S(1);

732

607

d->XMM_D(0) = float32_to_float64(s0, &env->sse_status);

733

608

d->XMM_D(1) = float32_to_float64(s1, &env->sse_status);

734

609

}

735

610

736

void OPPROTO op_cvtpd2ps(void)

611

void helper_cvtpd2ps(Reg *d, Reg *s)

737

612

{

738

Reg *d, *s;

739

d = (Reg *)((char *)env + PARAM1);

740

s = (Reg *)((char *)env + PARAM2);

741

613

d->XMM_S(0) = float64_to_float32(s->XMM_D(0), &env->sse_status);

742

614

d->XMM_S(1) = float64_to_float32(s->XMM_D(1), &env->sse_status);

743

615

d->Q(1) = 0;

744

616

}

745

617

746

void OPPROTO op_cvtss2sd(void)

618

void helper_cvtss2sd(Reg *d, Reg *s)

747

619

{

748

Reg *d, *s;

749

d = (Reg *)((char *)env + PARAM1);

750

s = (Reg *)((char *)env + PARAM2);

751

620

d->XMM_D(0) = float32_to_float64(s->XMM_S(0), &env->sse_status);

752

621

}

753

622

754

void OPPROTO op_cvtsd2ss(void)

623

void helper_cvtsd2ss(Reg *d, Reg *s)

755

624

{

756

Reg *d, *s;

757

d = (Reg *)((char *)env + PARAM1);

758

s = (Reg *)((char *)env + PARAM2);

759

625

d->XMM_S(0) = float64_to_float32(s->XMM_D(0), &env->sse_status);

760

626

}

761

627

762

628

/* integer to float */

763

void OPPROTO op_cvtdq2ps(void)

629

void helper_cvtdq2ps(Reg *d, Reg *s)

764

630

{

765

XMMReg *d = (XMMReg *)((char *)env + PARAM1);

766

XMMReg *s = (XMMReg *)((char *)env + PARAM2);

767

631

d->XMM_S(0) = int32_to_float32(s->XMM_L(0), &env->sse_status);

768

632

d->XMM_S(1) = int32_to_float32(s->XMM_L(1), &env->sse_status);

769

633

d->XMM_S(2) = int32_to_float32(s->XMM_L(2), &env->sse_status);

770

634

d->XMM_S(3) = int32_to_float32(s->XMM_L(3), &env->sse_status);

771

635

}

772

636

773

void OPPROTO op_cvtdq2pd(void)

637

void helper_cvtdq2pd(Reg *d, Reg *s)

774

638

{

775

XMMReg *d = (XMMReg *)((char *)env + PARAM1);

776

XMMReg *s = (XMMReg *)((char *)env + PARAM2);

777

639

int32_t l0, l1;

778

640

l0 = (int32_t)s->XMM_L(0);

779

641

l1 = (int32_t)s->XMM_L(1);

781

643

d->XMM_D(1) = int32_to_float64(l1, &env->sse_status);

782

644

}

783

645

784

void OPPROTO op_cvtpi2ps(void)

646

void helper_cvtpi2ps(XMMReg *d, MMXReg *s)

785

647

{

786

XMMReg *d = (Reg *)((char *)env + PARAM1);

787

MMXReg *s = (MMXReg *)((char *)env + PARAM2);

788

648

d->XMM_S(0) = int32_to_float32(s->MMX_L(0), &env->sse_status);

789

649

d->XMM_S(1) = int32_to_float32(s->MMX_L(1), &env->sse_status);

790

650

}

791

651

792

void OPPROTO op_cvtpi2pd(void)

652

void helper_cvtpi2pd(XMMReg *d, MMXReg *s)

793

653

{

794

XMMReg *d = (Reg *)((char *)env + PARAM1);

795

MMXReg *s = (MMXReg *)((char *)env + PARAM2);

796

654

d->XMM_D(0) = int32_to_float64(s->MMX_L(0), &env->sse_status);

797

655

d->XMM_D(1) = int32_to_float64(s->MMX_L(1), &env->sse_status);

798

656

}

799

657

800

void OPPROTO op_cvtsi2ss(void)

658

void helper_cvtsi2ss(XMMReg *d, uint32_t val)

801

659

{

802

XMMReg *d = (Reg *)((char *)env + PARAM1);

803

d->XMM_S(0) = int32_to_float32(T0, &env->sse_status);

660

d->XMM_S(0) = int32_to_float32(val, &env->sse_status);

804

661

}

805

662

806

void OPPROTO op_cvtsi2sd(void)

663

void helper_cvtsi2sd(XMMReg *d, uint32_t val)

807

664

{

808

XMMReg *d = (Reg *)((char *)env + PARAM1);

809

d->XMM_D(0) = int32_to_float64(T0, &env->sse_status);

665

d->XMM_D(0) = int32_to_float64(val, &env->sse_status);

810

666

}

811

667

812

668

#ifdef TARGET_X86_64

813

void OPPROTO op_cvtsq2ss(void)

669

void helper_cvtsq2ss(XMMReg *d, uint64_t val)

814

670

{

815

XMMReg *d = (Reg *)((char *)env + PARAM1);

816

d->XMM_S(0) = int64_to_float32(T0, &env->sse_status);

671

d->XMM_S(0) = int64_to_float32(val, &env->sse_status);

817

672

}

818

673

819

void OPPROTO op_cvtsq2sd(void)

674

void helper_cvtsq2sd(XMMReg *d, uint64_t val)

820

675

{

821

XMMReg *d = (Reg *)((char *)env + PARAM1);

822

d->XMM_D(0) = int64_to_float64(T0, &env->sse_status);

676

d->XMM_D(0) = int64_to_float64(val, &env->sse_status);

823

677

}

824

678

#endif

825

679

826

680

/* float to integer */

827

void OPPROTO op_cvtps2dq(void)

681

void helper_cvtps2dq(XMMReg *d, XMMReg *s)

828

682

{

829

XMMReg *d = (XMMReg *)((char *)env + PARAM1);

830

XMMReg *s = (XMMReg *)((char *)env + PARAM2);

831

683

d->XMM_L(0) = float32_to_int32(s->XMM_S(0), &env->sse_status);

832

684

d->XMM_L(1) = float32_to_int32(s->XMM_S(1), &env->sse_status);

833

685

d->XMM_L(2) = float32_to_int32(s->XMM_S(2), &env->sse_status);

834

686

d->XMM_L(3) = float32_to_int32(s->XMM_S(3), &env->sse_status);

835

687

}

836

688

837

void OPPROTO op_cvtpd2dq(void)

689

void helper_cvtpd2dq(XMMReg *d, XMMReg *s)

838

690

{

839

XMMReg *d = (XMMReg *)((char *)env + PARAM1);

840

XMMReg *s = (XMMReg *)((char *)env + PARAM2);

841

691

d->XMM_L(0) = float64_to_int32(s->XMM_D(0), &env->sse_status);

842

692

d->XMM_L(1) = float64_to_int32(s->XMM_D(1), &env->sse_status);

843

693

d->XMM_Q(1) = 0;

844

694

}

845

695

846

void OPPROTO op_cvtps2pi(void)

696

void helper_cvtps2pi(MMXReg *d, XMMReg *s)

847

697

{

848

MMXReg *d = (MMXReg *)((char *)env + PARAM1);

849

XMMReg *s = (XMMReg *)((char *)env + PARAM2);

850

698

d->MMX_L(0) = float32_to_int32(s->XMM_S(0), &env->sse_status);

851

699

d->MMX_L(1) = float32_to_int32(s->XMM_S(1), &env->sse_status);

852

700

}

853

701

854

void OPPROTO op_cvtpd2pi(void)

702

void helper_cvtpd2pi(MMXReg *d, XMMReg *s)

855

703

{

856

MMXReg *d = (MMXReg *)((char *)env + PARAM1);

857

XMMReg *s = (XMMReg *)((char *)env + PARAM2);

858

704

d->MMX_L(0) = float64_to_int32(s->XMM_D(0), &env->sse_status);

859

705

d->MMX_L(1) = float64_to_int32(s->XMM_D(1), &env->sse_status);

860

706

}

861

707

862

void OPPROTO op_cvtss2si(void)

708

int32_t helper_cvtss2si(XMMReg *s)

863

709

{

864

XMMReg *s = (XMMReg *)((char *)env + PARAM1);

865

T0 = float32_to_int32(s->XMM_S(0), &env->sse_status);

710

return float32_to_int32(s->XMM_S(0), &env->sse_status);

866

711

}

867

712

868

void OPPROTO op_cvtsd2si(void)

713

int32_t helper_cvtsd2si(XMMReg *s)

869

714

{

870

XMMReg *s = (XMMReg *)((char *)env + PARAM1);

871

T0 = float64_to_int32(s->XMM_D(0), &env->sse_status);

715

return float64_to_int32(s->XMM_D(0), &env->sse_status);

872

716

}

873

717

874

718

#ifdef TARGET_X86_64

875

void OPPROTO op_cvtss2sq(void)

719

int64_t helper_cvtss2sq(XMMReg *s)

876

720

{

877

XMMReg *s = (XMMReg *)((char *)env + PARAM1);

878

T0 = float32_to_int64(s->XMM_S(0), &env->sse_status);

721

return float32_to_int64(s->XMM_S(0), &env->sse_status);

879

722

}

880

723

881

void OPPROTO op_cvtsd2sq(void)

724

int64_t helper_cvtsd2sq(XMMReg *s)

882

725

{

883

XMMReg *s = (XMMReg *)((char *)env + PARAM1);

884

T0 = float64_to_int64(s->XMM_D(0), &env->sse_status);

726

return float64_to_int64(s->XMM_D(0), &env->sse_status);

885

727

}

886

728

#endif

887

729

888

730

/* float to integer truncated */

889

void OPPROTO op_cvttps2dq(void)

731

void helper_cvttps2dq(XMMReg *d, XMMReg *s)

890

732

{

891

XMMReg *d = (XMMReg *)((char *)env + PARAM1);

892

XMMReg *s = (XMMReg *)((char *)env + PARAM2);

893

733

d->XMM_L(0) = float32_to_int32_round_to_zero(s->XMM_S(0), &env->sse_status);

894

734

d->XMM_L(1) = float32_to_int32_round_to_zero(s->XMM_S(1), &env->sse_status);

895

735

d->XMM_L(2) = float32_to_int32_round_to_zero(s->XMM_S(2), &env->sse_status);

896

736

d->XMM_L(3) = float32_to_int32_round_to_zero(s->XMM_S(3), &env->sse_status);

897

737

}

898

738

899

void OPPROTO op_cvttpd2dq(void)

739

void helper_cvttpd2dq(XMMReg *d, XMMReg *s)

900

740

{

901

XMMReg *d = (XMMReg *)((char *)env + PARAM1);

902

XMMReg *s = (XMMReg *)((char *)env + PARAM2);

903

741

d->XMM_L(0) = float64_to_int32_round_to_zero(s->XMM_D(0), &env->sse_status);

904

742

d->XMM_L(1) = float64_to_int32_round_to_zero(s->XMM_D(1), &env->sse_status);

905

743

d->XMM_Q(1) = 0;

906

744

}

907

745

908

void OPPROTO op_cvttps2pi(void)

746

void helper_cvttps2pi(MMXReg *d, XMMReg *s)

909

747

{

910

MMXReg *d = (MMXReg *)((char *)env + PARAM1);

911

XMMReg *s = (XMMReg *)((char *)env + PARAM2);

912

748

d->MMX_L(0) = float32_to_int32_round_to_zero(s->XMM_S(0), &env->sse_status);

913

749

d->MMX_L(1) = float32_to_int32_round_to_zero(s->XMM_S(1), &env->sse_status);

914

750

}

915

751

916

void OPPROTO op_cvttpd2pi(void)

752

void helper_cvttpd2pi(MMXReg *d, XMMReg *s)

917

753

{

918

MMXReg *d = (MMXReg *)((char *)env + PARAM1);

919

XMMReg *s = (XMMReg *)((char *)env + PARAM2);

920

754

d->MMX_L(0) = float64_to_int32_round_to_zero(s->XMM_D(0), &env->sse_status);

921

755

d->MMX_L(1) = float64_to_int32_round_to_zero(s->XMM_D(1), &env->sse_status);

922

756

}

923

757

924

void OPPROTO op_cvttss2si(void)

758

int32_t helper_cvttss2si(XMMReg *s)

925

759

{

926

XMMReg *s = (XMMReg *)((char *)env + PARAM1);

927

T0 = float32_to_int32_round_to_zero(s->XMM_S(0), &env->sse_status);

760

return float32_to_int32_round_to_zero(s->XMM_S(0), &env->sse_status);

928

761

}

929

762

930

void OPPROTO op_cvttsd2si(void)

763

int32_t helper_cvttsd2si(XMMReg *s)

931

764

{

932

XMMReg *s = (XMMReg *)((char *)env + PARAM1);

933

T0 = float64_to_int32_round_to_zero(s->XMM_D(0), &env->sse_status);

765

return float64_to_int32_round_to_zero(s->XMM_D(0), &env->sse_status);

934

766

}

935

767

936

768

#ifdef TARGET_X86_64

937

void OPPROTO op_cvttss2sq(void)

769

int64_t helper_cvttss2sq(XMMReg *s)

938

770

{

939

XMMReg *s = (XMMReg *)((char *)env + PARAM1);

940

T0 = float32_to_int64_round_to_zero(s->XMM_S(0), &env->sse_status);

771

return float32_to_int64_round_to_zero(s->XMM_S(0), &env->sse_status);

941

772

}

942

773

943

void OPPROTO op_cvttsd2sq(void)

774

int64_t helper_cvttsd2sq(XMMReg *s)

944

775

{

945

XMMReg *s = (XMMReg *)((char *)env + PARAM1);

946

T0 = float64_to_int64_round_to_zero(s->XMM_D(0), &env->sse_status);

776

return float64_to_int64_round_to_zero(s->XMM_D(0), &env->sse_status);

947

777

}

948

778

#endif

949

779

950

void OPPROTO op_rsqrtps(void)

780

void helper_rsqrtps(XMMReg *d, XMMReg *s)

951

781

{

952

XMMReg *d = (XMMReg *)((char *)env + PARAM1);

953

XMMReg *s = (XMMReg *)((char *)env + PARAM2);

954

782

d->XMM_S(0) = approx_rsqrt(s->XMM_S(0));

955

783

d->XMM_S(1) = approx_rsqrt(s->XMM_S(1));

956

784

d->XMM_S(2) = approx_rsqrt(s->XMM_S(2));

957

785

d->XMM_S(3) = approx_rsqrt(s->XMM_S(3));

958

786

}

959

787

960

void OPPROTO op_rsqrtss(void)

788

void helper_rsqrtss(XMMReg *d, XMMReg *s)

961

789

{

962

XMMReg *d = (XMMReg *)((char *)env + PARAM1);

963

XMMReg *s = (XMMReg *)((char *)env + PARAM2);

964

790

d->XMM_S(0) = approx_rsqrt(s->XMM_S(0));

965

791

}

966

792

967

void OPPROTO op_rcpps(void)

793

void helper_rcpps(XMMReg *d, XMMReg *s)

968

794

{

969

XMMReg *d = (XMMReg *)((char *)env + PARAM1);

970

XMMReg *s = (XMMReg *)((char *)env + PARAM2);

971

795

d->XMM_S(0) = approx_rcp(s->XMM_S(0));

972

796

d->XMM_S(1) = approx_rcp(s->XMM_S(1));

973

797

d->XMM_S(2) = approx_rcp(s->XMM_S(2));

974

798

d->XMM_S(3) = approx_rcp(s->XMM_S(3));

975

799

}

976

800

977

void OPPROTO op_rcpss(void)

801

void helper_rcpss(XMMReg *d, XMMReg *s)

978

802

{

979

XMMReg *d = (XMMReg *)((char *)env + PARAM1);

980

XMMReg *s = (XMMReg *)((char *)env + PARAM2);

981

803

d->XMM_S(0) = approx_rcp(s->XMM_S(0));

982

804

}

983

805

984

void OPPROTO op_haddps(void)

806

void helper_haddps(XMMReg *d, XMMReg *s)

985

807

{

986

XMMReg *d = (XMMReg *)((char *)env + PARAM1);

987

XMMReg *s = (XMMReg *)((char *)env + PARAM2);

988

808

XMMReg r;

989

809

r.XMM_S(0) = d->XMM_S(0) + d->XMM_S(1);

990

810

r.XMM_S(1) = d->XMM_S(2) + d->XMM_S(3);

993

813

*d = r;

994

814

}

995

815

996

void OPPROTO op_haddpd(void)

816

void helper_haddpd(XMMReg *d, XMMReg *s)

997

817

{

998

XMMReg *d = (XMMReg *)((char *)env + PARAM1);

999

XMMReg *s = (XMMReg *)((char *)env + PARAM2);

1000

818

XMMReg r;

1001

819

r.XMM_D(0) = d->XMM_D(0) + d->XMM_D(1);

1002

820

r.XMM_D(1) = s->XMM_D(0) + s->XMM_D(1);

1003

821

*d = r;

1004

822

}

1005

823

1006

void OPPROTO op_hsubps(void)

824

void helper_hsubps(XMMReg *d, XMMReg *s)

1007

825

{

1008

XMMReg *d = (XMMReg *)((char *)env + PARAM1);

1009

XMMReg *s = (XMMReg *)((char *)env + PARAM2);

1010

826

XMMReg r;

1011

827

r.XMM_S(0) = d->XMM_S(0) - d->XMM_S(1);

1012

828

r.XMM_S(1) = d->XMM_S(2) - d->XMM_S(3);

1015

831

*d = r;

1016

832

}

1017

833

1018

void OPPROTO op_hsubpd(void)

834

void helper_hsubpd(XMMReg *d, XMMReg *s)

1019

835

{

1020

XMMReg *d = (XMMReg *)((char *)env + PARAM1);

1021

XMMReg *s = (XMMReg *)((char *)env + PARAM2);

1022

836

XMMReg r;

1023

837

r.XMM_D(0) = d->XMM_D(0) - d->XMM_D(1);

1024

838

r.XMM_D(1) = s->XMM_D(0) - s->XMM_D(1);

1025

839

*d = r;

1026

840

}

1027

841

1028

void OPPROTO op_addsubps(void)

842

void helper_addsubps(XMMReg *d, XMMReg *s)

1029

843

{

1030

XMMReg *d = (XMMReg *)((char *)env + PARAM1);

1031

XMMReg *s = (XMMReg *)((char *)env + PARAM2);

1032

844

d->XMM_S(0) = d->XMM_S(0) - s->XMM_S(0);

1033

845

d->XMM_S(1) = d->XMM_S(1) + s->XMM_S(1);

1034

846

d->XMM_S(2) = d->XMM_S(2) - s->XMM_S(2);

1035

847

d->XMM_S(3) = d->XMM_S(3) + s->XMM_S(3);

1036

848

}

1037

849

1038

void OPPROTO op_addsubpd(void)

850

void helper_addsubpd(XMMReg *d, XMMReg *s)

1039

851

{

1040

XMMReg *d = (XMMReg *)((char *)env + PARAM1);

1041

XMMReg *s = (XMMReg *)((char *)env + PARAM2);

1042

852

d->XMM_D(0) = d->XMM_D(0) - s->XMM_D(0);

1043

853

d->XMM_D(1) = d->XMM_D(1) + s->XMM_D(1);

1044

854

}

1045

855

1046

856

/* XXX: unordered */

1047

#define SSE_OP_CMP(name, F)\

1048

void OPPROTO op_ ## name ## ps (void)\

857

#define SSE_HELPER_CMP(name, F)\

858

void helper_ ## name ## ps (Reg *d, Reg *s)\

1049

859

1050

Reg *d, *s;\

1051

d = (Reg *)((char *)env + PARAM1);\

1052

s = (Reg *)((char *)env + PARAM2);\

1053

860

d->XMM_L(0) = F(32, d->XMM_S(0), s->XMM_S(0));\

1054

861

d->XMM_L(1) = F(32, d->XMM_S(1), s->XMM_S(1));\

1055

862

d->XMM_L(2) = F(32, d->XMM_S(2), s->XMM_S(2));\

1056

863

d->XMM_L(3) = F(32, d->XMM_S(3), s->XMM_S(3));\

1057

864

1058

865

1059

void OPPROTO op_ ## name ## ss (void)\

866

void helper_ ## name ## ss (Reg *d, Reg *s)\

1060

867

1061

Reg *d, *s;\

1062

d = (Reg *)((char *)env + PARAM1);\

1063

s = (Reg *)((char *)env + PARAM2);\

1064

868

d->XMM_L(0) = F(32, d->XMM_S(0), s->XMM_S(0));\

1065

869

1066

void OPPROTO op_ ## name ## pd (void)\

870

void helper_ ## name ## pd (Reg *d, Reg *s)\

1067

871

1068

Reg *d, *s;\

1069

d = (Reg *)((char *)env + PARAM1);\

1070

s = (Reg *)((char *)env + PARAM2);\

1071

872

d->XMM_Q(0) = F(64, d->XMM_D(0), s->XMM_D(0));\

1072

873

d->XMM_Q(1) = F(64, d->XMM_D(1), s->XMM_D(1));\

1073

874

1074

875

1075

void OPPROTO op_ ## name ## sd (void)\

876

void helper_ ## name ## sd (Reg *d, Reg *s)\

1076

877

1077

Reg *d, *s;\

1078

d = (Reg *)((char *)env + PARAM1);\

1079

s = (Reg *)((char *)env + PARAM2);\

1080

878

d->XMM_Q(0) = F(64, d->XMM_D(0), s->XMM_D(0));\

1081

879

}

1082

880

1089

887

#define FPU_CMPNLE(size, a, b) float ## size ## _le(a, b, &env->sse_status) ? 0 : -1

1090

888

#define FPU_CMPORD(size, a, b) float ## size ## _unordered(a, b, &env->sse_status) ? 0 : -1

1091

889

1092

SSE_OP_CMP(cmpeq, FPU_CMPEQ)

1093

SSE_OP_CMP(cmplt, FPU_CMPLT)

1094

SSE_OP_CMP(cmple, FPU_CMPLE)

1095

SSE_OP_CMP(cmpunord, FPU_CMPUNORD)

1096

SSE_OP_CMP(cmpneq, FPU_CMPNEQ)

1097

SSE_OP_CMP(cmpnlt, FPU_CMPNLT)

1098

SSE_OP_CMP(cmpnle, FPU_CMPNLE)

1099

SSE_OP_CMP(cmpord, FPU_CMPORD)

890

SSE_HELPER_CMP(cmpeq, FPU_CMPEQ)

891

SSE_HELPER_CMP(cmplt, FPU_CMPLT)

892

SSE_HELPER_CMP(cmple, FPU_CMPLE)

893

SSE_HELPER_CMP(cmpunord, FPU_CMPUNORD)

894

SSE_HELPER_CMP(cmpneq, FPU_CMPNEQ)

895

SSE_HELPER_CMP(cmpnlt, FPU_CMPNLT)

896

SSE_HELPER_CMP(cmpnle, FPU_CMPNLE)

897

SSE_HELPER_CMP(cmpord, FPU_CMPORD)

1100

898

1101

899

const int comis_eflags[4] = {CC_C, CC_Z, 0, CC_Z | CC_P | CC_C};

1102

900

1103

void OPPROTO op_ucomiss(void)

901

void helper_ucomiss(Reg *d, Reg *s)

1104

902

{

1105

903

int ret;

1106

904

float32 s0, s1;

1107

Reg *d, *s;

1108

d = (Reg *)((char *)env + PARAM1);

1109

s = (Reg *)((char *)env + PARAM2);

1110

905

1111

906

s0 = d->XMM_S(0);

1112

907

s1 = s->XMM_S(0);

1113

908

ret = float32_compare_quiet(s0, s1, &env->sse_status);

1114

909

CC_SRC = comis_eflags[ret + 1];

1115

FORCE_RET();

1116

910

}

1117

911

1118

void OPPROTO op_comiss(void)

912

void helper_comiss(Reg *d, Reg *s)

1119

913

{

1120

914

int ret;

1121

915

float32 s0, s1;

1122

Reg *d, *s;

1123

d = (Reg *)((char *)env + PARAM1);

1124

s = (Reg *)((char *)env + PARAM2);

1125

916

1126

917

s0 = d->XMM_S(0);

1127

918

s1 = s->XMM_S(0);

1128

919

ret = float32_compare(s0, s1, &env->sse_status);

1129

920

CC_SRC = comis_eflags[ret + 1];

1130

FORCE_RET();

1131

921

}

1132

922

1133

void OPPROTO op_ucomisd(void)

923

void helper_ucomisd(Reg *d, Reg *s)

1134

924

{

1135

925

int ret;

1136

926

float64 d0, d1;

1137

Reg *d, *s;

1138

d = (Reg *)((char *)env + PARAM1);

1139

s = (Reg *)((char *)env + PARAM2);

1140

927

1141

928

d0 = d->XMM_D(0);

1142

929

d1 = s->XMM_D(0);

1143

930

ret = float64_compare_quiet(d0, d1, &env->sse_status);

1144

931

CC_SRC = comis_eflags[ret + 1];

1145

FORCE_RET();

1146

932

}

1147

933

1148

void OPPROTO op_comisd(void)

934

void helper_comisd(Reg *d, Reg *s)

1149

935

{

1150

936

int ret;

1151

937

float64 d0, d1;

1152

Reg *d, *s;

1153

d = (Reg *)((char *)env + PARAM1);

1154

s = (Reg *)((char *)env + PARAM2);

1155

938

1156

939

d0 = d->XMM_D(0);

1157

940

d1 = s->XMM_D(0);

1158

941

ret = float64_compare(d0, d1, &env->sse_status);

1159

942

CC_SRC = comis_eflags[ret + 1];

1160

FORCE_RET();

1161

943

}

1162

944

1163

void OPPROTO op_movmskps(void)

945

uint32_t helper_movmskps(Reg *s)

1164

946

{

1165

947

int b0, b1, b2, b3;

1166

Reg *s;

1167

s = (Reg *)((char *)env + PARAM1);

1168

948

b0 = s->XMM_L(0) >> 31;

1169

949

b1 = s->XMM_L(1) >> 31;

1170

950

b2 = s->XMM_L(2) >> 31;

1171

951

b3 = s->XMM_L(3) >> 31;

1172

T0 = b0 | (b1 << 1) | (b2 << 2) | (b3 << 3);

952

return b0 | (b1 << 1) | (b2 << 2) | (b3 << 3);

1173

953

}

1174

954

1175

void OPPROTO op_movmskpd(void)

955

uint32_t helper_movmskpd(Reg *s)

1176

956

{

1177

957

int b0, b1;

1178

Reg *s;

1179

s = (Reg *)((char *)env + PARAM1);

1180

958

b0 = s->XMM_L(1) >> 31;

1181

959

b1 = s->XMM_L(3) >> 31;

1182

T0 = b0 | (b1 << 1);

960

return b0 | (b1 << 1);

1183

961

}

1184

962

1185

963

#endif

1186

964

1187

void OPPROTO glue(op_pmovmskb, SUFFIX)(void)

965

uint32_t glue(helper_pmovmskb, SUFFIX)(Reg *s)

1188

966

{

1189

Reg *s;

1190

s = (Reg *)((char *)env + PARAM1);

1191

T0 = 0;

1192

T0 |= (s->XMM_B(0) >> 7);

1193

T0 |= (s->XMM_B(1) >> 6) & 0x02;

1194

T0 |= (s->XMM_B(2) >> 5) & 0x04;

1195

T0 |= (s->XMM_B(3) >> 4) & 0x08;

1196

T0 |= (s->XMM_B(4) >> 3) & 0x10;

1197

T0 |= (s->XMM_B(5) >> 2) & 0x20;

1198

T0 |= (s->XMM_B(6) >> 1) & 0x40;

1199

T0 |= (s->XMM_B(7)) & 0x80;

967

uint32_t val;

968

val = 0;

969

val |= (s->B(0) >> 7);

970

val |= (s->B(1) >> 6) & 0x02;

971

val |= (s->B(2) >> 5) & 0x04;

972

val |= (s->B(3) >> 4) & 0x08;

973

val |= (s->B(4) >> 3) & 0x10;

974

val |= (s->B(5) >> 2) & 0x20;

975

val |= (s->B(6) >> 1) & 0x40;

976

val |= (s->B(7)) & 0x80;

1200

977

#if SHIFT == 1

1201

T0 |= (s->XMM_B(8) << 1) & 0x0100;

1202

T0 |= (s->XMM_B(9) << 2) & 0x0200;

1203

T0 |= (s->XMM_B(10) << 3) & 0x0400;

1204

T0 |= (s->XMM_B(11) << 4) & 0x0800;

1205

T0 |= (s->XMM_B(12) << 5) & 0x1000;

1206

T0 |= (s->XMM_B(13) << 6) & 0x2000;

1207

T0 |= (s->XMM_B(14) << 7) & 0x4000;

1208

T0 |= (s->XMM_B(15) << 8) & 0x8000;

978

val |= (s->B(8) << 1) & 0x0100;

979

val |= (s->B(9) << 2) & 0x0200;

980

val |= (s->B(10) << 3) & 0x0400;

981

val |= (s->B(11) << 4) & 0x0800;

982

val |= (s->B(12) << 5) & 0x1000;

983

val |= (s->B(13) << 6) & 0x2000;

984

val |= (s->B(14) << 7) & 0x4000;

985

val |= (s->B(15) << 8) & 0x8000;

1209

986

#endif

1210

}

1211

1212

void OPPROTO glue(op_pinsrw, SUFFIX) (void)

1213

{

1214

Reg *d = (Reg *)((char *)env + PARAM1);

1215

int pos = PARAM2;

1216

1217

d->W(pos) = T0;

1218

}

1219

1220

void OPPROTO glue(op_pextrw, SUFFIX) (void)

1221

{

1222

Reg *s = (Reg *)((char *)env + PARAM1);

1223

int pos = PARAM2;

1224

1225

T0 = s->W(pos);

1226

}

1227

1228

void OPPROTO glue(op_packsswb, SUFFIX) (void)

1229

{

1230

Reg r, *d, *s;

1231

d = (Reg *)((char *)env + PARAM1);

1232

s = (Reg *)((char *)env + PARAM2);

987

return val;

988

}

989

990

void glue(helper_packsswb, SUFFIX) (Reg *d, Reg *s)

991

{

992

Reg r;

1233

993

1234

994

r.B(0) = satsb((int16_t)d->W(0));

1235

995

r.B(1) = satsb((int16_t)d->W(1));

1254

1014

*d = r;

1255

1015

}

1256

1016

1257

void OPPROTO glue(op_packuswb, SUFFIX) (void)

1017

void glue(helper_packuswb, SUFFIX) (Reg *d, Reg *s)

1258

1018

{

1259

Reg r, *d, *s;

1260

d = (Reg *)((char *)env + PARAM1);

1261

s = (Reg *)((char *)env + PARAM2);

1019

Reg r;

1262

1020

1263

1021

r.B(0) = satub((int16_t)d->W(0));

1264

1022

r.B(1) = satub((int16_t)d->W(1));

1283

1041

*d = r;

1284

1042

}

1285

1043

1286

void OPPROTO glue(op_packssdw, SUFFIX) (void)

1044

void glue(helper_packssdw, SUFFIX) (Reg *d, Reg *s)

1287

1045

{

1288

Reg r, *d, *s;

1289

d = (Reg *)((char *)env + PARAM1);

1290

s = (Reg *)((char *)env + PARAM2);

1046

Reg r;

1291

1047

1292

1048

r.W(0) = satsw(d->L(0));

1293

1049

r.W(1) = satsw(d->L(1));

1306

1062

1307

1063

#define UNPCK_OP(base_name, base) \

1308

1064

1309

void OPPROTO glue(op_punpck ## base_name ## bw, SUFFIX) (void) \

1065

void glue(helper_punpck ## base_name ## bw, SUFFIX) (Reg *d, Reg *s) \

1310

1066

{ \

1311

Reg r, *d, *s; \

1312

d = (Reg *)((char *)env + PARAM1); \

1313

s = (Reg *)((char *)env + PARAM2); \

1067

Reg r; \

1314

1068

1315

1069

r.B(0) = d->B((base << (SHIFT + 2)) + 0); \

1316

1070

r.B(1) = s->B((base << (SHIFT + 2)) + 0); \

1333

1087

*d = r; \

1334

1088

} \

1335

1089

1336

void OPPROTO glue(op_punpck ## base_name ## wd, SUFFIX) (void) \

1090

void glue(helper_punpck ## base_name ## wd, SUFFIX) (Reg *d, Reg *s) \

1337

1091

{ \

1338

Reg r, *d, *s; \

1339

d = (Reg *)((char *)env + PARAM1); \

1340

s = (Reg *)((char *)env + PARAM2); \

1092

Reg r; \

1341

1093

1342

1094

r.W(0) = d->W((base << (SHIFT + 1)) + 0); \

1343

1095

r.W(1) = s->W((base << (SHIFT + 1)) + 0); \

1352

1104

*d = r; \

1353

1105

} \

1354

1106

1355

void OPPROTO glue(op_punpck ## base_name ## dq, SUFFIX) (void) \

1107

void glue(helper_punpck ## base_name ## dq, SUFFIX) (Reg *d, Reg *s) \

1356

1108

{ \

1357

Reg r, *d, *s; \

1358

d = (Reg *)((char *)env + PARAM1); \

1359

s = (Reg *)((char *)env + PARAM2); \

1109

Reg r; \

1360

1110

1361

1111

r.L(0) = d->L((base << SHIFT) + 0); \

1362

1112

r.L(1) = s->L((base << SHIFT) + 0); \

1368

1118

} \

1369

1119

1370

1120

XMM_ONLY( \

1371

void OPPROTO glue(op_punpck ## base_name ## qdq, SUFFIX) (void) \

1121

void glue(helper_punpck ## base_name ## qdq, SUFFIX) (Reg *d, Reg *s) \

1372

1122

{ \

1373

Reg r, *d, *s; \

1374

d = (Reg *)((char *)env + PARAM1); \

1375

s = (Reg *)((char *)env + PARAM2); \

1123

Reg r; \

1376

1124

1377

1125

r.Q(0) = d->Q(base); \

1378

1126

r.Q(1) = s->Q(base); \

1383

1131

UNPCK_OP(l, 0)

1384

1132

UNPCK_OP(h, 1)

1385

1133

1134

/* 3DNow! float ops */

1135

#if SHIFT == 0

1136

void helper_pi2fd(MMXReg *d, MMXReg *s)

1137

{

1138

d->MMX_S(0) = int32_to_float32(s->MMX_L(0), &env->mmx_status);

1139

d->MMX_S(1) = int32_to_float32(s->MMX_L(1), &env->mmx_status);

1140

}

1141

1142

void helper_pi2fw(MMXReg *d, MMXReg *s)

1143

{

1144

d->MMX_S(0) = int32_to_float32((int16_t)s->MMX_W(0), &env->mmx_status);

1145

d->MMX_S(1) = int32_to_float32((int16_t)s->MMX_W(2), &env->mmx_status);

1146

}

1147

1148

void helper_pf2id(MMXReg *d, MMXReg *s)

1149

{

1150

d->MMX_L(0) = float32_to_int32_round_to_zero(s->MMX_S(0), &env->mmx_status);

1151

d->MMX_L(1) = float32_to_int32_round_to_zero(s->MMX_S(1), &env->mmx_status);

1152

}

1153

1154

void helper_pf2iw(MMXReg *d, MMXReg *s)

1155

{

1156

d->MMX_L(0) = satsw(float32_to_int32_round_to_zero(s->MMX_S(0), &env->mmx_status));

1157

d->MMX_L(1) = satsw(float32_to_int32_round_to_zero(s->MMX_S(1), &env->mmx_status));

1158

}

1159

1160

void helper_pfacc(MMXReg *d, MMXReg *s)

1161

{

1162

MMXReg r;

1163

r.MMX_S(0) = float32_add(d->MMX_S(0), d->MMX_S(1), &env->mmx_status);

1164

r.MMX_S(1) = float32_add(s->MMX_S(0), s->MMX_S(1), &env->mmx_status);

1165

*d = r;

1166

}

1167

1168

void helper_pfadd(MMXReg *d, MMXReg *s)

1169

{

1170

d->MMX_S(0) = float32_add(d->MMX_S(0), s->MMX_S(0), &env->mmx_status);

1171

d->MMX_S(1) = float32_add(d->MMX_S(1), s->MMX_S(1), &env->mmx_status);

1172

}

1173

1174

void helper_pfcmpeq(MMXReg *d, MMXReg *s)

1175

{

1176

d->MMX_L(0) = float32_eq(d->MMX_S(0), s->MMX_S(0), &env->mmx_status) ? -1 : 0;

1177

d->MMX_L(1) = float32_eq(d->MMX_S(1), s->MMX_S(1), &env->mmx_status) ? -1 : 0;

1178

}

1179

1180

void helper_pfcmpge(MMXReg *d, MMXReg *s)

1181

{

1182

d->MMX_L(0) = float32_le(s->MMX_S(0), d->MMX_S(0), &env->mmx_status) ? -1 : 0;

1183

d->MMX_L(1) = float32_le(s->MMX_S(1), d->MMX_S(1), &env->mmx_status) ? -1 : 0;

1184

}

1185

1186

void helper_pfcmpgt(MMXReg *d, MMXReg *s)

1187

{

1188

d->MMX_L(0) = float32_lt(s->MMX_S(0), d->MMX_S(0), &env->mmx_status) ? -1 : 0;

1189

d->MMX_L(1) = float32_lt(s->MMX_S(1), d->MMX_S(1), &env->mmx_status) ? -1 : 0;

1190

}

1191

1192

void helper_pfmax(MMXReg *d, MMXReg *s)

1193

{

1194

if (float32_lt(d->MMX_S(0), s->MMX_S(0), &env->mmx_status))

1195

d->MMX_S(0) = s->MMX_S(0);

1196

if (float32_lt(d->MMX_S(1), s->MMX_S(1), &env->mmx_status))

1197

d->MMX_S(1) = s->MMX_S(1);

1198

}

1199

1200

void helper_pfmin(MMXReg *d, MMXReg *s)

1201

{

1202

if (float32_lt(s->MMX_S(0), d->MMX_S(0), &env->mmx_status))

1203

d->MMX_S(0) = s->MMX_S(0);

1204

if (float32_lt(s->MMX_S(1), d->MMX_S(1), &env->mmx_status))

1205

d->MMX_S(1) = s->MMX_S(1);

1206

}

1207

1208

void helper_pfmul(MMXReg *d, MMXReg *s)

1209

{

1210

d->MMX_S(0) = float32_mul(d->MMX_S(0), s->MMX_S(0), &env->mmx_status);

1211

d->MMX_S(1) = float32_mul(d->MMX_S(1), s->MMX_S(1), &env->mmx_status);

1212

}

1213

1214

void helper_pfnacc(MMXReg *d, MMXReg *s)

1215

{

1216

MMXReg r;

1217

r.MMX_S(0) = float32_sub(d->MMX_S(0), d->MMX_S(1), &env->mmx_status);

1218

r.MMX_S(1) = float32_sub(s->MMX_S(0), s->MMX_S(1), &env->mmx_status);

1219

*d = r;

1220

}

1221

1222

void helper_pfpnacc(MMXReg *d, MMXReg *s)

1223

{

1224

MMXReg r;

1225

r.MMX_S(0) = float32_sub(d->MMX_S(0), d->MMX_S(1), &env->mmx_status);

1226

r.MMX_S(1) = float32_add(s->MMX_S(0), s->MMX_S(1), &env->mmx_status);

1227

*d = r;

1228

}

1229

1230

void helper_pfrcp(MMXReg *d, MMXReg *s)

1231

{

1232

d->MMX_S(0) = approx_rcp(s->MMX_S(0));

1233

d->MMX_S(1) = d->MMX_S(0);

1234

}

1235

1236

void helper_pfrsqrt(MMXReg *d, MMXReg *s)

1237

{

1238

d->MMX_L(1) = s->MMX_L(0) & 0x7fffffff;

1239

d->MMX_S(1) = approx_rsqrt(d->MMX_S(1));

1240

d->MMX_L(1) |= s->MMX_L(0) & 0x80000000;

1241

d->MMX_L(0) = d->MMX_L(1);

1242

}

1243

1244

void helper_pfsub(MMXReg *d, MMXReg *s)

1245

{

1246

d->MMX_S(0) = float32_sub(d->MMX_S(0), s->MMX_S(0), &env->mmx_status);

1247

d->MMX_S(1) = float32_sub(d->MMX_S(1), s->MMX_S(1), &env->mmx_status);

1248

}

1249

1250

void helper_pfsubr(MMXReg *d, MMXReg *s)

1251

{

1252

d->MMX_S(0) = float32_sub(s->MMX_S(0), d->MMX_S(0), &env->mmx_status);

1253

d->MMX_S(1) = float32_sub(s->MMX_S(1), d->MMX_S(1), &env->mmx_status);

1254

}

1255

1256

void helper_pswapd(MMXReg *d, MMXReg *s)

1257

{

1258

MMXReg r;

1259

r.MMX_L(0) = s->MMX_L(1);

1260

r.MMX_L(1) = s->MMX_L(0);

1261

*d = r;

1262

}

1263

#endif

1264

1265

/* SSSE3 op helpers */

1266

void glue(helper_pshufb, SUFFIX) (Reg *d, Reg *s)

1267

{

1268

int i;

1269

Reg r;

1270

1271

for (i = 0; i < (8 << SHIFT); i++)

1272

r.B(i) = (s->B(i) & 0x80) ? 0 : (d->B(s->B(i) & ((8 << SHIFT) - 1)));

1273

1274

*d = r;

1275

}

1276

1277

void glue(helper_phaddw, SUFFIX) (Reg *d, Reg *s)

1278

{

1279

d->W(0) = (int16_t)d->W(0) + (int16_t)d->W(1);

1280

d->W(1) = (int16_t)d->W(2) + (int16_t)d->W(3);

1281

XMM_ONLY(d->W(2) = (int16_t)d->W(4) + (int16_t)d->W(5));

1282

XMM_ONLY(d->W(3) = (int16_t)d->W(6) + (int16_t)d->W(7));

1283

d->W((2 << SHIFT) + 0) = (int16_t)s->W(0) + (int16_t)s->W(1);

1284

d->W((2 << SHIFT) + 1) = (int16_t)s->W(2) + (int16_t)s->W(3);

1285

XMM_ONLY(d->W(6) = (int16_t)s->W(4) + (int16_t)s->W(5));

1286

XMM_ONLY(d->W(7) = (int16_t)s->W(6) + (int16_t)s->W(7));

1287

}

1288

1289

void glue(helper_phaddd, SUFFIX) (Reg *d, Reg *s)

1290

{

1291

d->L(0) = (int32_t)d->L(0) + (int32_t)d->L(1);

1292

XMM_ONLY(d->L(1) = (int32_t)d->L(2) + (int32_t)d->L(3));

1293

d->L((1 << SHIFT) + 0) = (int32_t)s->L(0) + (int32_t)s->L(1);

1294

XMM_ONLY(d->L(3) = (int32_t)s->L(2) + (int32_t)s->L(3));

1295

}

1296

1297

void glue(helper_phaddsw, SUFFIX) (Reg *d, Reg *s)

1298

{

1299

d->W(0) = satsw((int16_t)d->W(0) + (int16_t)d->W(1));

1300

d->W(1) = satsw((int16_t)d->W(2) + (int16_t)d->W(3));

1301

XMM_ONLY(d->W(2) = satsw((int16_t)d->W(4) + (int16_t)d->W(5)));

1302

XMM_ONLY(d->W(3) = satsw((int16_t)d->W(6) + (int16_t)d->W(7)));

1303

d->W((2 << SHIFT) + 0) = satsw((int16_t)s->W(0) + (int16_t)s->W(1));

1304

d->W((2 << SHIFT) + 1) = satsw((int16_t)s->W(2) + (int16_t)s->W(3));

1305

XMM_ONLY(d->W(6) = satsw((int16_t)s->W(4) + (int16_t)s->W(5)));

1306

XMM_ONLY(d->W(7) = satsw((int16_t)s->W(6) + (int16_t)s->W(7)));

1307

}

1308

1309

void glue(helper_pmaddubsw, SUFFIX) (Reg *d, Reg *s)

1310

{

1311

d->W(0) = satsw((int8_t)s->B( 0) * (uint8_t)d->B( 0) +

1312

(int8_t)s->B( 1) * (uint8_t)d->B( 1));

1313

d->W(1) = satsw((int8_t)s->B( 2) * (uint8_t)d->B( 2) +

1314

(int8_t)s->B( 3) * (uint8_t)d->B( 3));

1315

d->W(2) = satsw((int8_t)s->B( 4) * (uint8_t)d->B( 4) +

1316

(int8_t)s->B( 5) * (uint8_t)d->B( 5));

1317

d->W(3) = satsw((int8_t)s->B( 6) * (uint8_t)d->B( 6) +

1318

(int8_t)s->B( 7) * (uint8_t)d->B( 7));

1319

#if SHIFT == 1

1320

d->W(4) = satsw((int8_t)s->B( 8) * (uint8_t)d->B( 8) +

1321

(int8_t)s->B( 9) * (uint8_t)d->B( 9));

1322

d->W(5) = satsw((int8_t)s->B(10) * (uint8_t)d->B(10) +

1323

(int8_t)s->B(11) * (uint8_t)d->B(11));

1324

d->W(6) = satsw((int8_t)s->B(12) * (uint8_t)d->B(12) +

1325

(int8_t)s->B(13) * (uint8_t)d->B(13));

1326

d->W(7) = satsw((int8_t)s->B(14) * (uint8_t)d->B(14) +

1327

(int8_t)s->B(15) * (uint8_t)d->B(15));

1328

#endif

1329

}

1330

1331

void glue(helper_phsubw, SUFFIX) (Reg *d, Reg *s)

1332

{

1333

d->W(0) = (int16_t)d->W(0) - (int16_t)d->W(1);

1334

d->W(1) = (int16_t)d->W(2) - (int16_t)d->W(3);

1335

XMM_ONLY(d->W(2) = (int16_t)d->W(4) - (int16_t)d->W(5));

1336

XMM_ONLY(d->W(3) = (int16_t)d->W(6) - (int16_t)d->W(7));

1337

d->W((2 << SHIFT) + 0) = (int16_t)s->W(0) - (int16_t)s->W(1);

1338

d->W((2 << SHIFT) + 1) = (int16_t)s->W(2) - (int16_t)s->W(3);

1339

XMM_ONLY(d->W(6) = (int16_t)s->W(4) - (int16_t)s->W(5));

1340

XMM_ONLY(d->W(7) = (int16_t)s->W(6) - (int16_t)s->W(7));

1341

}

1342

1343

void glue(helper_phsubd, SUFFIX) (Reg *d, Reg *s)

1344

{

1345

d->L(0) = (int32_t)d->L(0) - (int32_t)d->L(1);

1346

XMM_ONLY(d->L(1) = (int32_t)d->L(2) - (int32_t)d->L(3));

1347

d->L((1 << SHIFT) + 0) = (int32_t)s->L(0) - (int32_t)s->L(1);

1348

XMM_ONLY(d->L(3) = (int32_t)s->L(2) - (int32_t)s->L(3));

1349

}

1350

1351

void glue(helper_phsubsw, SUFFIX) (Reg *d, Reg *s)

1352

{

1353

d->W(0) = satsw((int16_t)d->W(0) - (int16_t)d->W(1));

1354

d->W(1) = satsw((int16_t)d->W(2) - (int16_t)d->W(3));

1355

XMM_ONLY(d->W(2) = satsw((int16_t)d->W(4) - (int16_t)d->W(5)));

1356

XMM_ONLY(d->W(3) = satsw((int16_t)d->W(6) - (int16_t)d->W(7)));

1357

d->W((2 << SHIFT) + 0) = satsw((int16_t)s->W(0) - (int16_t)s->W(1));

1358

d->W((2 << SHIFT) + 1) = satsw((int16_t)s->W(2) - (int16_t)s->W(3));

1359

XMM_ONLY(d->W(6) = satsw((int16_t)s->W(4) - (int16_t)s->W(5)));

1360

XMM_ONLY(d->W(7) = satsw((int16_t)s->W(6) - (int16_t)s->W(7)));

1361

}

1362

1363

#define FABSB(_, x) x > INT8_MAX ? -(int8_t ) x : x

1364

#define FABSW(_, x) x > INT16_MAX ? -(int16_t) x : x

1365

#define FABSL(_, x) x > INT32_MAX ? -(int32_t) x : x

1366

SSE_HELPER_B(helper_pabsb, FABSB)

1367

SSE_HELPER_W(helper_pabsw, FABSW)

1368

SSE_HELPER_L(helper_pabsd, FABSL)

1369

1370

#define FMULHRSW(d, s) ((int16_t) d * (int16_t) s + 0x4000) >> 15

1371

SSE_HELPER_W(helper_pmulhrsw, FMULHRSW)

1372

1373

#define FSIGNB(d, s) s <= INT8_MAX ? s ? d : 0 : -(int8_t ) d

1374

#define FSIGNW(d, s) s <= INT16_MAX ? s ? d : 0 : -(int16_t) d

1375

#define FSIGNL(d, s) s <= INT32_MAX ? s ? d : 0 : -(int32_t) d

1376

SSE_HELPER_B(helper_psignb, FSIGNB)

1377

SSE_HELPER_W(helper_psignw, FSIGNW)

1378

SSE_HELPER_L(helper_psignd, FSIGNL)

1379

1380

void glue(helper_palignr, SUFFIX) (Reg *d, Reg *s, int32_t shift)

1381

{

1382

Reg r;

1383

1384

/* XXX could be checked during translation */

1385

if (shift >= (16 << SHIFT)) {

1386

r.Q(0) = 0;

1387

XMM_ONLY(r.Q(1) = 0);

1388

} else {

1389

shift <<= 3;

1390

#define SHR(v, i) (i < 64 && i > -64 ? i > 0 ? v >> (i) : (v << -(i)) : 0)

1391

#if SHIFT == 0

1392

r.Q(0) = SHR(s->Q(0), shift - 0) |

1393

SHR(d->Q(0), shift - 64);

1394

#else

1395

r.Q(0) = SHR(s->Q(0), shift - 0) |

1396

SHR(s->Q(1), shift - 64) |

1397

SHR(d->Q(0), shift - 128) |

1398

SHR(d->Q(1), shift - 192);

1399

r.Q(1) = SHR(s->Q(0), shift + 64) |

1400

SHR(s->Q(1), shift - 0) |

1401

SHR(d->Q(0), shift - 64) |

1402

SHR(d->Q(1), shift - 128);

1403

#endif

1404

#undef SHR

1405

}

1406

1407

*d = r;

1408

}

1409

1410

#define XMM0 env->xmm_regs[0]

1411

1412

#if SHIFT == 1

1413

#define SSE_HELPER_V(name, elem, num, F)\

1414

void glue(name, SUFFIX) (Reg *d, Reg *s)\

1415

1416

d->elem(0) = F(d->elem(0), s->elem(0), XMM0.elem(0));\

1417

d->elem(1) = F(d->elem(1), s->elem(1), XMM0.elem(1));\

1418

if (num > 2) {\

1419

d->elem(2) = F(d->elem(2), s->elem(2), XMM0.elem(2));\

1420

d->elem(3) = F(d->elem(3), s->elem(3), XMM0.elem(3));\

1421

if (num > 4) {\

1422

d->elem(4) = F(d->elem(4), s->elem(4), XMM0.elem(4));\

1423

d->elem(5) = F(d->elem(5), s->elem(5), XMM0.elem(5));\

1424

d->elem(6) = F(d->elem(6), s->elem(6), XMM0.elem(6));\

1425

d->elem(7) = F(d->elem(7), s->elem(7), XMM0.elem(7));\

1426

if (num > 8) {\

1427

d->elem(8) = F(d->elem(8), s->elem(8), XMM0.elem(8));\

1428

d->elem(9) = F(d->elem(9), s->elem(9), XMM0.elem(9));\

1429

d->elem(10) = F(d->elem(10), s->elem(10), XMM0.elem(10));\

1430

d->elem(11) = F(d->elem(11), s->elem(11), XMM0.elem(11));\

1431

d->elem(12) = F(d->elem(12), s->elem(12), XMM0.elem(12));\

1432

d->elem(13) = F(d->elem(13), s->elem(13), XMM0.elem(13));\

1433

d->elem(14) = F(d->elem(14), s->elem(14), XMM0.elem(14));\

1434

d->elem(15) = F(d->elem(15), s->elem(15), XMM0.elem(15));\

1435

1436

1437

1438

}

1439

1440

#define SSE_HELPER_I(name, elem, num, F)\

1441

void glue(name, SUFFIX) (Reg *d, Reg *s, uint32_t imm)\

1442

1443

d->elem(0) = F(d->elem(0), s->elem(0), ((imm >> 0) & 1));\

1444

d->elem(1) = F(d->elem(1), s->elem(1), ((imm >> 1) & 1));\

1445

if (num > 2) {\

1446

d->elem(2) = F(d->elem(2), s->elem(2), ((imm >> 2) & 1));\

1447

d->elem(3) = F(d->elem(3), s->elem(3), ((imm >> 3) & 1));\

1448

if (num > 4) {\

1449

d->elem(4) = F(d->elem(4), s->elem(4), ((imm >> 4) & 1));\

1450

d->elem(5) = F(d->elem(5), s->elem(5), ((imm >> 5) & 1));\

1451

d->elem(6) = F(d->elem(6), s->elem(6), ((imm >> 6) & 1));\

1452

d->elem(7) = F(d->elem(7), s->elem(7), ((imm >> 7) & 1));\

1453

if (num > 8) {\

1454

d->elem(8) = F(d->elem(8), s->elem(8), ((imm >> 8) & 1));\

1455

d->elem(9) = F(d->elem(9), s->elem(9), ((imm >> 9) & 1));\

1456

d->elem(10) = F(d->elem(10), s->elem(10), ((imm >> 10) & 1));\

1457

d->elem(11) = F(d->elem(11), s->elem(11), ((imm >> 11) & 1));\

1458

d->elem(12) = F(d->elem(12), s->elem(12), ((imm >> 12) & 1));\

1459

d->elem(13) = F(d->elem(13), s->elem(13), ((imm >> 13) & 1));\

1460

d->elem(14) = F(d->elem(14), s->elem(14), ((imm >> 14) & 1));\

1461

d->elem(15) = F(d->elem(15), s->elem(15), ((imm >> 15) & 1));\

1462

1463

1464

1465

}

1466

1467

/* SSE4.1 op helpers */

1468

#define FBLENDVB(d, s, m) (m & 0x80) ? s : d

1469

#define FBLENDVPS(d, s, m) (m & 0x80000000) ? s : d

1470

#define FBLENDVPD(d, s, m) (m & 0x8000000000000000LL) ? s : d

1471

SSE_HELPER_V(helper_pblendvb, B, 16, FBLENDVB)

1472

SSE_HELPER_V(helper_blendvps, L, 4, FBLENDVPS)

1473

SSE_HELPER_V(helper_blendvpd, Q, 2, FBLENDVPD)

1474

1475

void glue(helper_ptest, SUFFIX) (Reg *d, Reg *s)

1476

{

1477

uint64_t zf = (s->Q(0) & d->Q(0)) | (s->Q(1) & d->Q(1));

1478

uint64_t cf = (s->Q(0) & ~d->Q(0)) | (s->Q(1) & ~d->Q(1));

1479

1480

CC_SRC = (zf ? 0 : CC_Z) | (cf ? 0 : CC_C);

1481

}

1482

1483

#define SSE_HELPER_F(name, elem, num, F)\

1484

void glue(name, SUFFIX) (Reg *d, Reg *s)\

1485

1486

d->elem(0) = F(0);\

1487

d->elem(1) = F(1);\

1488

if (num > 2) {\

1489

d->elem(2) = F(2);\

1490

d->elem(3) = F(3);\

1491

if (num > 4) {\

1492

d->elem(4) = F(4);\

1493

d->elem(5) = F(5);\

1494

d->elem(6) = F(6);\

1495

d->elem(7) = F(7);\

1496

1497

1498

}

1499

1500

SSE_HELPER_F(helper_pmovsxbw, W, 8, (int8_t) s->B)

1501

SSE_HELPER_F(helper_pmovsxbd, L, 4, (int8_t) s->B)

1502

SSE_HELPER_F(helper_pmovsxbq, Q, 2, (int8_t) s->B)

1503

SSE_HELPER_F(helper_pmovsxwd, L, 4, (int16_t) s->W)

1504

SSE_HELPER_F(helper_pmovsxwq, Q, 2, (int16_t) s->W)

1505

SSE_HELPER_F(helper_pmovsxdq, Q, 2, (int32_t) s->L)

1506

SSE_HELPER_F(helper_pmovzxbw, W, 8, s->B)

1507

SSE_HELPER_F(helper_pmovzxbd, L, 4, s->B)

1508

SSE_HELPER_F(helper_pmovzxbq, Q, 2, s->B)

1509

SSE_HELPER_F(helper_pmovzxwd, L, 4, s->W)

1510

SSE_HELPER_F(helper_pmovzxwq, Q, 2, s->W)

1511

SSE_HELPER_F(helper_pmovzxdq, Q, 2, s->L)

1512

1513

void glue(helper_pmuldq, SUFFIX) (Reg *d, Reg *s)

1514

{

1515

d->Q(0) = (int64_t) (int32_t) d->L(0) * (int32_t) s->L(0);

1516

d->Q(1) = (int64_t) (int32_t) d->L(2) * (int32_t) s->L(2);

1517

}

1518

1519

#define FCMPEQQ(d, s) d == s ? -1 : 0

1520

SSE_HELPER_Q(helper_pcmpeqq, FCMPEQQ)

1521

1522

void glue(helper_packusdw, SUFFIX) (Reg *d, Reg *s)

1523

{

1524

d->W(0) = satuw((int32_t) d->L(0));

1525

d->W(1) = satuw((int32_t) d->L(1));

1526

d->W(2) = satuw((int32_t) d->L(2));

1527

d->W(3) = satuw((int32_t) d->L(3));

1528

d->W(4) = satuw((int32_t) s->L(0));

1529

d->W(5) = satuw((int32_t) s->L(1));

1530

d->W(6) = satuw((int32_t) s->L(2));

1531

d->W(7) = satuw((int32_t) s->L(3));

1532

}

1533

1534

#define FMINSB(d, s) MIN((int8_t) d, (int8_t) s)

1535

#define FMINSD(d, s) MIN((int32_t) d, (int32_t) s)

1536

#define FMAXSB(d, s) MAX((int8_t) d, (int8_t) s)

1537

#define FMAXSD(d, s) MAX((int32_t) d, (int32_t) s)

1538

SSE_HELPER_B(helper_pminsb, FMINSB)

1539

SSE_HELPER_L(helper_pminsd, FMINSD)

1540

SSE_HELPER_W(helper_pminuw, MIN)

1541

SSE_HELPER_L(helper_pminud, MIN)

1542

SSE_HELPER_B(helper_pmaxsb, FMAXSB)

1543

SSE_HELPER_L(helper_pmaxsd, FMAXSD)

1544

SSE_HELPER_W(helper_pmaxuw, MAX)

1545

SSE_HELPER_L(helper_pmaxud, MAX)

1546

1547

#define FMULLD(d, s) (int32_t) d * (int32_t) s

1548

SSE_HELPER_L(helper_pmulld, FMULLD)

1549

1550

void glue(helper_phminposuw, SUFFIX) (Reg *d, Reg *s)

1551

{

1552

int idx = 0;

1553

1554

if (s->W(1) < s->W(idx))

1555

idx = 1;

1556

if (s->W(2) < s->W(idx))

1557

idx = 2;

1558

if (s->W(3) < s->W(idx))

1559

idx = 3;

1560

if (s->W(4) < s->W(idx))

1561

idx = 4;

1562

if (s->W(5) < s->W(idx))

1563

idx = 5;

1564

if (s->W(6) < s->W(idx))

1565

idx = 6;

1566

if (s->W(7) < s->W(idx))

1567

idx = 7;

1568

1569

d->Q(1) = 0;

1570

d->L(1) = 0;

1571

d->W(1) = idx;

1572

d->W(0) = s->W(idx);

1573

}

1574

1575

void glue(helper_roundps, SUFFIX) (Reg *d, Reg *s, uint32_t mode)

1576

{

1577

signed char prev_rounding_mode;

1578

1579

prev_rounding_mode = env->sse_status.float_rounding_mode;

1580

if (!(mode & (1 << 2)))

1581

switch (mode & 3) {

1582

case 0:

1583

set_float_rounding_mode(float_round_nearest_even, &env->sse_status);

1584

break;

1585

case 1:

1586

set_float_rounding_mode(float_round_down, &env->sse_status);

1587

break;

1588

case 2:

1589

set_float_rounding_mode(float_round_up, &env->sse_status);

1590

break;

1591

case 3:

1592

set_float_rounding_mode(float_round_to_zero, &env->sse_status);

1593

break;

1594

}

1595

1596

d->L(0) = float64_round_to_int(s->L(0), &env->sse_status);

1597

d->L(1) = float64_round_to_int(s->L(1), &env->sse_status);

1598

d->L(2) = float64_round_to_int(s->L(2), &env->sse_status);

1599

d->L(3) = float64_round_to_int(s->L(3), &env->sse_status);

1600

1601

#if 0 /* TODO */

1602

if (mode & (1 << 3))

1603

set_float_exception_flags(

1604

get_float_exception_flags(&env->sse_status) &

1605

~float_flag_inexact,

1606

&env->sse_status);

1607

#endif

1608

env->sse_status.float_rounding_mode = prev_rounding_mode;

1609

}

1610

1611

void glue(helper_roundpd, SUFFIX) (Reg *d, Reg *s, uint32_t mode)

1612

{

1613

signed char prev_rounding_mode;

1614

1615

prev_rounding_mode = env->sse_status.float_rounding_mode;

1616

if (!(mode & (1 << 2)))

1617

switch (mode & 3) {

1618

case 0:

1619

set_float_rounding_mode(float_round_nearest_even, &env->sse_status);

1620

break;

1621

case 1:

1622

set_float_rounding_mode(float_round_down, &env->sse_status);

1623

break;

1624

case 2:

1625

set_float_rounding_mode(float_round_up, &env->sse_status);

1626

break;

1627

case 3:

1628

set_float_rounding_mode(float_round_to_zero, &env->sse_status);

1629

break;

1630

}

1631

1632

d->Q(0) = float64_round_to_int(s->Q(0), &env->sse_status);

1633

d->Q(1) = float64_round_to_int(s->Q(1), &env->sse_status);

1634

1635

#if 0 /* TODO */

1636

if (mode & (1 << 3))

1637

set_float_exception_flags(

1638

get_float_exception_flags(&env->sse_status) &

1639

~float_flag_inexact,

1640

&env->sse_status);

1641

#endif

1642

env->sse_status.float_rounding_mode = prev_rounding_mode;

1643

}

1644

1645

void glue(helper_roundss, SUFFIX) (Reg *d, Reg *s, uint32_t mode)

1646

{

1647

signed char prev_rounding_mode;

1648

1649

prev_rounding_mode = env->sse_status.float_rounding_mode;

1650

if (!(mode & (1 << 2)))

1651

switch (mode & 3) {

1652

case 0:

1653

set_float_rounding_mode(float_round_nearest_even, &env->sse_status);

1654

break;

1655

case 1:

1656

set_float_rounding_mode(float_round_down, &env->sse_status);

1657

break;

1658

case 2:

1659

set_float_rounding_mode(float_round_up, &env->sse_status);

1660

break;

1661

case 3:

1662

set_float_rounding_mode(float_round_to_zero, &env->sse_status);

1663

break;

1664

}

1665

1666

d->L(0) = float64_round_to_int(s->L(0), &env->sse_status);

1667

1668

#if 0 /* TODO */

1669

if (mode & (1 << 3))

1670

set_float_exception_flags(

1671

get_float_exception_flags(&env->sse_status) &

1672

~float_flag_inexact,

1673

&env->sse_status);

1674

#endif

1675

env->sse_status.float_rounding_mode = prev_rounding_mode;

1676

}

1677

1678

void glue(helper_roundsd, SUFFIX) (Reg *d, Reg *s, uint32_t mode)

1679

{

1680

signed char prev_rounding_mode;

1681

1682

prev_rounding_mode = env->sse_status.float_rounding_mode;

1683

if (!(mode & (1 << 2)))

1684

switch (mode & 3) {

1685

case 0:

1686

set_float_rounding_mode(float_round_nearest_even, &env->sse_status);

1687

break;

1688

case 1:

1689

set_float_rounding_mode(float_round_down, &env->sse_status);

1690

break;

1691

case 2:

1692

set_float_rounding_mode(float_round_up, &env->sse_status);

1693

break;

1694

case 3:

1695

set_float_rounding_mode(float_round_to_zero, &env->sse_status);

1696

break;

1697

}

1698

1699

d->Q(0) = float64_round_to_int(s->Q(0), &env->sse_status);

1700

1701

#if 0 /* TODO */

1702

if (mode & (1 << 3))

1703

set_float_exception_flags(

1704

get_float_exception_flags(&env->sse_status) &

1705

~float_flag_inexact,

1706

&env->sse_status);

1707

#endif

1708

env->sse_status.float_rounding_mode = prev_rounding_mode;

1709

}

1710

1711

#define FBLENDP(d, s, m) m ? s : d

1712

SSE_HELPER_I(helper_blendps, L, 4, FBLENDP)

1713

SSE_HELPER_I(helper_blendpd, Q, 2, FBLENDP)

1714

SSE_HELPER_I(helper_pblendw, W, 8, FBLENDP)

1715

1716

void glue(helper_dpps, SUFFIX) (Reg *d, Reg *s, uint32_t mask)

1717

{

1718

float32 iresult = 0 /*float32_zero*/;

1719

1720

if (mask & (1 << 4))

1721

iresult = float32_add(iresult,

1722

float32_mul(d->L(0), s->L(0), &env->sse_status),

1723

&env->sse_status);

1724

if (mask & (1 << 5))

1725

iresult = float32_add(iresult,

1726

float32_mul(d->L(1), s->L(1), &env->sse_status),

1727

&env->sse_status);

1728

if (mask & (1 << 6))

1729

iresult = float32_add(iresult,

1730

float32_mul(d->L(2), s->L(2), &env->sse_status),

1731

&env->sse_status);

1732

if (mask & (1 << 7))

1733

iresult = float32_add(iresult,

1734

float32_mul(d->L(3), s->L(3), &env->sse_status),

1735

&env->sse_status);

1736

d->L(0) = (mask & (1 << 0)) ? iresult : 0 /*float32_zero*/;

1737

d->L(1) = (mask & (1 << 1)) ? iresult : 0 /*float32_zero*/;

1738

d->L(2) = (mask & (1 << 2)) ? iresult : 0 /*float32_zero*/;

1739

d->L(3) = (mask & (1 << 3)) ? iresult : 0 /*float32_zero*/;

1740

}

1741

1742

void glue(helper_dppd, SUFFIX) (Reg *d, Reg *s, uint32_t mask)

1743

{

1744

float64 iresult = 0 /*float64_zero*/;

1745

1746

if (mask & (1 << 4))

1747

iresult = float64_add(iresult,

1748

float64_mul(d->Q(0), s->Q(0), &env->sse_status),

1749

&env->sse_status);

1750

if (mask & (1 << 5))

1751

iresult = float64_add(iresult,

1752

float64_mul(d->Q(1), s->Q(1), &env->sse_status),

1753

&env->sse_status);

1754

d->Q(0) = (mask & (1 << 0)) ? iresult : 0 /*float64_zero*/;

1755

d->Q(1) = (mask & (1 << 1)) ? iresult : 0 /*float64_zero*/;

1756

}

1757

1758

void glue(helper_mpsadbw, SUFFIX) (Reg *d, Reg *s, uint32_t offset)

1759

{

1760

int s0 = (offset & 3) << 2;

1761

int d0 = (offset & 4) << 0;

1762

int i;

1763

Reg r;

1764

1765

for (i = 0; i < 8; i++, d0++) {

1766

r.W(i) = 0;

1767

r.W(i) += abs1(d->B(d0 + 0) - s->B(s0 + 0));

1768

r.W(i) += abs1(d->B(d0 + 1) - s->B(s0 + 1));

1769

r.W(i) += abs1(d->B(d0 + 2) - s->B(s0 + 2));

1770

r.W(i) += abs1(d->B(d0 + 3) - s->B(s0 + 3));

1771

}

1772

1773

*d = r;

1774

}

1775

1776

/* SSE4.2 op helpers */

1777

/* it's unclear whether signed or unsigned */

1778

#define FCMPGTQ(d, s) d > s ? -1 : 0

1779

SSE_HELPER_Q(helper_pcmpgtq, FCMPGTQ)

1780

1781

static inline int pcmp_elen(int reg, uint32_t ctrl)

1782

{

1783

int val;

1784

1785

/* Presence of REX.W is indicated by a bit higher than 7 set */

1786

if (ctrl >> 8)

1787

val = abs1((int64_t) env->regs[reg]);

1788

else

1789

val = abs1((int32_t) env->regs[reg]);

1790

1791

if (ctrl & 1) {

1792

if (val > 8)

1793

return 8;

1794

} else

1795

if (val > 16)

1796

return 16;

1797

1798

return val;

1799

}

1800

1801

static inline int pcmp_ilen(Reg *r, uint8_t ctrl)

1802

{

1803

int val = 0;

1804

1805

if (ctrl & 1) {

1806

while (val < 8 && r->W(val))

1807

val++;

1808

} else

1809

while (val < 16 && r->B(val))

1810

val++;

1811

1812

return val;

1813

}

1814

1815

static inline int pcmp_val(Reg *r, uint8_t ctrl, int i)

1816

{

1817

switch ((ctrl >> 0) & 3) {

1818

case 0:

1819

return r->B(i);

1820

case 1:

1821

return r->W(i);

1822

case 2:

1823

return (int8_t) r->B(i);

1824

case 3:

1825

default:

1826

return (int16_t) r->W(i);

1827

}

1828

}

1829

1830

static inline unsigned pcmpxstrx(Reg *d, Reg *s,

1831

int8_t ctrl, int valids, int validd)

1832

{

1833

unsigned int res = 0;

1834

int v;

1835

int j, i;

1836

int upper = (ctrl & 1) ? 7 : 15;

1837

1838

valids--;

1839

validd--;

1840

1841

CC_SRC = (valids < upper ? CC_Z : 0) | (validd < upper ? CC_S : 0);

1842

1843

switch ((ctrl >> 2) & 3) {

1844

case 0:

1845

for (j = valids; j >= 0; j--) {

1846

res <<= 1;

1847

v = pcmp_val(s, ctrl, j);

1848

for (i = validd; i >= 0; i--)

1849

res |= (v == pcmp_val(d, ctrl, i));

1850

}

1851

break;

1852

case 1:

1853

for (j = valids; j >= 0; j--) {

1854

res <<= 1;

1855

v = pcmp_val(s, ctrl, j);

1856

for (i = ((validd - 1) | 1); i >= 0; i -= 2)

1857

res |= (pcmp_val(d, ctrl, i - 0) <= v &&

1858

pcmp_val(d, ctrl, i - 1) >= v);

1859

}

1860

break;

1861

case 2:

1862

res = (2 << (upper - MAX(valids, validd))) - 1;

1863

res <<= MAX(valids, validd) - MIN(valids, validd);

1864

for (i = MIN(valids, validd); i >= 0; i--) {

1865

res <<= 1;

1866

v = pcmp_val(s, ctrl, i);

1867

res |= (v == pcmp_val(d, ctrl, i));

1868

}

1869

break;

1870

case 3:

1871

for (j = valids - validd; j >= 0; j--) {

1872

res <<= 1;

1873

res |= 1;

1874

for (i = MIN(upper - j, validd); i >= 0; i--)

1875

res &= (pcmp_val(s, ctrl, i + j) == pcmp_val(d, ctrl, i));

1876

}

1877

break;

1878

}

1879

1880

switch ((ctrl >> 4) & 3) {

1881

case 1:

1882

res ^= (2 << upper) - 1;

1883

break;

1884

case 3:

1885

res ^= (2 << valids) - 1;

1886

break;

1887

}

1888

1889

if (res)

1890

CC_SRC |= CC_C;

1891

if (res & 1)

1892

CC_SRC |= CC_O;

1893

1894

return res;

1895

}

1896

1897

static inline int rffs1(unsigned int val)

1898

{

1899

int ret = 1, hi;

1900

1901

for (hi = sizeof(val) * 4; hi; hi /= 2)

1902

if (val >> hi) {

1903

val >>= hi;

1904

ret += hi;

1905

}

1906

1907

return ret;

1908

}

1909

1910

static inline int ffs1(unsigned int val)

1911

{

1912

int ret = 1, hi;

1913

1914

for (hi = sizeof(val) * 4; hi; hi /= 2)

1915

if (val << hi) {

1916

val <<= hi;

1917

ret += hi;

1918

}

1919

1920

return ret;

1921

}

1922

1923

void glue(helper_pcmpestri, SUFFIX) (Reg *d, Reg *s, uint32_t ctrl)

1924

{

1925

unsigned int res = pcmpxstrx(d, s, ctrl,

1926

pcmp_elen(R_EDX, ctrl),

1927

pcmp_elen(R_EAX, ctrl));

1928

1929

if (res)

1930

env->regs[R_ECX] = ((ctrl & (1 << 6)) ? rffs1 : ffs1)(res) - 1;

1931

else

1932

env->regs[R_ECX] = 16 >> (ctrl & (1 << 0));

1933

}

1934

1935

void glue(helper_pcmpestrm, SUFFIX) (Reg *d, Reg *s, uint32_t ctrl)

1936

{

1937

int i;

1938

unsigned int res = pcmpxstrx(d, s, ctrl,

1939

pcmp_elen(R_EDX, ctrl),

1940

pcmp_elen(R_EAX, ctrl));

1941

1942

if ((ctrl >> 6) & 1) {

1943

if (ctrl & 1)

1944

for (i = 0; i <= 8; i--, res >>= 1)

1945

d->W(i) = (res & 1) ? ~0 : 0;

1946

else

1947

for (i = 0; i <= 16; i--, res >>= 1)

1948

d->B(i) = (res & 1) ? ~0 : 0;

1949

} else {

1950

d->Q(1) = 0;

1951

d->Q(0) = res;

1952

}

1953

}

1954

1955

void glue(helper_pcmpistri, SUFFIX) (Reg *d, Reg *s, uint32_t ctrl)

1956

{

1957

unsigned int res = pcmpxstrx(d, s, ctrl,

1958

pcmp_ilen(s, ctrl),

1959

pcmp_ilen(d, ctrl));

1960

1961

if (res)

1962

env->regs[R_ECX] = ((ctrl & (1 << 6)) ? rffs1 : ffs1)(res) - 1;

1963

else

1964

env->regs[R_ECX] = 16 >> (ctrl & (1 << 0));

1965

}

1966

1967

void glue(helper_pcmpistrm, SUFFIX) (Reg *d, Reg *s, uint32_t ctrl)

1968

{

1969

int i;

1970

unsigned int res = pcmpxstrx(d, s, ctrl,

1971

pcmp_ilen(s, ctrl),

1972

pcmp_ilen(d, ctrl));

1973

1974

if ((ctrl >> 6) & 1) {

1975

if (ctrl & 1)

1976

for (i = 0; i <= 8; i--, res >>= 1)

1977

d->W(i) = (res & 1) ? ~0 : 0;

1978

else

1979

for (i = 0; i <= 16; i--, res >>= 1)

1980

d->B(i) = (res & 1) ? ~0 : 0;

1981

} else {

1982

d->Q(1) = 0;

1983

d->Q(0) = res;

1984

}

1985

}

1986

1987

#define CRCPOLY 0x1edc6f41

1988

#define CRCPOLY_BITREV 0x82f63b78

1989

target_ulong helper_crc32(uint32_t crc1, target_ulong msg, uint32_t len)

1990

{

1991

target_ulong crc = (msg & ((target_ulong) -1 >>

1992

(TARGET_LONG_BITS - len))) ^ crc1;

1993

1994

while (len--)

1995

crc = (crc >> 1) ^ ((crc & 1) ? CRCPOLY_BITREV : 0);

1996

1997

return crc;

1998

}

1999

2000

#define POPMASK(i) ((target_ulong) -1 / ((1LL << (1 << i)) + 1))

2001

#define POPCOUNT(n, i) (n & POPMASK(i)) + ((n >> (1 << i)) & POPMASK(i))

2002

target_ulong helper_popcnt(target_ulong n, uint32_t type)

2003

{

2004

CC_SRC = n ? 0 : CC_Z;

2005

2006

n = POPCOUNT(n, 0);

2007

n = POPCOUNT(n, 1);

2008

n = POPCOUNT(n, 2);

2009

n = POPCOUNT(n, 3);

2010

if (type == 1)

2011

return n & 0xff;

2012

2013

n = POPCOUNT(n, 4);

2014

#ifndef TARGET_X86_64

2015

return n;

2016

#else

2017

if (type == 2)

2018

return n & 0xff;

2019

2020

return POPCOUNT(n, 5);

2021

#endif

2022

}

2023

#endif

2024

1386

2025

#undef SHIFT

1387

2026

#undef XMM_ONLY

1388

2027

#undef Reg

Older »