~ppsspp/ppsspp/ppsspp_1.3.0

_assert_msg_(DYNA_REC, !(imm & ((size - 1) >> 3)), "%s(INDEX_UNSIGNED) immediate offset must be aligned to size! (%d) (%p)", __FUNCTION__, imm, m_emit->GetCodePointer());

2134

_assert_msg_(DYNA_REC, imm >= 0, "%s(INDEX_UNSIGNED) immediate offset must be positive!", __FUNCTION__);

2135

if (size == 16)

2136

imm >>= 1;

2137

else if (size == 32)

2138

imm >>= 2;

2139

else if (size == 64)

2140

imm >>= 3;

2141

else if (size == 128)

2142

imm >>= 4;

2143

encoded_imm = (imm & 0xFFF);

2144

}

2145

else

2146

{

2147

_assert_msg_(DYNA_REC, !(imm < -256 || imm > 255), "%s immediate offset must be within range of -256 to 256!", __FUNCTION__);

2148

encoded_imm = (imm & 0x1FF) << 2;

2149

if (type == INDEX_POST)

2150

encoded_imm |= 1;

2151

else

2152

encoded_imm |= 3;

2153

}

2154

2155

Write32((encoded_size << 30) | (0xF << 26) | (type == INDEX_UNSIGNED ? (1 << 24) : 0) | \

2156

(size == 128 ? (1 << 23) : 0) | (opc << 22) | (encoded_imm << 10) | (Rn << 5) | Rt);

2157

}

2158

2159

void ARM64FloatEmitter::EmitScalar2Source(bool M, bool S, u32 type, u32 opcode, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

2160

{

2161

_assert_msg_(DYNA_REC, !IsQuad(Rd), "%s only supports double and single registers!", __FUNCTION__);

2162

Rd = DecodeReg(Rd);

2163

Rn = DecodeReg(Rn);

2164

Rm = DecodeReg(Rm);

2165

2166

Write32((M << 31) | (S << 29) | (0xF1 << 21) | (type << 22) | (Rm << 16) | \

2167

(opcode << 12) | (1 << 11) | (Rn << 5) | Rd);

2168

}

2169

2170

void ARM64FloatEmitter::EmitThreeSame(bool U, u32 size, u32 opcode, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

2171

{

2172

_assert_msg_(DYNA_REC, !IsSingle(Rd), "%s doesn't support singles!", __FUNCTION__);

2173

bool quad = IsQuad(Rd);

2174

Rd = DecodeReg(Rd);

2175

Rn = DecodeReg(Rn);

2176

Rm = DecodeReg(Rm);

2177

2178

Write32((quad << 30) | (U << 29) | (0x71 << 21) | (size << 22) | \

2179

(Rm << 16) | (opcode << 11) | (1 << 10) | (Rn << 5) | Rd);

2180

}

2181

2182

void ARM64FloatEmitter::EmitCopy(bool Q, u32 op, u32 imm5, u32 imm4, ARM64Reg Rd, ARM64Reg Rn)

2183

{

2184

Rd = DecodeReg(Rd);

2185

Rn = DecodeReg(Rn);

2186

2187

Write32((Q << 30) | (op << 29) | (0x7 << 25) | (imm5 << 16) | (imm4 << 11) | \

2188

(1 << 10) | (Rn << 5) | Rd);

2189

}

2190

2191

void ARM64FloatEmitter::Emit2RegMisc(bool Q, bool U, u32 size, u32 opcode, ARM64Reg Rd, ARM64Reg Rn)

2192

{

2193

_assert_msg_(DYNA_REC, !IsSingle(Rd), "%s doesn't support singles!", __FUNCTION__);

2194

Rd = DecodeReg(Rd);

2195

Rn = DecodeReg(Rn);

2196

2197

Write32((Q << 30) | (U << 29) | (0x71 << 21) | (size << 22) | \

2198

(opcode << 12) | (1 << 11) | (Rn << 5) | Rd);

2199

}

2200

2201

void ARM64FloatEmitter::EmitLoadStoreSingleStructure(bool L, bool R, u32 opcode, bool S, u32 size, ARM64Reg Rt, ARM64Reg Rn)

2202

{

2203

_assert_msg_(DYNA_REC, !IsSingle(Rt), "%s doesn't support singles!", __FUNCTION__);

2204

bool quad = IsQuad(Rt);

2205

Rt = DecodeReg(Rt);

2206

Rn = DecodeReg(Rn);

2207

2208

Write32((quad << 30) | (0xD << 24) | (L << 22) | (R << 21) | (opcode << 13) | \

2209

(S << 12) | (size << 10) | (Rn << 5) | Rt);

2210

}

2211

2212

void ARM64FloatEmitter::EmitLoadStoreSingleStructure(bool L, bool R, u32 opcode, bool S, u32 size, ARM64Reg Rt, ARM64Reg Rn, ARM64Reg Rm)

2213

{

2214

_assert_msg_(DYNA_REC, !IsSingle(Rt), "%s doesn't support singles!", __FUNCTION__);

2215

bool quad = IsQuad(Rt);

2216

Rt = DecodeReg(Rt);

2217

Rn = DecodeReg(Rn);

2218

Rm = DecodeReg(Rm);

2219

2220

Write32((quad << 30) | (0x1B << 23) | (L << 22) | (R << 21) | (Rm << 16) | \

2221

(opcode << 13) | (S << 12) | (size << 10) | (Rn << 5) | Rt);

2222

}

2223

2224

void ARM64FloatEmitter::Emit1Source(bool M, bool S, u32 type, u32 opcode, ARM64Reg Rd, ARM64Reg Rn)

2225

{

2226

_assert_msg_(DYNA_REC, !IsQuad(Rd), "%s doesn't support vector!", __FUNCTION__);

2227

Rd = DecodeReg(Rd);

2228

Rn = DecodeReg(Rn);

2229

2230

Write32((M << 31) | (S << 29) | (0xF1 << 21) | (type << 22) | (opcode << 15) | \

2231

(1 << 14) | (Rn << 5) | Rd);

2232

}

2233

2234

void ARM64FloatEmitter::EmitConversion(bool sf, bool S, u32 type, u32 rmode, u32 opcode, ARM64Reg Rd, ARM64Reg Rn)

2235

{

2236

_assert_msg_(DYNA_REC, Rn <= SP, "%s only supports GPR as source!", __FUNCTION__);

2237

Rd = DecodeReg(Rd);

2238

Rn = DecodeReg(Rn);

2239

2240

Write32((sf << 31) | (S << 29) | (0xF1 << 21) | (type << 22) | (rmode << 19) | \

2241

(opcode << 16) | (Rn << 5) | Rd);

2242

}

2243

2244

void ARM64FloatEmitter::EmitConvertScalarToInt(ARM64Reg Rd, ARM64Reg Rn, RoundingMode round, bool sign)

2245

{

2246

_dbg_assert_msg_(JIT, IsScalar(Rn), "fcvts: Rn must be floating point");

2247

if (IsGPR(Rd)) {

2248

// Use the encoding that transfers the result to a GPR.

2249

bool sf = Is64Bit(Rd);

2250

int type = IsDouble(Rn) ? 1 : 0;

2251

Rd = DecodeReg(Rd);

2252

Rn = DecodeReg(Rn);

2253

int opcode = (sign ? 1 : 0);

2254

int rmode = 0;

2255

switch (round) {

2256

case ROUND_A: rmode = 0; opcode |= 4; break;

2257

case ROUND_P: rmode = 1; break;

2258

case ROUND_M: rmode = 2; break;

2259

case ROUND_Z: rmode = 3; break;

2260

case ROUND_N: rmode = 0; break;

2261

}

2262

EmitConversion2(sf, 0, true, type, rmode, opcode, 0, Rd, Rn);

2263

}

2264

else

2265

{

2266

// Use the encoding (vector, single) that keeps the result in the fp register.

2267

int sz = IsDouble(Rn);

2268

Rd = DecodeReg(Rd);

2269

Rn = DecodeReg(Rn);

2270

int opcode = 0;

2271

switch (round) {

2272

case ROUND_A: opcode = 0x1C; break;

2273

case ROUND_N: opcode = 0x1A; break;

2274

case ROUND_M: opcode = 0x1B; break;

2275

case ROUND_P: opcode = 0x1A; sz |= 2; break;

2276

case ROUND_Z: opcode = 0x1B; sz |= 2; break;

2277

}

2278

Write32((0x5E << 24) | (sign << 29) | (sz << 22) | (1 << 21) | (opcode << 12) | (2 << 10) | (Rn << 5) | Rd);

2279

}

2280

}

2281

2282

void ARM64FloatEmitter::FCVTS(ARM64Reg Rd, ARM64Reg Rn, RoundingMode round) {

2283

EmitConvertScalarToInt(Rd, Rn, round, false);

2284

}

2285

2286

void ARM64FloatEmitter::FCVTU(ARM64Reg Rd, ARM64Reg Rn, RoundingMode round) {

2287

EmitConvertScalarToInt(Rd, Rn, round, true);

2288

}

2289

2290

void ARM64FloatEmitter::EmitConversion2(bool sf, bool S, bool direction, u32 type, u32 rmode, u32 opcode, int scale, ARM64Reg Rd, ARM64Reg Rn)

2291

{

2292

Rd = DecodeReg(Rd);

2293

Rn = DecodeReg(Rn);

2294

2295

Write32((sf << 31) | (S << 29) | (0xF0 << 21) | (direction << 21) | (type << 22) | (rmode << 19) | \

2296

(opcode << 16) | (scale << 10) | (Rn << 5) | Rd);

2297

}

2298

2299

void ARM64FloatEmitter::EmitCompare(bool M, bool S, u32 op, u32 opcode2, ARM64Reg Rn, ARM64Reg Rm)

2300

{

2301

_assert_msg_(DYNA_REC, !IsQuad(Rn), "%s doesn't support vector!", __FUNCTION__);

2302

bool is_double = IsDouble(Rn);

2303

2304

Rn = DecodeReg(Rn);

2305

Rm = DecodeReg(Rm);

2306

2307

Write32((M << 31) | (S << 29) | (0xF1 << 21) | (is_double << 22) | (Rm << 16) | \

2308

(op << 14) | (1 << 13) | (Rn << 5) | opcode2);

2309

}

2310

2311

void ARM64FloatEmitter::EmitCondSelect(bool M, bool S, CCFlags cond, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

2312

{

2313

_assert_msg_(DYNA_REC, !IsQuad(Rd), "%s doesn't support vector!", __FUNCTION__);

2314

bool is_double = IsDouble(Rd);

2315

2316

Rd = DecodeReg(Rd);

2317

Rn = DecodeReg(Rn);

2318

Rm = DecodeReg(Rm);

2319

2320

Write32((M << 31) | (S << 29) | (0xF1 << 21) | (is_double << 22) | (Rm << 16) | \

2321

(cond << 12) | (3 << 10) | (Rn << 5) | Rd);

2322

}

2323

2324

void ARM64FloatEmitter::EmitPermute(u32 size, u32 op, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

2325

{

2326

_assert_msg_(DYNA_REC, !IsSingle(Rd), "%s doesn't support singles!", __FUNCTION__);

2327

2328

bool quad = IsQuad(Rd);

2329

2330

u32 encoded_size = 0;

2331

if (size == 16)

2332

encoded_size = 1;

2333

else if (size == 32)

2334

encoded_size = 2;

2335

else if (size == 64)

2336

encoded_size = 3;

2337

2338

Rd = DecodeReg(Rd);

2339

Rn = DecodeReg(Rn);

2340

Rm = DecodeReg(Rm);

2341

2342

Write32((quad << 30) | (7 << 25) | (encoded_size << 22) | (Rm << 16) | (op << 12) | \

2343

(1 << 11) | (Rn << 5) | Rd);

2344

}

2345

2346

void ARM64FloatEmitter::EmitScalarImm(bool M, bool S, u32 type, u32 imm5, ARM64Reg Rd, u32 imm8)

2347

{

2348

_assert_msg_(DYNA_REC, !IsQuad(Rd), "%s doesn't support vector!", __FUNCTION__);

2349

2350

bool is_double = !IsSingle(Rd);

2351

2352

Rd = DecodeReg(Rd);

2353

2354

Write32((M << 31) | (S << 29) | (0xF1 << 21) | (is_double << 22) | (type << 22) | \

2355

(imm8 << 13) | (1 << 12) | (imm5 << 5) | Rd);

2356

}

2357

2358

void ARM64FloatEmitter::EmitShiftImm(bool Q, bool U, u32 immh, u32 immb, u32 opcode, ARM64Reg Rd, ARM64Reg Rn)

2359

{

2360

_assert_msg_(DYNA_REC, immh, "%s bad encoding! Can't have zero immh", __FUNCTION__);

2361

2362

Rd = DecodeReg(Rd);

2363

Rn = DecodeReg(Rn);

2364

2365

Write32((Q << 30) | (U << 29) | (0xF << 24) | (immh << 19) | (immb << 16) | \

2366

(opcode << 11) | (1 << 10) | (Rn << 5) | Rd);

2367

}

2368

2369

void ARM64FloatEmitter::EmitScalarShiftImm(bool U, u32 immh, u32 immb, u32 opcode, ARM64Reg Rd, ARM64Reg Rn) {

2370

Rd = DecodeReg(Rd);

2371

Rn = DecodeReg(Rn);

2372

2373

Write32((2 << 30) | (U << 29) | (0x3E << 23) | (immh << 19) | (immb << 16) | (opcode << 11) | (1 << 10) | (Rn << 5) | Rd);

2374

}

2375

2376

void ARM64FloatEmitter::EmitLoadStoreMultipleStructure(u32 size, bool L, u32 opcode, ARM64Reg Rt, ARM64Reg Rn)

2377

{

2378

bool quad = IsQuad(Rt);

2379

u32 encoded_size = 0;

2380

2381

if (size == 16)

2382

encoded_size = 1;

2383

else if (size == 32)

2384

encoded_size = 2;

2385

else if (size == 64)

2386

encoded_size = 3;

2387

2388

Rt = DecodeReg(Rt);

2389

Rn = DecodeReg(Rn);

2390

2391

Write32((quad << 30) | (3 << 26) | (L << 22) | (opcode << 12) | \

2392

(encoded_size << 10) | (Rn << 5) | Rt);

2393

}

2394

2395

void ARM64FloatEmitter::EmitLoadStoreMultipleStructurePost(u32 size, bool L, u32 opcode, ARM64Reg Rt, ARM64Reg Rn, ARM64Reg Rm)

2396

{

2397

bool quad = IsQuad(Rt);

2398

u32 encoded_size = 0;

2399

2400

if (size == 16)

2401

encoded_size = 1;

2402

else if (size == 32)

2403

encoded_size = 2;

2404

else if (size == 64)

2405

encoded_size = 3;

2406

2407

Rt = DecodeReg(Rt);

2408

Rn = DecodeReg(Rn);

2409

Rm = DecodeReg(Rm);

2410

2411

Write32((quad << 30) | (0x19 << 23) | (L << 22) | (Rm << 16) | (opcode << 12) | \

2412

(encoded_size << 10) | (Rn << 5) | Rt);

2413

2414

}

2415

2416

void ARM64FloatEmitter::EmitScalar1Source(bool M, bool S, u32 type, u32 opcode, ARM64Reg Rd, ARM64Reg Rn)

2417

{

2418

_assert_msg_(DYNA_REC, !IsQuad(Rd), "%s doesn't support vector!", __FUNCTION__);

2419

2420

Rd = DecodeReg(Rd);

2421

Rn = DecodeReg(Rn);

2422

2423

Write32((M << 31) | (S << 29) | (0xF1 << 21) | (type << 22) | \

2424

(opcode << 15) | (1 << 14) | (Rn << 5) | Rd);

2425

}

2426

2427

void ARM64FloatEmitter::EmitVectorxElement(bool U, u32 size, bool L, u32 opcode, bool H, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

2428

{

2429

bool quad = IsQuad(Rd);

2430

2431

Rd = DecodeReg(Rd);

2432

Rn = DecodeReg(Rn);

2433

Rm = DecodeReg(Rm);

2434

2435

Write32((quad << 30) | (U << 29) | (0xF << 24) | (size << 22) | (L << 21) | \

2436

(Rm << 16) | (opcode << 12) | (H << 11) | (Rn << 5) | Rd);

2437

}

2438

2439

void ARM64FloatEmitter::EmitLoadStoreUnscaled(u32 size, u32 op, ARM64Reg Rt, ARM64Reg Rn, s32 imm)

2440

{

2441

_assert_msg_(DYNA_REC, !(imm < -256 || imm > 255), "%s received too large offset: %d", __FUNCTION__, imm);

2442

Rt = DecodeReg(Rt);

2443

Rn = DecodeReg(Rn);

2444

2445

Write32((size << 30) | (0xF << 26) | (op << 22) | ((imm & 0x1FF) << 12) | (Rn << 5) | Rt);

2446

}

2447

2448

void ARM64FloatEmitter::EncodeLoadStorePair(u32 size, bool load, IndexType type, ARM64Reg Rt, ARM64Reg Rt2, ARM64Reg Rn, s32 imm)

2449

{

2450

u32 type_encode = 0;

2451

u32 opc = 0;

2452

2453

switch (type)

2454

{

2455

case INDEX_SIGNED:

2456

type_encode = 2;

2457

break;

2458

case INDEX_POST:

2459

type_encode = 1;

2460

break;

2461

case INDEX_PRE:

2462

type_encode = 3;

2463

break;

2464

case INDEX_UNSIGNED:

2465

_assert_msg_(DYNA_REC, false, "%s doesn't support INDEX_UNSIGNED!", __FUNCTION__);

2466

break;

2467

}

2468

2469

if (size == 128)

2470

{

2471

_assert_msg_(DYNA_REC, !(imm & 0xF), "%s received invalid offset 0x%x!", __FUNCTION__, imm);

2472

opc = 2;

2473

imm >>= 4;

2474

}

2475

else if (size == 64)

2476

{

2477

_assert_msg_(DYNA_REC, !(imm & 0x7), "%s received invalid offset 0x%x!", __FUNCTION__, imm);

2478

opc = 1;

2479

imm >>= 3;

2480

}

2481

else if (size == 32)

2482

{

2483

_assert_msg_(DYNA_REC, !(imm & 0x3), "%s received invalid offset 0x%x!", __FUNCTION__, imm);

2484

opc = 0;

2485

imm >>= 2;

2486

}

2487

2488

Rt = DecodeReg(Rt);

2489

Rt2 = DecodeReg(Rt2);

2490

Rn = DecodeReg(Rn);

2491

2492

Write32((opc << 30) | (0xB << 26) | (type_encode << 23) | (load << 22) | \

2493

((imm & 0x7F) << 15) | (Rt2 << 10) | (Rn << 5) | Rt);

2494

2495

}

2496

2497

void ARM64FloatEmitter::EncodeLoadStoreRegisterOffset(u32 size, bool load, ARM64Reg Rt, ARM64Reg Rn, ArithOption Rm)

2498

{

2499

_assert_msg_(DYNA_REC, Rm.GetType() == ArithOption::TYPE_EXTENDEDREG, "%s must contain an extended reg as Rm!", __FUNCTION__);

2500

2501

u32 encoded_size = 0;

2502

u32 encoded_op = 0;

2503

2504

if (size == 8)

2505

{

2506

encoded_size = 0;

2507

encoded_op = 0;

2508

}

2509

else if (size == 16)

2510

{

2511

encoded_size = 1;

2512

encoded_op = 0;

2513

}

2514

else if (size == 32)

2515

{

2516

encoded_size = 2;

2517

encoded_op = 0;

2518

}

2519

else if (size == 64)

2520

{

2521

encoded_size = 3;

2522

encoded_op = 0;

2523

}

2524

else if (size == 128)

2525

{

2526

encoded_size = 0;

2527

encoded_op = 2;

2528

}

2529

2530

if (load)

2531

encoded_op |= 1;

2532

2533

Rt = DecodeReg(Rt);

2534

Rn = DecodeReg(Rn);

2535

ARM64Reg decoded_Rm = DecodeReg(Rm.GetReg());

2536

2537

Write32((encoded_size << 30) | (encoded_op << 22) | (0x1E1 << 21) | (decoded_Rm << 16) | \

2538

Rm.GetData() | (1 << 11) | (Rn << 5) | Rt);

2539

}

2540

2541

void ARM64FloatEmitter::LDR(u8 size, IndexType type, ARM64Reg Rt, ARM64Reg Rn, s32 imm)

2542

{

2543

EmitLoadStoreImmediate(size, 1, type, Rt, Rn, imm);

2544

}

2545

void ARM64FloatEmitter::STR(u8 size, IndexType type, ARM64Reg Rt, ARM64Reg Rn, s32 imm)

2546

{

2547

EmitLoadStoreImmediate(size, 0, type, Rt, Rn, imm);

2548

}

2549

2550

// Loadstore unscaled

2551

void ARM64FloatEmitter::LDUR(u8 size, ARM64Reg Rt, ARM64Reg Rn, s32 imm)

2552

{

2553

u32 encoded_size = 0;

2554

u32 encoded_op = 0;

2555

2556

if (size == 8)

2557

{

2558

encoded_size = 0;

2559

encoded_op = 1;

2560

}

2561

else if (size == 16)

2562

{

2563

encoded_size = 1;

2564

encoded_op = 1;

2565

}

2566

else if (size == 32)

2567

{

2568

encoded_size = 2;

2569

encoded_op = 1;

2570

}

2571

else if (size == 64)

2572

{

2573

encoded_size = 3;

2574

encoded_op = 1;

2575

}

2576

else if (size == 128)

2577

{

2578

encoded_size = 0;

2579

encoded_op = 3;

2580

}

2581

2582

EmitLoadStoreUnscaled(encoded_size, encoded_op, Rt, Rn, imm);

2583

}

2584

void ARM64FloatEmitter::STUR(u8 size, ARM64Reg Rt, ARM64Reg Rn, s32 imm)

2585

{

2586

u32 encoded_size = 0;

2587

u32 encoded_op = 0;

2588

2589

if (size == 8)

2590

{

2591

encoded_size = 0;

2592

encoded_op = 0;

2593

}

2594

else if (size == 16)

2595

{

2596

encoded_size = 1;

2597

encoded_op = 0;

2598

}

2599

else if (size == 32)

2600

{

2601

encoded_size = 2;

2602

encoded_op = 0;

2603

}

2604

else if (size == 64)

2605

{

2606

encoded_size = 3;

2607

encoded_op = 0;

2608

}

2609

else if (size == 128)

2610

{

2611

encoded_size = 0;

2612

encoded_op = 2;

2613

}

2614

2615

EmitLoadStoreUnscaled(encoded_size, encoded_op, Rt, Rn, imm);

2616

2617

}

2618

2619

// Loadstore single structure

2620

void ARM64FloatEmitter::LD1(u8 size, ARM64Reg Rt, u8 index, ARM64Reg Rn)

2621

{

2622

bool S = 0;

2623

u32 opcode = 0;

2624

u32 encoded_size = 0;

2625

ARM64Reg encoded_reg = INVALID_REG;

2626

2627

if (size == 8)

2628

{

2629

S = (index & 4) != 0;

2630

opcode = 0;

2631

encoded_size = index & 3;

2632

if (index & 8)

2633

encoded_reg = EncodeRegToQuad(Rt);

2634

else

2635

encoded_reg = EncodeRegToDouble(Rt);

2636

2637

}

2638

else if (size == 16)

2639

{

2640

S = (index & 2) != 0;

2641

opcode = 2;

2642

encoded_size = (index & 1) << 1;

2643

if (index & 4)

2644

encoded_reg = EncodeRegToQuad(Rt);

2645

else

2646

encoded_reg = EncodeRegToDouble(Rt);

2647

2648

}

2649

else if (size == 32)

2650

{

2651

S = (index & 1) != 0;

2652

opcode = 4;

2653

encoded_size = 0;

2654

if (index & 2)

2655

encoded_reg = EncodeRegToQuad(Rt);

2656

else

2657

encoded_reg = EncodeRegToDouble(Rt);

2658

}

2659

else if (size == 64)

2660

{

2661

S = 0;

2662

opcode = 4;

2663

encoded_size = 1;

2664

if (index == 1)

2665

encoded_reg = EncodeRegToQuad(Rt);

2666

else

2667

encoded_reg = EncodeRegToDouble(Rt);

2668

}

2669

2670

EmitLoadStoreSingleStructure(1, 0, opcode, S, encoded_size, encoded_reg, Rn);

2671

}

2672

2673

void ARM64FloatEmitter::LD1(u8 size, ARM64Reg Rt, u8 index, ARM64Reg Rn, ARM64Reg Rm)

2674

{

2675

bool S = 0;

2676

u32 opcode = 0;

2677

u32 encoded_size = 0;

2678

ARM64Reg encoded_reg = INVALID_REG;

2679

2680

if (size == 8)

2681

{

2682

S = (index & 4) != 0;

2683

opcode = 0;

2684

encoded_size = index & 3;

2685

if (index & 8)

2686

encoded_reg = EncodeRegToQuad(Rt);

2687

else

2688

encoded_reg = EncodeRegToDouble(Rt);

2689

2690

}

2691

else if (size == 16)

2692

{

2693

S = (index & 2) != 0;

2694

opcode = 2;

2695

encoded_size = (index & 1) << 1;

2696

if (index & 4)

2697

encoded_reg = EncodeRegToQuad(Rt);

2698

else

2699

encoded_reg = EncodeRegToDouble(Rt);

2700

2701

}

2702

else if (size == 32)

2703

{

2704

S = (index & 1) != 0;

2705

opcode = 4;

2706

encoded_size = 0;

2707

if (index & 2)

2708

encoded_reg = EncodeRegToQuad(Rt);

2709

else

2710

encoded_reg = EncodeRegToDouble(Rt);

2711

}

2712

else if (size == 64)

2713

{

2714

S = 0;

2715

opcode = 4;

2716

encoded_size = 1;

2717

if (index == 1)

2718

encoded_reg = EncodeRegToQuad(Rt);

2719

else

2720

encoded_reg = EncodeRegToDouble(Rt);

2721

}

2722

2723

EmitLoadStoreSingleStructure(1, 0, opcode, S, encoded_size, encoded_reg, Rn, Rm);

2724

}

2725

2726

void ARM64FloatEmitter::LD1R(u8 size, ARM64Reg Rt, ARM64Reg Rn)

2727

{

2728

EmitLoadStoreSingleStructure(1, 0, 6, 0, size >> 4, Rt, Rn);

2729

}

2730

void ARM64FloatEmitter::LD2R(u8 size, ARM64Reg Rt, ARM64Reg Rn)

2731

{

2732

EmitLoadStoreSingleStructure(1, 1, 6, 0, size >> 4, Rt, Rn);

2733

}

2734

void ARM64FloatEmitter::LD1R(u8 size, ARM64Reg Rt, ARM64Reg Rn, ARM64Reg Rm)

2735

{

2736

EmitLoadStoreSingleStructure(1, 0, 6, 0, size >> 4, Rt, Rn, Rm);

2737

}

2738

void ARM64FloatEmitter::LD2R(u8 size, ARM64Reg Rt, ARM64Reg Rn, ARM64Reg Rm)

2739

{

2740

EmitLoadStoreSingleStructure(1, 1, 6, 0, size >> 4, Rt, Rn, Rm);

2741

}

2742

2743

void ARM64FloatEmitter::ST1(u8 size, ARM64Reg Rt, u8 index, ARM64Reg Rn)

2744

{

2745

bool S = 0;

2746

u32 opcode = 0;

2747

u32 encoded_size = 0;

2748

ARM64Reg encoded_reg = INVALID_REG;

2749

2750

if (size == 8)

2751

{

2752

S = (index & 4) != 0;

2753

opcode = 0;

2754

encoded_size = index & 3;

2755

if (index & 8)

2756

encoded_reg = EncodeRegToQuad(Rt);

2757

else

2758

encoded_reg = EncodeRegToDouble(Rt);

2759

2760

}

2761

else if (size == 16)

2762

{

2763

S = (index & 2) != 0;

2764

opcode = 2;

2765

encoded_size = (index & 1) << 1;

2766

if (index & 4)

2767

encoded_reg = EncodeRegToQuad(Rt);

2768

else

2769

encoded_reg = EncodeRegToDouble(Rt);

2770

2771

}

2772

else if (size == 32)

2773

{

2774

S = (index & 1) != 0;

2775

opcode = 4;

2776

encoded_size = 0;

2777

if (index & 2)

2778

encoded_reg = EncodeRegToQuad(Rt);

2779

else

2780

encoded_reg = EncodeRegToDouble(Rt);

2781

}

2782

else if (size == 64)

2783

{

2784

S = 0;

2785

opcode = 4;

2786

encoded_size = 1;

2787

if (index == 1)

2788

encoded_reg = EncodeRegToQuad(Rt);

2789

else

2790

encoded_reg = EncodeRegToDouble(Rt);

2791

}

2792

2793

EmitLoadStoreSingleStructure(0, 0, opcode, S, encoded_size, encoded_reg, Rn);

2794

}

2795

2796

void ARM64FloatEmitter::ST1(u8 size, ARM64Reg Rt, u8 index, ARM64Reg Rn, ARM64Reg Rm)

2797

{

2798

bool S = 0;

2799

u32 opcode = 0;

2800

u32 encoded_size = 0;

2801

ARM64Reg encoded_reg = INVALID_REG;

2802

2803

if (size == 8)

2804

{

2805

S = (index & 4) != 0;

2806

opcode = 0;

2807

encoded_size = index & 3;

2808

if (index & 8)

2809

encoded_reg = EncodeRegToQuad(Rt);

2810

else

2811

encoded_reg = EncodeRegToDouble(Rt);

2812

2813

}

2814

else if (size == 16)

2815

{

2816

S = (index & 2) != 0;

2817

opcode = 2;

2818

encoded_size = (index & 1) << 1;

2819

if (index & 4)

2820

encoded_reg = EncodeRegToQuad(Rt);

2821

else

2822

encoded_reg = EncodeRegToDouble(Rt);

2823

2824

}

2825

else if (size == 32)

2826

{

2827

S = (index & 1) != 0;

2828

opcode = 4;

2829

encoded_size = 0;

2830

if (index & 2)

2831

encoded_reg = EncodeRegToQuad(Rt);

2832

else

2833

encoded_reg = EncodeRegToDouble(Rt);

2834

}

2835

else if (size == 64)

2836

{

2837

S = 0;

2838

opcode = 4;

2839

encoded_size = 1;

2840

if (index == 1)

2841

encoded_reg = EncodeRegToQuad(Rt);

2842

else

2843

encoded_reg = EncodeRegToDouble(Rt);

2844

}

2845

2846

EmitLoadStoreSingleStructure(0, 0, opcode, S, encoded_size, encoded_reg, Rn, Rm);

2847

}

2848

2849

// Loadstore multiple structure

2850

void ARM64FloatEmitter::LD1(u8 size, u8 count, ARM64Reg Rt, ARM64Reg Rn)

2851

{

2852

_assert_msg_(DYNA_REC, !(count == 0 || count > 4), "%s must have a count of 1 to 4 registers!", __FUNCTION__);

2853

u32 opcode = 0;

2854

if (count == 1)

2855

opcode = 7;

2856

else if (count == 2)

2857

opcode = 0xA;

2858

else if (count == 3)

2859

opcode = 6;

2860

else if (count == 4)

2861

opcode = 2;

2862

EmitLoadStoreMultipleStructure(size, 1, opcode, Rt, Rn);

2863

}

2864

void ARM64FloatEmitter::LD1(u8 size, u8 count, IndexType type, ARM64Reg Rt, ARM64Reg Rn, ARM64Reg Rm)

2865

{

2866

_assert_msg_(DYNA_REC, !(count == 0 || count > 4), "%s must have a count of 1 to 4 registers!", __FUNCTION__);

2867

_assert_msg_(DYNA_REC, type == INDEX_POST, "%s only supports post indexing!", __FUNCTION__);

2868

2869

u32 opcode = 0;

2870

if (count == 1)

2871

opcode = 7;

2872

else if (count == 2)

2873

opcode = 0xA;

2874

else if (count == 3)

2875

opcode = 6;

2876

else if (count == 4)

2877

opcode = 2;

2878

EmitLoadStoreMultipleStructurePost(size, 1, opcode, Rt, Rn, Rm);

2879

}

2880

void ARM64FloatEmitter::ST1(u8 size, u8 count, ARM64Reg Rt, ARM64Reg Rn)

2881

{

2882

_assert_msg_(DYNA_REC, !(count == 0 || count > 4), "%s must have a count of 1 to 4 registers!", __FUNCTION__);

2883

u32 opcode = 0;

2884

if (count == 1)

2885

opcode = 7;

2886

else if (count == 2)

2887

opcode = 0xA;

2888

else if (count == 3)

2889

opcode = 6;

2890

else if (count == 4)

2891

opcode = 2;

2892

EmitLoadStoreMultipleStructure(size, 0, opcode, Rt, Rn);

2893

}

2894

void ARM64FloatEmitter::ST1(u8 size, u8 count, IndexType type, ARM64Reg Rt, ARM64Reg Rn, ARM64Reg Rm)

2895

{

2896

_assert_msg_(DYNA_REC, !(count == 0 || count > 4), "%s must have a count of 1 to 4 registers!", __FUNCTION__);

2897

_assert_msg_(DYNA_REC, type == INDEX_POST, "%s only supports post indexing!", __FUNCTION__);

2898

2899

u32 opcode = 0;

2900

if (count == 1)

2901

opcode = 7;

2902

else if (count == 2)

2903

opcode = 0xA;

2904

else if (count == 3)

2905

opcode = 6;

2906

else if (count == 4)

2907

opcode = 2;

2908

EmitLoadStoreMultipleStructurePost(size, 0, opcode, Rt, Rn, Rm);

2909

}

2910

2911

// Scalar - 1 Source

2912

void ARM64FloatEmitter::FMOV(ARM64Reg Rd, ARM64Reg Rn, bool top)

2913

{

2914

if (IsScalar(Rd) && IsScalar(Rn)) {

2915

EmitScalar1Source(0, 0, IsDouble(Rd), 0, Rd, Rn);

2916

} else {

2917

_assert_msg_(JIT, !IsQuad(Rd) && !IsQuad(Rn), "FMOV can't move to/from quads");

2918

int rmode = 0;

2919

int opcode = 6;

2920

int sf = 0;

2921

if (IsSingle(Rd) && !Is64Bit(Rn) && !top) {

2922

// GPR to scalar single

2923

opcode |= 1;

2924

} else if (!Is64Bit(Rd) && IsSingle(Rn) && !top) {

2925

// Scalar single to GPR - defaults are correct

2926

} else {

2927

// TODO

2928

_assert_msg_(JIT, 0, "FMOV: Unhandled case");

2929

}

2930

Rd = DecodeReg(Rd);

2931

Rn = DecodeReg(Rn);

2932

Write32((sf << 31) | (0x1e2 << 20) | (rmode << 19) | (opcode << 16) | (Rn << 5) | Rd);

2933

}

2934

}

2935

2936

// Loadstore paired

2937

void ARM64FloatEmitter::LDP(u8 size, IndexType type, ARM64Reg Rt, ARM64Reg Rt2, ARM64Reg Rn, s32 imm)

2938

{

2939

EncodeLoadStorePair(size, true, type, Rt, Rt2, Rn, imm);

2940

}

2941

void ARM64FloatEmitter::STP(u8 size, IndexType type, ARM64Reg Rt, ARM64Reg Rt2, ARM64Reg Rn, s32 imm)

2942

{

2943

EncodeLoadStorePair(size, false, type, Rt, Rt2, Rn, imm);

2944

}

2945

2946

// Loadstore register offset

2947

void ARM64FloatEmitter::STR(u8 size, ARM64Reg Rt, ARM64Reg Rn, ArithOption Rm)

2948

{

2949

EncodeLoadStoreRegisterOffset(size, false, Rt, Rn, Rm);

2950

}

2951

void ARM64FloatEmitter::LDR(u8 size, ARM64Reg Rt, ARM64Reg Rn, ArithOption Rm)

2952

{

2953

EncodeLoadStoreRegisterOffset(size, true, Rt, Rn, Rm);

2954

}

2955

2956

void ARM64FloatEmitter::FABS(ARM64Reg Rd, ARM64Reg Rn)

2957

{

2958

EmitScalar1Source(0, 0, IsDouble(Rd), 1, Rd, Rn);

2959

}

2960

void ARM64FloatEmitter::FNEG(ARM64Reg Rd, ARM64Reg Rn)

2961

{

2962

EmitScalar1Source(0, 0, IsDouble(Rd), 2, Rd, Rn);

2963

}

2964

void ARM64FloatEmitter::FSQRT(ARM64Reg Rd, ARM64Reg Rn)

2965

{

2966

EmitScalar1Source(0, 0, IsDouble(Rd), 3, Rd, Rn);

2967

}

2968

2969

2970

// Scalar - 2 Source

2971

void ARM64FloatEmitter::FADD(ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

2972

{

2973

EmitScalar2Source(0, 0, IsDouble(Rd), 2, Rd, Rn, Rm);

2974

}

2975

void ARM64FloatEmitter::FMUL(ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

2976

{

2977

EmitScalar2Source(0, 0, IsDouble(Rd), 0, Rd, Rn, Rm);

2978

}

2979

void ARM64FloatEmitter::FSUB(ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

2980

{

2981

EmitScalar2Source(0, 0, IsDouble(Rd), 3, Rd, Rn, Rm);

2982

}

2983

void ARM64FloatEmitter::FDIV(ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

2984

{

2985

EmitScalar2Source(0, 0, IsDouble(Rd), 1, Rd, Rn, Rm);

2986

}

2987

void ARM64FloatEmitter::FMAX(ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

2988

{

2989

EmitScalar2Source(0, 0, IsDouble(Rd), 4, Rd, Rn, Rm);

2990

}

2991

void ARM64FloatEmitter::FMIN(ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

2992

{

2993

EmitScalar2Source(0, 0, IsDouble(Rd), 5, Rd, Rn, Rm);

2994

}

2995

void ARM64FloatEmitter::FMAXNM(ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

2996

{

2997

EmitScalar2Source(0, 0, IsDouble(Rd), 6, Rd, Rn, Rm);

2998

}

2999

void ARM64FloatEmitter::FMINNM(ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3000

{

3001

EmitScalar2Source(0, 0, IsDouble(Rd), 7, Rd, Rn, Rm);

3002

}

3003

void ARM64FloatEmitter::FNMUL(ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3004

{

3005

EmitScalar2Source(0, 0, IsDouble(Rd), 8, Rd, Rn, Rm);

3006

}

3007

3008

void ARM64FloatEmitter::FMADD(ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm, ARM64Reg Ra) {

3009

EmitScalar3Source(IsDouble(Rd), Rd, Rn, Rm, Ra, 0);

3010

}

3011

void ARM64FloatEmitter::FMSUB(ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm, ARM64Reg Ra) {

3012

EmitScalar3Source(IsDouble(Rd), Rd, Rn, Rm, Ra, 1);

3013

}

3014

void ARM64FloatEmitter::FNMADD(ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm, ARM64Reg Ra) {

3015

EmitScalar3Source(IsDouble(Rd), Rd, Rn, Rm, Ra, 2);

3016

}

3017

void ARM64FloatEmitter::FNMSUB(ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm, ARM64Reg Ra) {

3018

EmitScalar3Source(IsDouble(Rd), Rd, Rn, Rm, Ra, 3);

3019

}

3020

3021

void ARM64FloatEmitter::EmitScalar3Source(bool isDouble, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm, ARM64Reg Ra, int opcode) {

3022

int type = isDouble ? 1 : 0;

3023

Rd = DecodeReg(Rd);

3024

Rn = DecodeReg(Rn);

3025

Rm = DecodeReg(Rm);

3026

Ra = DecodeReg(Ra);

3027

int o1 = opcode >> 1;

3028

int o0 = opcode & 1;

3029

m_emit->Write32((0x1F << 24) | (type << 22) | (o1 << 21) | (Rm << 16) | (o0 << 15) | (Ra << 10) | (Rn << 5) | Rd);

3030

}

3031

3032

// Scalar floating point immediate

3033

void ARM64FloatEmitter::FMOV(ARM64Reg Rd, uint8_t imm8)

3034

{

3035

EmitScalarImm(0, 0, 0, 0, Rd, imm8);

3036

}

3037

3038

// Vector

3039

void ARM64FloatEmitter::AND(ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3040

{

3041

EmitThreeSame(0, 0, 3, Rd, Rn, Rm);

3042

}

3043

void ARM64FloatEmitter::EOR(ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3044

{

3045

EmitThreeSame(1, 0, 3, Rd, Rn, Rm);

3046

}

3047

void ARM64FloatEmitter::BSL(ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3048

{

3049

EmitThreeSame(1, 1, 3, Rd, Rn, Rm);

3050

}

3051

void ARM64FloatEmitter::DUP(u8 size, ARM64Reg Rd, ARM64Reg Rn, u8 index)

3052

{

3053

u32 imm5 = 0;

3054

3055

if (size == 8)

3056

{

3057

imm5 = 1;

3058

imm5 |= index << 1;

3059

}

3060

else if (size == 16)

3061

{

3062

imm5 = 2;

3063

imm5 |= index << 2;

3064

}

3065

else if (size == 32)

3066

{

3067

imm5 = 4;

3068

imm5 |= index << 3;

3069

}

3070

else if (size == 64)

3071

{

3072

imm5 = 8;

3073

imm5 |= index << 4;

3074

}

3075

3076

EmitCopy(IsQuad(Rd), 0, imm5, 0, Rd, Rn);

3077

}

3078

void ARM64FloatEmitter::FABS(u8 size, ARM64Reg Rd, ARM64Reg Rn)

3079

{

3080

Emit2RegMisc(IsQuad(Rd), 0, 2 | (size >> 6), 0xF, Rd, Rn);

3081

}

3082

void ARM64FloatEmitter::FADD(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3083

{

3084

EmitThreeSame(0, size >> 6, 0x1A, Rd, Rn, Rm);

3085

}

3086

void ARM64FloatEmitter::FMAX(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3087

{

3088

EmitThreeSame(0, size >> 6, 0x1E, Rd, Rn, Rm);

3089

}

3090

void ARM64FloatEmitter::FMLA(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3091

{

3092

EmitThreeSame(0, size >> 6, 0x19, Rd, Rn, Rm);

3093

}

3094

void ARM64FloatEmitter::FMIN(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3095

{

3096

EmitThreeSame(0, 2 | size >> 6, 0x1E, Rd, Rn, Rm);

3097

}

3098

void ARM64FloatEmitter::FCVTL(u8 size, ARM64Reg Rd, ARM64Reg Rn)

3099

{

3100

Emit2RegMisc(false, 0, size >> 6, 0x17, Rd, Rn);

3101

}

3102

void ARM64FloatEmitter::FCVTL2(u8 size, ARM64Reg Rd, ARM64Reg Rn)

3103

{

3104

Emit2RegMisc(true, 0, size >> 6, 0x17, Rd, Rn);

3105

}

3106

void ARM64FloatEmitter::FCVTN(u8 dest_size, ARM64Reg Rd, ARM64Reg Rn)

3107

{

3108

Emit2RegMisc(IsQuad(Rd), 0, dest_size >> 5, 0x16, Rd, Rn);

3109

}

3110

void ARM64FloatEmitter::FCVTZS(u8 size, ARM64Reg Rd, ARM64Reg Rn)

3111

{

3112

Emit2RegMisc(IsQuad(Rd), 0, 2 | (size >> 6), 0x1B, Rd, Rn);

3113

}

3114

void ARM64FloatEmitter::FCVTZU(u8 size, ARM64Reg Rd, ARM64Reg Rn)

3115

{

3116

Emit2RegMisc(IsQuad(Rd), 1, 2 | (size >> 6), 0x1B, Rd, Rn);

3117

}

3118

void ARM64FloatEmitter::FDIV(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3119

{

3120

EmitThreeSame(1, size >> 6, 0x1F, Rd, Rn, Rm);

3121

}

3122

void ARM64FloatEmitter::FMUL(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3123

{

3124

EmitThreeSame(1, size >> 6, 0x1B, Rd, Rn, Rm);

3125

}

3126

void ARM64FloatEmitter::UMIN(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3127

{

3128

EmitThreeSame(1, EncodeSize(size), 0xD, Rd, Rn, Rm);

3129

}

3130

void ARM64FloatEmitter::UMAX(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3131

{

3132

EmitThreeSame(1, EncodeSize(size), 0xC, Rd, Rn, Rm);

3133

}

3134

void ARM64FloatEmitter::SMIN(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3135

{

3136

EmitThreeSame(0, EncodeSize(size), 0xD, Rd, Rn, Rm);

3137

}

3138

void ARM64FloatEmitter::SMAX(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3139

{

3140

EmitThreeSame(0, EncodeSize(size), 0xC, Rd, Rn, Rm);

3141

}

3142

void ARM64FloatEmitter::FNEG(u8 size, ARM64Reg Rd, ARM64Reg Rn)

3143

{

3144

Emit2RegMisc(IsQuad(Rd), 1, 2 | (size >> 6), 0xF, Rd, Rn);

3145

}

3146

void ARM64FloatEmitter::FRSQRTE(u8 size, ARM64Reg Rd, ARM64Reg Rn)

3147

{

3148

Emit2RegMisc(IsQuad(Rd), 1, 2 | (size >> 6), 0x1D, Rd, Rn);

3149

}

3150

void ARM64FloatEmitter::FSUB(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3151

{

3152

EmitThreeSame(0, 2 | (size >> 6), 0x1A, Rd, Rn, Rm);

3153

}

3154

void ARM64FloatEmitter::FMLS(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3155

{

3156

EmitThreeSame(0, 2 | (size >> 6), 0x19, Rd, Rn, Rm);

3157

}

3158

void ARM64FloatEmitter::NOT(ARM64Reg Rd, ARM64Reg Rn)

3159

{

3160

Emit2RegMisc(IsQuad(Rd), 1, 0, 5, Rd, Rn);

3161

}

3162

void ARM64FloatEmitter::ORR(ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3163

{

3164

EmitThreeSame(0, 2, 3, Rd, Rn, Rm);

3165

}

3166

void ARM64FloatEmitter::REV16(u8 size, ARM64Reg Rd, ARM64Reg Rn)

3167

{

3168

Emit2RegMisc(IsQuad(Rd), 0, size >> 4, 1, Rd, Rn);

3169

}

3170

void ARM64FloatEmitter::REV32(u8 size, ARM64Reg Rd, ARM64Reg Rn)

3171

{

3172

Emit2RegMisc(IsQuad(Rd), 1, size >> 4, 0, Rd, Rn);

3173

}

3174

void ARM64FloatEmitter::REV64(u8 size, ARM64Reg Rd, ARM64Reg Rn)

3175

{

3176

Emit2RegMisc(IsQuad(Rd), 0, size >> 4, 0, Rd, Rn);

3177

}

3178

void ARM64FloatEmitter::SCVTF(u8 size, ARM64Reg Rd, ARM64Reg Rn)

3179

{

3180

Emit2RegMisc(IsQuad(Rd), 0, size >> 6, 0x1D, Rd, Rn);

3181

}

3182

void ARM64FloatEmitter::UCVTF(u8 size, ARM64Reg Rd, ARM64Reg Rn)

3183

{

3184

Emit2RegMisc(IsQuad(Rd), 1, size >> 6, 0x1D, Rd, Rn);

3185

}

3186

void ARM64FloatEmitter::SCVTF(u8 size, ARM64Reg Rd, ARM64Reg Rn, int scale)

3187

{

3188

int imm = size * 2 - scale;

3189

EmitShiftImm(IsQuad(Rd), 0, imm >> 3, imm & 7, 0x1C, Rd, Rn);

3190

}

3191

void ARM64FloatEmitter::UCVTF(u8 size, ARM64Reg Rd, ARM64Reg Rn, int scale)

3192

{

3193

int imm = size * 2 - scale;

3194

EmitShiftImm(IsQuad(Rd), 1, imm >> 3, imm & 7, 0x1C, Rd, Rn);

3195

}

3196

void ARM64FloatEmitter::SQXTN(u8 dest_size, ARM64Reg Rd, ARM64Reg Rn)

3197

{

3198

Emit2RegMisc(false, 0, dest_size >> 4, 0x14, Rd, Rn);

3199

}

3200

void ARM64FloatEmitter::SQXTN2(u8 dest_size, ARM64Reg Rd, ARM64Reg Rn)

3201

{

3202

Emit2RegMisc(true, 0, dest_size >> 4, 0x14, Rd, Rn);

3203

}

3204

void ARM64FloatEmitter::UQXTN(u8 dest_size, ARM64Reg Rd, ARM64Reg Rn)

3205

{

3206

Emit2RegMisc(false, 1, dest_size >> 4, 0x14, Rd, Rn);

3207

}

3208

void ARM64FloatEmitter::UQXTN2(u8 dest_size, ARM64Reg Rd, ARM64Reg Rn)

3209

{

3210

Emit2RegMisc(true, 1, dest_size >> 4, 0x14, Rd, Rn);

3211

}

3212

void ARM64FloatEmitter::XTN(u8 dest_size, ARM64Reg Rd, ARM64Reg Rn)

3213

{

3214

Emit2RegMisc(false, 0, dest_size >> 4, 0x12, Rd, Rn);

3215

}

3216

void ARM64FloatEmitter::XTN2(u8 dest_size, ARM64Reg Rd, ARM64Reg Rn)

3217

{

3218

Emit2RegMisc(true, 0, dest_size >> 4, 0x12, Rd, Rn);

3219

}

3220

3221

// Move

3222

void ARM64FloatEmitter::DUP(u8 size, ARM64Reg Rd, ARM64Reg Rn)

3223

{

3224

u32 imm5 = 0;

3225

3226

if (size == 8)

3227

imm5 = 1;

3228

else if (size == 16)

3229

imm5 = 2;

3230

else if (size == 32)

3231

imm5 = 4;

3232

else if (size == 64)

3233

imm5 = 8;

3234

3235

EmitCopy(IsQuad(Rd), 0, imm5, 1, Rd, Rn);

3236

3237

}

3238

void ARM64FloatEmitter::INS(u8 size, ARM64Reg Rd, u8 index, ARM64Reg Rn)

3239

{

3240

u32 imm5 = 0;

3241

3242

if (size == 8)

3243

{

3244

imm5 = 1;

3245

imm5 |= index << 1;

3246

}

3247

else if (size == 16)

3248

{

3249

imm5 = 2;

3250

imm5 |= index << 2;

3251

}

3252

else if (size == 32)

3253

{

3254

imm5 = 4;

3255

imm5 |= index << 3;

3256

}

3257

else if (size == 64)

3258

{

3259

imm5 = 8;

3260

imm5 |= index << 4;

3261

}

3262

3263

EmitCopy(1, 0, imm5, 3, Rd, Rn);

3264

}

3265

void ARM64FloatEmitter::INS(u8 size, ARM64Reg Rd, u8 index1, ARM64Reg Rn, u8 index2)

3266

{

3267

u32 imm5 = 0, imm4 = 0;

3268

3269

if (size == 8)

3270

{

3271

imm5 = 1;

3272

imm5 |= index1 << 1;

3273

imm4 = index2;

3274

}

3275

else if (size == 16)

3276

{

3277

imm5 = 2;

3278

imm5 |= index1 << 2;

3279

imm4 = index2 << 1;

3280

}

3281

else if (size == 32)

3282

{

3283

imm5 = 4;

3284

imm5 |= index1 << 3;

3285

imm4 = index2 << 2;

3286

}

3287

else if (size == 64)

3288

{

3289

imm5 = 8;

3290

imm5 |= index1 << 4;

3291

imm4 = index2 << 3;

3292

}

3293

3294

EmitCopy(1, 1, imm5, imm4, Rd, Rn);

3295

}

3296

3297

void ARM64FloatEmitter::UMOV(u8 size, ARM64Reg Rd, ARM64Reg Rn, u8 index)

3298

{

3299

bool b64Bit = Is64Bit(Rd);

3300

_assert_msg_(DYNA_REC, Rd < SP, "%s destination must be a GPR!", __FUNCTION__);

3301

_assert_msg_(DYNA_REC, !(b64Bit && size != 64), "%s must have a size of 64 when destination is 64bit!", __FUNCTION__);

3302

u32 imm5 = 0;

3303

3304

if (size == 8)

3305

{

3306

imm5 = 1;

3307

imm5 |= index << 1;

3308

}

3309

else if (size == 16)

3310

{

3311

imm5 = 2;

3312

imm5 |= index << 2;

3313

}

3314

else if (size == 32)

3315

{

3316

imm5 = 4;

3317

imm5 |= index << 3;

3318

}

3319

else if (size == 64)

3320

{

3321

imm5 = 8;

3322

imm5 |= index << 4;

3323

}

3324

3325

EmitCopy(b64Bit, 0, imm5, 7, Rd, Rn);

3326

}

3327

void ARM64FloatEmitter::SMOV(u8 size, ARM64Reg Rd, ARM64Reg Rn, u8 index)

3328

{

3329

bool b64Bit = Is64Bit(Rd);

3330

_assert_msg_(DYNA_REC, Rd < SP, "%s destination must be a GPR!", __FUNCTION__);

3331

_assert_msg_(DYNA_REC, size != 64, "%s doesn't support 64bit destination. Use UMOV!", __FUNCTION__);

3332

u32 imm5 = 0;

3333

3334

if (size == 8)

3335

{

3336

imm5 = 1;

3337

imm5 |= index << 1;

3338

}

3339

else if (size == 16)

3340

{

3341

imm5 = 2;

3342

imm5 |= index << 2;

3343

}

3344

else if (size == 32)

3345

{

3346

imm5 = 4;

3347

imm5 |= index << 3;

3348

}

3349

3350

EmitCopy(b64Bit, 0, imm5, 5, Rd, Rn);

3351

}

3352

3353

// One source

3354

void ARM64FloatEmitter::FCVT(u8 size_to, u8 size_from, ARM64Reg Rd, ARM64Reg Rn)

3355

{

3356

u32 dst_encoding = 0;

3357

u32 src_encoding = 0;

3358

3359

if (size_to == 16)

3360

dst_encoding = 3;

3361

else if (size_to == 32)

3362

dst_encoding = 0;

3363

else if (size_to == 64)

3364

dst_encoding = 1;

3365

3366

if (size_from == 16)

3367

src_encoding = 3;

3368

else if (size_from == 32)

3369

src_encoding = 0;

3370

else if (size_from == 64)

3371

src_encoding = 1;

3372

3373

Emit1Source(0, 0, src_encoding, 4 | dst_encoding, Rd, Rn);

3374

}

3375

3376

void ARM64FloatEmitter::SCVTF(ARM64Reg Rd, ARM64Reg Rn)

3377

{

3378

if (IsScalar(Rn)) {

3379

// Source is in FP register (like destination!). We must use a vector encoding.

3380

bool sign = false;

3381

Rd = DecodeReg(Rd);

3382

Rn = DecodeReg(Rn);

3383

int sz = IsDouble(Rn);

3384

Write32((0x5e << 24) | (sign << 29) | (sz << 22) | (0x876 << 10) | (Rn << 5) | Rd);

3385

} else {

3386

bool sf = Is64Bit(Rn);

3387

u32 type = 0;

3388

if (IsDouble(Rd))

3389

type = 1;

3390

EmitConversion(sf, 0, type, 0, 2, Rd, Rn);

3391

}

3392

}

3393

3394

void ARM64FloatEmitter::UCVTF(ARM64Reg Rd, ARM64Reg Rn)

3395

{

3396

if (IsScalar(Rn)) {

3397

// Source is in FP register (like destination!). We must use a vector encoding.

3398

bool sign = true;

3399

Rd = DecodeReg(Rd);

3400

Rn = DecodeReg(Rn);

3401

int sz = IsDouble(Rn);

3402

Write32((0x5e << 24) | (sign << 29) | (sz << 22) | (0x876 << 10) | (Rn << 5) | Rd);

3403

} else {

3404

bool sf = Is64Bit(Rn);

3405

u32 type = 0;

3406

if (IsDouble(Rd))

3407

type = 1;

3408

3409

EmitConversion(sf, 0, type, 0, 3, Rd, Rn);

3410

}

3411

}

3412

3413

void ARM64FloatEmitter::SCVTF(ARM64Reg Rd, ARM64Reg Rn, int scale)

3414

{

3415

bool sf = Is64Bit(Rn);

3416

u32 type = 0;

3417

if (IsDouble(Rd))

3418

type = 1;

3419

3420

EmitConversion2(sf, 0, false, type, 0, 2, 64 - scale, Rd, Rn);

3421

}

3422

3423

void ARM64FloatEmitter::UCVTF(ARM64Reg Rd, ARM64Reg Rn, int scale)

3424

{

3425

bool sf = Is64Bit(Rn);

3426

u32 type = 0;

3427

if (IsDouble(Rd))

3428

type = 1;

3429

3430

EmitConversion2(sf, 0, false, type, 0, 3, 64 - scale, Rd, Rn);

3431

}

3432

3433

void ARM64FloatEmitter::FCMP(ARM64Reg Rn, ARM64Reg Rm)

3434

{

3435

EmitCompare(0, 0, 0, 0, Rn, Rm);

3436

}

3437

void ARM64FloatEmitter::FCMP(ARM64Reg Rn)

3438

{

3439

EmitCompare(0, 0, 0, 8, Rn, (ARM64Reg)0);

3440

}

3441

void ARM64FloatEmitter::FCMPE(ARM64Reg Rn, ARM64Reg Rm)

3442

{

3443

EmitCompare(0, 0, 0, 0x10, Rn, Rm);

3444

}

3445

void ARM64FloatEmitter::FCMPE(ARM64Reg Rn)

3446

{

3447

EmitCompare(0, 0, 0, 0x18, Rn, (ARM64Reg)0);

3448

}

3449

void ARM64FloatEmitter::FCMEQ(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3450

{

3451

EmitThreeSame(0, size >> 6, 0x1C, Rd, Rn, Rm);

3452

}

3453

void ARM64FloatEmitter::FCMEQ(u8 size, ARM64Reg Rd, ARM64Reg Rn)

3454

{

3455

Emit2RegMisc(IsQuad(Rd), 0, 2 | (size >> 6), 0xD, Rd, Rn);

3456

}

3457

void ARM64FloatEmitter::FCMGE(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3458

{

3459

EmitThreeSame(1, size >> 6, 0x1C, Rd, Rn, Rm);

3460

}

3461

void ARM64FloatEmitter::FCMGE(u8 size, ARM64Reg Rd, ARM64Reg Rn)

3462

{

3463

Emit2RegMisc(IsQuad(Rd), 1, 2 | (size >> 6), 0xC, Rd, Rn);

3464

}

3465

void ARM64FloatEmitter::FCMGT(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3466

{

3467

EmitThreeSame(1, 2 | (size >> 6), 0x1C, Rd, Rn, Rm);

3468

}

3469

void ARM64FloatEmitter::FCMGT(u8 size, ARM64Reg Rd, ARM64Reg Rn)

3470

{

3471

Emit2RegMisc(IsQuad(Rd), 0, 2 | (size >> 6), 0x0C, Rd, Rn);

3472

}

3473

void ARM64FloatEmitter::FCMLE(u8 size, ARM64Reg Rd, ARM64Reg Rn)

3474

{

3475

Emit2RegMisc(IsQuad(Rd), 1, 2 | (size >> 6), 0xD, Rd, Rn);

3476

}

3477

void ARM64FloatEmitter::FCMLT(u8 size, ARM64Reg Rd, ARM64Reg Rn)

3478

{

3479

Emit2RegMisc(IsQuad(Rd), 0, 2 | (size >> 6), 0xE, Rd, Rn);

3480

}

3481

3482

void ARM64FloatEmitter::FCSEL(ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm, CCFlags cond)

3483

{

3484

EmitCondSelect(0, 0, cond, Rd, Rn, Rm);

3485

}

3486

3487

// Permute

3488

void ARM64FloatEmitter::UZP1(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3489

{

3490

EmitPermute(size, 1, Rd, Rn, Rm);

3491

}

3492

void ARM64FloatEmitter::TRN1(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3493

{

3494

EmitPermute(size, 2, Rd, Rn, Rm);

3495

}

3496

void ARM64FloatEmitter::ZIP1(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3497

{

3498

EmitPermute(size, 3, Rd, Rn, Rm);

3499

}

3500

void ARM64FloatEmitter::UZP2(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3501

{

3502

EmitPermute(size, 5, Rd, Rn, Rm);

3503

}

3504

void ARM64FloatEmitter::TRN2(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3505

{

3506

EmitPermute(size, 6, Rd, Rn, Rm);

3507

}

3508

void ARM64FloatEmitter::ZIP2(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm)

3509

{

3510

EmitPermute(size, 7, Rd, Rn, Rm);

3511

}

3512

3513

// Shift by immediate

3514

void ARM64FloatEmitter::SSHLL(u8 src_size, ARM64Reg Rd, ARM64Reg Rn, u32 shift)

3515

{

3516

SSHLL(src_size, Rd, Rn, shift, false);

3517

}

3518

void ARM64FloatEmitter::SSHLL2(u8 src_size, ARM64Reg Rd, ARM64Reg Rn, u32 shift)

3519

{

3520

SSHLL(src_size, Rd, Rn, shift, true);

3521

}

3522

void ARM64FloatEmitter::SHRN(u8 dest_size, ARM64Reg Rd, ARM64Reg Rn, u32 shift)

3523

{

3524

SHRN(dest_size, Rd, Rn, shift, false);

3525

}

3526

void ARM64FloatEmitter::SHRN2(u8 dest_size, ARM64Reg Rd, ARM64Reg Rn, u32 shift)

3527

{

3528

SHRN(dest_size, Rd, Rn, shift, true);

3529

}

3530

void ARM64FloatEmitter::USHLL(u8 src_size, ARM64Reg Rd, ARM64Reg Rn, u32 shift)

3531

{

3532

USHLL(src_size, Rd, Rn, shift, false);

3533

}

3534

void ARM64FloatEmitter::USHLL2(u8 src_size, ARM64Reg Rd, ARM64Reg Rn, u32 shift)

3535

{

3536

USHLL(src_size, Rd, Rn, shift, true);

3537

}

3538

void ARM64FloatEmitter::SXTL(u8 src_size, ARM64Reg Rd, ARM64Reg Rn)

3539

{

3540

SXTL(src_size, Rd, Rn, false);

3541

}

3542

void ARM64FloatEmitter::SXTL2(u8 src_size, ARM64Reg Rd, ARM64Reg Rn)

3543

{

3544

SXTL(src_size, Rd, Rn, true);

3545

}

3546

void ARM64FloatEmitter::UXTL(u8 src_size, ARM64Reg Rd, ARM64Reg Rn)

3547

{

3548

UXTL(src_size, Rd, Rn, false);

3549

}

3550

void ARM64FloatEmitter::UXTL2(u8 src_size, ARM64Reg Rd, ARM64Reg Rn)

3551

{

3552

UXTL(src_size, Rd, Rn, true);

3553

}

3554

3555

static u32 EncodeImmShiftLeft(u8 src_size, u32 shift) {

3556

return src_size + shift;

3557

}

3558

3559

static u32 EncodeImmShiftRight(u8 src_size, u32 shift) {

3560

return src_size * 2 - shift;

3561

}

3562

3563

void ARM64FloatEmitter::SSHLL(u8 src_size, ARM64Reg Rd, ARM64Reg Rn, u32 shift, bool upper)

3564

{

3565

_assert_msg_(DYNA_REC, shift < src_size, "%s shift amount must less than the element size!", __FUNCTION__);

3566

u32 imm = EncodeImmShiftLeft(src_size, shift);

3567

EmitShiftImm(upper, 0, imm >> 3, imm & 7, 0x14, Rd, Rn);

3568

}

3569

3570

void ARM64FloatEmitter::USHLL(u8 src_size, ARM64Reg Rd, ARM64Reg Rn, u32 shift, bool upper)

3571

{

3572

_assert_msg_(DYNA_REC, shift < src_size, "%s shift amount must less than the element size!", __FUNCTION__);

3573

u32 imm = EncodeImmShiftLeft(src_size, shift);

3574

EmitShiftImm(upper, 1, imm >> 3, imm & 7, 0x14, Rd, Rn);

3575

}

3576

3577

void ARM64FloatEmitter::SHRN(u8 dest_size, ARM64Reg Rd, ARM64Reg Rn, u32 shift, bool upper)

3578

{

3579

_assert_msg_(DYNA_REC, shift > 0, "%s shift amount must be greater than zero!", __FUNCTION__);

3580

_assert_msg_(DYNA_REC, shift <= dest_size, "%s shift amount must less than or equal to the element size!", __FUNCTION__);

3581

u32 imm = EncodeImmShiftRight(dest_size, shift);

3582

EmitShiftImm(upper, 0, imm >> 3, imm & 7, 0x10, Rd, Rn);

3583

}

3584

3585

void ARM64FloatEmitter::SHL(u8 dest_size, ARM64Reg Rd, ARM64Reg Rn, u32 shift) {

3586

_assert_msg_(DYNA_REC, shift < dest_size, "%s shift amount must less than the element size!", __FUNCTION__);

3587

u32 imm = EncodeImmShiftLeft(dest_size, shift);

3588

EmitShiftImm(IsQuad(Rd), false, imm >> 3, imm & 7, 0xA, Rd, Rn);

3589

}

3590

3591

void ARM64FloatEmitter::USHR(u8 dest_size, ARM64Reg Rd, ARM64Reg Rn, u32 shift) {

3592

_assert_msg_(DYNA_REC, shift < dest_size, "%s shift amount must less than the element size!", __FUNCTION__);

3593

u32 imm = EncodeImmShiftRight(dest_size, shift);

3594

EmitShiftImm(IsQuad(Rd), true, imm >> 3, imm & 7, 0x0, Rd, Rn);

3595

}

3596

3597

void ARM64FloatEmitter::SSHR(u8 dest_size, ARM64Reg Rd, ARM64Reg Rn, u32 shift) {

3598

_assert_msg_(DYNA_REC, shift < dest_size, "%s shift amount must less than the element size!", __FUNCTION__);

3599

u32 imm = EncodeImmShiftRight(dest_size, shift);

3600

EmitShiftImm(IsQuad(Rd), false, imm >> 3, imm & 7, 0x0, Rd, Rn);

3601

}

3602

3603

void ARM64FloatEmitter::SXTL(u8 src_size, ARM64Reg Rd, ARM64Reg Rn, bool upper)

3604

{

3605

SSHLL(src_size, Rd, Rn, 0, upper);

3606

}

3607

3608

void ARM64FloatEmitter::UXTL(u8 src_size, ARM64Reg Rd, ARM64Reg Rn, bool upper)

3609

{

3610

USHLL(src_size, Rd, Rn, 0, upper);

3611

}

3612

3613

// vector x indexed element

3614

void ARM64FloatEmitter::FMUL(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm, u8 index)

3615

{

3616

_assert_msg_(DYNA_REC, size == 32 || size == 64, "%s only supports 32bit or 64bit size!", __FUNCTION__);

3617

3618

bool L = false;

3619

bool H = false;

3620

if (size == 32) {

3621

L = index & 1;

3622

H = (index >> 1) & 1;

3623

} else if (size == 64) {

3624

H = index == 1;

3625

}

3626

3627

EmitVectorxElement(0, 2 | (size >> 6), L, 0x9, H, Rd, Rn, Rm);

3628

}

3629

3630

void ARM64FloatEmitter::FMLA(u8 size, ARM64Reg Rd, ARM64Reg Rn, ARM64Reg Rm, u8 index)

3631

{

3632

_assert_msg_(DYNA_REC, size == 32 || size == 64, "%s only supports 32bit or 64bit size!", __FUNCTION__);

3633

3634

bool L = false;

3635

bool H = false;

3636

if (size == 32) {

3637

L = index & 1;

3638

H = (index >> 1) & 1;

3639

} else if (size == 64) {

3640

H = index == 1;

3641

}

3642

3643

EmitVectorxElement(0, 2 | (size >> 6), L, 1, H, Rd, Rn, Rm);

3644

}

3645

3646

void ARM64FloatEmitter::ABI_PushRegisters(BitSet32 registers, ARM64Reg tmp)

3647

{

3648

bool bundled_loadstore = false;

3649

3650

for (int i = 0; i < 32; ++i)

3651

{

3652

if (!registers[i])

3653

continue;

3654

3655

int count = 0;

3656

while (++count < 4 && (i + count) < 32 && registers[i + count]) {}

3657

if (count > 1)

3658

{

3659

bundled_loadstore = true;

3660

break;

3661

}

3662

}

3663

3664

if (bundled_loadstore && tmp != INVALID_REG)

3665

{

3666

int num_regs = registers.Count();

3667

m_emit->SUB(SP, SP, num_regs * 16);

3668

m_emit->ADD(tmp, SP, 0);

3669

std::vector<ARM64Reg> island_regs;

3670

for (int i = 0; i < 32; ++i)

3671

{

3672

if (!registers[i])

3673

continue;

3674

3675

int count = 0;

3676

3677

// 0 = true

3678

// 1 < 4 && registers[i + 1] true!

3679

// 2 < 4 && registers[i + 2] true!

3680

// 3 < 4 && registers[i + 3] true!

3681

// 4 < 4 && registers[i + 4] false!

3682

while (++count < 4 && (i + count) < 32 && registers[i + count]) {}

3683

3684

if (count == 1)

3685

island_regs.push_back((ARM64Reg)(Q0 + i));

3686

else

3687

ST1(64, count, INDEX_POST, (ARM64Reg)(Q0 + i), tmp);

3688

3689

i += count - 1;

3690

}

3691

3692

// Handle island registers

3693

std::vector<ARM64Reg> pair_regs;

3694

for (auto& it : island_regs)

3695

{

3696

pair_regs.push_back(it);

3697

if (pair_regs.size() == 2)

3698

{

3699

STP(128, INDEX_POST, pair_regs[0], pair_regs[1], tmp, 32);

3700

pair_regs.clear();

3701

}

3702

}

3703

if (pair_regs.size())

3704

STR(128, INDEX_POST, pair_regs[0], tmp, 16);

3705

}

3706

else

3707

{

3708

std::vector<ARM64Reg> pair_regs;

3709

for (auto it : registers)

3710

{

3711

pair_regs.push_back((ARM64Reg)(Q0 + it));

3712

if (pair_regs.size() == 2)

3713

{

3714

STP(128, INDEX_PRE, pair_regs[0], pair_regs[1], SP, -32);

3715

pair_regs.clear();

3716

}

3717

}

3718

if (pair_regs.size())

3719

STR(128, INDEX_PRE, pair_regs[0], SP, -16);

3720

}

3721

}

3722

void ARM64FloatEmitter::ABI_PopRegisters(BitSet32 registers, ARM64Reg tmp)

3723

{

3724

bool bundled_loadstore = false;

3725

int num_regs = registers.Count();

3726

3727

for (int i = 0; i < 32; ++i)

3728

{

3729

if (!registers[i])

3730

continue;

3731

3732

int count = 0;

3733

while (++count < 4 && (i + count) < 32 && registers[i + count]) {}

3734

if (count > 1)

3735

{

3736

bundled_loadstore = true;

3737

break;

3738

}

3739

}

3740

3741

if (bundled_loadstore && tmp != INVALID_REG)

3742

{

3743

// The temporary register is only used to indicate that we can use this code path

3744

std::vector<ARM64Reg> island_regs;

3745

for (int i = 0; i < 32; ++i)

3746

{

3747

if (!registers[i])

3748

continue;

3749

3750

int count = 0;

3751

while (++count < 4 && (i + count) < 32 && registers[i + count]) {}

3752

3753

if (count == 1)

3754

island_regs.push_back((ARM64Reg)(Q0 + i));

3755

else

3756

LD1(64, count, INDEX_POST, (ARM64Reg)(Q0 + i), SP);

3757

3758

i += count - 1;

3759

}

3760

3761

// Handle island registers

3762

std::vector<ARM64Reg> pair_regs;

3763

for (auto& it : island_regs)

3764

{

3765

pair_regs.push_back(it);

3766

if (pair_regs.size() == 2)

3767

{

3768

LDP(128, INDEX_POST, pair_regs[0], pair_regs[1], SP, 32);

3769

pair_regs.clear();

3770

}

3771

}

3772

if (pair_regs.size())

3773

LDR(128, INDEX_POST, pair_regs[0], SP, 16);

3774

}

3775

else

3776

{

3777

bool odd = (num_regs % 2) != 0;

3778

std::vector<ARM64Reg> pair_regs;

3779

for (int i = 31; i >= 0; --i)

3780

{

3781

if (!registers[i])

3782

continue;

3783

3784

if (odd)

3785

{

3786

// First load must be a regular LDR if odd

3787

odd = false;

3788

LDR(128, INDEX_POST, (ARM64Reg)(Q0 + i), SP, 16);

3789

}

3790

else

3791

{

3792

pair_regs.push_back((ARM64Reg)(Q0 + i));

3793

if (pair_regs.size() == 2)

3794

{

3795

LDP(128, INDEX_POST, pair_regs[1], pair_regs[0], SP, 32);

3796

pair_regs.clear();

3797

}

3798

}

3799

}

3800

}

3801

}

3802

3803

void ARM64XEmitter::ANDI2R(ARM64Reg Rd, ARM64Reg Rn, u64 imm, ARM64Reg scratch) {

3804

unsigned int n, imm_s, imm_r;

3805

if (!Is64Bit(Rn))

3806

imm &= 0xFFFFFFFF;

3807

if (IsImmLogical(imm, Is64Bit(Rn) ? 64 : 32, &n, &imm_s, &imm_r)) {

3808

AND(Rd, Rn, imm_r, imm_s, n != 0);

3809

} else {

3810

_assert_msg_(JIT, scratch != INVALID_REG, "ANDSI2R - failed to construct logical immediate value from %08x, need scratch", (u32)imm);

3811

MOVI2R(scratch, imm);

3812

AND(Rd, Rn, scratch);

3813

}

3814

}

3815

3816

void ARM64XEmitter::ORRI2R(ARM64Reg Rd, ARM64Reg Rn, u64 imm, ARM64Reg scratch) {

3817

unsigned int n, imm_s, imm_r;

3818

if (IsImmLogical(imm, Is64Bit(Rn) ? 64 : 32, &n, &imm_s, &imm_r)) {

3819

ORR(Rd, Rn, imm_r, imm_s, n != 0);

3820

} else {

3821

_assert_msg_(JIT, scratch != INVALID_REG, "ORRI2R - failed to construct logical immediate value from %08x, need scratch", (u32)imm);

3822

MOVI2R(scratch, imm);

3823

ORR(Rd, Rn, scratch);

3824

}

3825

}

3826

3827

void ARM64XEmitter::EORI2R(ARM64Reg Rd, ARM64Reg Rn, u64 imm, ARM64Reg scratch) {

3828

unsigned int n, imm_s, imm_r;

3829

if (IsImmLogical(imm, Is64Bit(Rn) ? 64 : 32, &n, &imm_s, &imm_r)) {

3830

EOR(Rd, Rn, imm_r, imm_s, n != 0);

3831

} else {

3832

_assert_msg_(JIT, scratch != INVALID_REG, "EORI2R - failed to construct logical immediate value from %08x, need scratch", (u32)imm);

3833

MOVI2R(scratch, imm);

3834

EOR(Rd, Rn, scratch);

3835

}

3836

}

3837

3838

void ARM64XEmitter::ANDSI2R(ARM64Reg Rd, ARM64Reg Rn, u64 imm, ARM64Reg scratch) {

3839

unsigned int n, imm_s, imm_r;

3840

if (IsImmLogical(imm, Is64Bit(Rn) ? 64 : 32, &n, &imm_s, &imm_r)) {

3841

ANDS(Rd, Rn, imm_r, imm_s, n != 0);

3842

} else {

3843

_assert_msg_(JIT, scratch != INVALID_REG, "ANDSI2R - failed to construct logical immediate value from %08x, need scratch", (u32)imm);

3844

MOVI2R(scratch, imm);

3845

ANDS(Rd, Rn, scratch);

3846

}

3847

}

3848

3849

void ARM64XEmitter::ADDI2R(ARM64Reg Rd, ARM64Reg Rn, u64 imm, ARM64Reg scratch) {

3850

u32 val;

3851

bool shift;

3852

if (IsImmArithmetic(imm, &val, &shift)) {

3853

ADD(Rd, Rn, val, shift);

3854

} else {

3855

_assert_msg_(JIT, scratch != INVALID_REG, "ADDI2R - failed to construct arithmetic immediate value from %08x, need scratch", (u32)imm);

3856

MOVI2R(scratch, imm);

3857

ADD(Rd, Rn, scratch);

3858

}

3859

}

3860

3861

void ARM64XEmitter::SUBI2R(ARM64Reg Rd, ARM64Reg Rn, u64 imm, ARM64Reg scratch) {

3862

u32 val;

3863

bool shift;

3864

if (IsImmArithmetic(imm, &val, &shift)) {

3865

SUB(Rd, Rn, val, shift);

3866

} else {

3867

_assert_msg_(JIT, scratch != INVALID_REG, "SUBI2R - failed to construct arithmetic immediate value from %08x, need scratch", (u32)imm);

3868

MOVI2R(scratch, imm);

3869

SUB(Rd, Rn, scratch);

3870

}

3871

}

3872

3873

void ARM64XEmitter::CMPI2R(ARM64Reg Rn, u64 imm, ARM64Reg scratch) {

3874

u32 val;

3875

bool shift;

3876

if (IsImmArithmetic(imm, &val, &shift)) {

3877

CMP(Rn, val, shift);

3878

} else {

3879

_assert_msg_(JIT, scratch != INVALID_REG, "CMPI2R - failed to construct arithmetic immediate value from %08x, need scratch", (u32)imm);

3880

MOVI2R(scratch, imm);

3881

CMP(Rn, scratch);

3882

}

3883

}

3884

3885

bool ARM64XEmitter::TryADDI2R(ARM64Reg Rd, ARM64Reg Rn, u32 imm) {

3886

u32 val;

3887

bool shift;

3888

if (IsImmArithmetic(imm, &val, &shift)) {

3889

ADD(Rd, Rn, val, shift);

3890

return true;

3891

} else {

3892

return false;

3893

}

3894

}

3895

3896

bool ARM64XEmitter::TrySUBI2R(ARM64Reg Rd, ARM64Reg Rn, u32 imm) {

3897

u32 val;

3898

bool shift;

3899

if (IsImmArithmetic(imm, &val, &shift)) {

3900

SUB(Rd, Rn, val, shift);

3901

return true;

3902

} else {

3903

return false;

3904

}

3905

}

3906

3907

bool ARM64XEmitter::TryCMPI2R(ARM64Reg Rn, u32 imm) {

3908

u32 val;

3909

bool shift;

3910

if (IsImmArithmetic(imm, &val, &shift)) {

3911

CMP(Rn, val, shift);

3912

return true;

3913

} else {

3914

return false;

3915

}

3916

}

3917

3918

bool ARM64XEmitter::TryANDI2R(ARM64Reg Rd, ARM64Reg Rn, u32 imm) {

3919

u32 n, imm_r, imm_s;

3920

if (IsImmLogical(imm, 32, &n, &imm_s, &imm_r)) {

3921

AND(Rd, Rn, imm_r, imm_s, n != 0);

3922

return true;

3923

} else {

3924

return false;

3925

}

3926

}

3927

bool ARM64XEmitter::TryORRI2R(ARM64Reg Rd, ARM64Reg Rn, u32 imm) {

3928

u32 n, imm_r, imm_s;

3929

if (IsImmLogical(imm, 32, &n, &imm_s, &imm_r)) {

3930

ORR(Rd, Rn, imm_r, imm_s, n != 0);

3931

return true;

3932

} else {

3933

return false;

3934

}

3935

}

3936

bool ARM64XEmitter::TryEORI2R(ARM64Reg Rd, ARM64Reg Rn, u32 imm) {

3937

u32 n, imm_r, imm_s;

3938

if (IsImmLogical(imm, 32, &n, &imm_s, &imm_r)) {

3939

EOR(Rd, Rn, imm_r, imm_s, n != 0);

3940

return true;

3941

} else {

3942

return false;

3943

}

3944

}

3945

3946

float FPImm8ToFloat(uint8_t bits) {

3947

int E = 8;

3948

int F = 32 - 8 - 1;

3949

int sign = bits >> 7;

3950

uint32_t f = 0;

3951

f |= (sign << 31);

3952

int bit6 = (bits >> 6) & 1;

3953

uint32_t exp = ((!bit6) << 7) | (0x7C * bit6) | ((bits >> 4) & 3);

3954

uint32_t mantissa = (bits & 0xF) << 19;

3955

f |= exp << 23;

3956

f |= mantissa;

3957

float fl;

3958

memcpy(&fl, &f, sizeof(float));

3959

return fl;

3960

}

3961

3962

bool FPImm8FromFloat(float value, uint8_t *immOut) {

3963

uint32_t f;

3964

memcpy(&f, &value, sizeof(float));

3965

uint32_t mantissa4 = (f & 0x7FFFFF) >> 19;

3966

uint32_t exponent = (f >> 23) & 0xFF;

3967

uint32_t sign = f >> 31;

3968

if ((exponent >> 7) == ((exponent >> 6) & 1))

3969

return false;

3970

uint8_t imm8 = (sign << 7) | ((!(exponent >> 7)) << 6) | ((exponent & 3) << 4) | mantissa4;

3971

float newFloat = FPImm8ToFloat(imm8);

3972

if (newFloat == value) {

3973

*immOut = imm8;

3974

return true;

3975

} else {

3976

return false;

3977

}

3978

}

3979

3980

void ARM64FloatEmitter::MOVI2F(ARM64Reg Rd, float value, ARM64Reg scratch, bool negate) {

3981

_assert_msg_(JIT, !IsDouble(Rd), "MOVI2F does not yet support double precision");

3982

uint8_t imm8;

3983

if (value == 0.0) {

3984

if (std::signbit(value)) {

3985

negate = !negate;

3986

}

3987

FMOV(Rd, IsDouble(Rd) ? ZR : WZR);

3988

if (negate) {

3989

FNEG(Rd, Rd);

3990

}

3991

// TODO: There are some other values we could generate with the float-imm instruction, like 1.0...

3992

} else if (negate && FPImm8FromFloat(-value, &imm8)) {

3993

FMOV(Rd, imm8);

3994

} else if (FPImm8FromFloat(value, &imm8)) {

3995

FMOV(Rd, imm8);

3996

if (negate) {

3997

FNEG(Rd, Rd);

3998

}

3999

} else {

4000

_assert_msg_(JIT, scratch != INVALID_REG, "Failed to find a way to generate FP immediate %f without scratch", value);

4001

u32 ival;

4002

if (negate) {

4003

value = -value;

4004

}

4005

memcpy(&ival, &value, sizeof(ival));

4006

m_emit->MOVI2R(scratch, ival);

4007

FMOV(Rd, scratch);

4008

}

4009

}

4010

4011

// TODO: Quite a few values could be generated easily using the MOVI instruction and friends.

4012

void ARM64FloatEmitter::MOVI2FDUP(ARM64Reg Rd, float value, ARM64Reg scratch) {

4013

// TODO: Make it work with more element sizes

4014

// TODO: Optimize - there are shorter solution for many values

4015

ARM64Reg s = (ARM64Reg)(S0 + DecodeReg(Rd));

4016

int ival;

4017

memcpy(&ival, &value, 4);

4018

if (ival == 0) { // Make sure to not catch negative zero here

4019

EOR(Rd, Rd, Rd);

4020

} else {

4021

MOVI2F(s, value, scratch);

4022

DUP(32, Rd, Rd, 0);

4023

}

4024

}

4025

4026

void ARM64XEmitter::SUBSI2R(ARM64Reg Rd, ARM64Reg Rn, u64 imm, ARM64Reg scratch) {

4027

u32 val;

4028

bool shift;

4029

if (IsImmArithmetic(imm, &val, &shift)) {

4030

SUBS(Rd, Rn, val, shift);

4031

} else {

4032

_assert_msg_(JIT, scratch != INVALID_REG, "ANDSI2R - failed to construct immediate value from %08x, need scratch", (u32)imm);

4033

MOVI2R(scratch, imm);

4034

SUBS(Rd, Rn, scratch);

4035

}

4036

}

4037

4038

} // namespace