Re: [Qemu-devel] [PATCH 36/38] target-unicore32: Use mul*2 for do

qemu-devel

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [Qemu-devel] [PATCH 36/38] target-unicore32: Use mul*2 for do_mult

From:	guanxuetao
Subject:	Re: [Qemu-devel] [PATCH 36/38] target-unicore32: Use mul*2 for do_mult
Date:	Wed, 27 Feb 2013 10:09:10 +0800 (CST)
User-agent:	SquirrelMail/1.4.8-4.0.1.el5

> Cc: Guan Xuetao <address@hidden>
> Signed-off-by: Richard Henderson <address@hidden>

Acked-by: Guan Xuetao <address@hidden>

> ---
>  target-unicore32/translate.c | 83
> ++++++--------------------------------------
>  1 file changed, 11 insertions(+), 72 deletions(-)
>
> diff --git a/target-unicore32/translate.c b/target-unicore32/translate.c
> index f4498bc..d5039e2 100644
> --- a/target-unicore32/translate.c
> +++ b/target-unicore32/translate.c
> @@ -267,37 +267,6 @@ static void gen_exception(int excp)
>      dead_tmp(tmp);
>  }
>
> -/* FIXME: Most targets have native widening multiplication.
> -   It would be good to use that instead of a full wide multiply.  */
> -/* 32x32->64 multiply.  Marks inputs as dead.  */
> -static TCGv_i64 gen_mulu_i64_i32(TCGv a, TCGv b)
> -{
> -    TCGv_i64 tmp1 = tcg_temp_new_i64();
> -    TCGv_i64 tmp2 = tcg_temp_new_i64();
> -
> -    tcg_gen_extu_i32_i64(tmp1, a);
> -    dead_tmp(a);
> -    tcg_gen_extu_i32_i64(tmp2, b);
> -    dead_tmp(b);
> -    tcg_gen_mul_i64(tmp1, tmp1, tmp2);
> -    tcg_temp_free_i64(tmp2);
> -    return tmp1;
> -}
> -
> -static TCGv_i64 gen_muls_i64_i32(TCGv a, TCGv b)
> -{
> -    TCGv_i64 tmp1 = tcg_temp_new_i64();
> -    TCGv_i64 tmp2 = tcg_temp_new_i64();
> -
> -    tcg_gen_ext_i32_i64(tmp1, a);
> -    dead_tmp(a);
> -    tcg_gen_ext_i32_i64(tmp2, b);
> -    dead_tmp(b);
> -    tcg_gen_mul_i64(tmp1, tmp1, tmp2);
> -    tcg_temp_free_i64(tmp2);
> -    return tmp1;
> -}
> -
>  #define gen_set_CF(var) tcg_gen_st_i32(var, cpu_env,
> offsetof(CPUUniCore32State, CF))
>
>  /* Set CF to the top bit of var.  */
> @@ -1219,38 +1188,6 @@ static void disas_coproc_insn(CPUUniCore32State
> *env, DisasContext *s,
>      }
>  }
>
> -
> -/* Store a 64-bit value to a register pair.  Clobbers val.  */
> -static void gen_storeq_reg(DisasContext *s, int rlow, int rhigh, TCGv_i64
> val)
> -{
> -    TCGv tmp;
> -    tmp = new_tmp();
> -    tcg_gen_trunc_i64_i32(tmp, val);
> -    store_reg(s, rlow, tmp);
> -    tmp = new_tmp();
> -    tcg_gen_shri_i64(val, val, 32);
> -    tcg_gen_trunc_i64_i32(tmp, val);
> -    store_reg(s, rhigh, tmp);
> -}
> -
> -/* load and add a 64-bit value from a register pair.  */
> -static void gen_addq(DisasContext *s, TCGv_i64 val, int rlow, int rhigh)
> -{
> -    TCGv_i64 tmp;
> -    TCGv tmpl;
> -    TCGv tmph;
> -
> -    /* Load 64-bit value rd:rn.  */
> -    tmpl = load_reg(s, rlow);
> -    tmph = load_reg(s, rhigh);
> -    tmp = tcg_temp_new_i64();
> -    tcg_gen_concat_i32_i64(tmp, tmpl, tmph);
> -    dead_tmp(tmpl);
> -    dead_tmp(tmph);
> -    tcg_gen_add_i64(val, val, tmp);
> -    tcg_temp_free_i64(tmp);
> -}
> -
>  /* data processing instructions */
>  static void do_datap(CPUUniCore32State *env, DisasContext *s, uint32_t
> insn)
>  {
> @@ -1445,24 +1382,26 @@ static void do_datap(CPUUniCore32State *env,
> DisasContext *s, uint32_t insn)
>  /* multiply */
>  static void do_mult(CPUUniCore32State *env, DisasContext *s, uint32_t
> insn)
>  {
> -    TCGv tmp;
> -    TCGv tmp2;
> -    TCGv_i64 tmp64;
> +    TCGv tmp, tmp2, tmp3, tmp4;
>
>      if (UCOP_SET(27)) {
>          /* 64 bit mul */
>          tmp = load_reg(s, UCOP_REG_M);
>          tmp2 = load_reg(s, UCOP_REG_N);
>          if (UCOP_SET(26)) {
> -            tmp64 = gen_muls_i64_i32(tmp, tmp2);
> +            tcg_gen_muls2_i32(tmp, tmp2, tmp, tmp2);
>          } else {
> -            tmp64 = gen_mulu_i64_i32(tmp, tmp2);
> +            tcg_gen_mulu2_i32(tmp, tmp2, tmp, tmp2);
>          }
>          if (UCOP_SET(25)) { /* mult accumulate */
> -            gen_addq(s, tmp64, UCOP_REG_LO, UCOP_REG_HI);
> -        }
> -        gen_storeq_reg(s, UCOP_REG_LO, UCOP_REG_HI, tmp64);
> -        tcg_temp_free_i64(tmp64);
> +            tmp3 = load_reg(s, UCOP_REG_LO);
> +            tmp4 = load_reg(s, UCOP_REG_HI);
> +            tcg_gen_add2_i32(tmp, tmp2, tmp, tmp2, tmp3, tmp4);
> +            dead_tmp(tmp3);
> +            dead_tmp(tmp4);
> +        }
> +        store_reg(s, UCOP_REG_LO, tmp);
> +        store_reg(s, UCOP_REG_HI, tmp2);
>      } else {
>          /* 32 bit mul */
>          tmp = load_reg(s, UCOP_REG_M);
> --
> 1.8.1.2
>

[Prev in Thread]

Current Thread

[Next in Thread]

Re: [Qemu-devel] [PATCH 11/38] target-i386: Use mulu2 and muls2, (continued)
- [Qemu-devel] [PATCH 13/38] tcg: Implement muls2 with mulu2, Richard Henderson, 2013/02/20
- [Qemu-devel] [PATCH 18/38] target-arm: Use mul[us]2 and add2 in umlal et al, Richard Henderson, 2013/02/20
- [Qemu-devel] [PATCH 15/38] target-alpha: Use mulu2 for umulh insn, Richard Henderson, 2013/02/20
- [Qemu-devel] [PATCH 28/38] target-ppc: Compute addition carry with setcond, Richard Henderson, 2013/02/20
- [Qemu-devel] [PATCH 32/38] target-ppc: Compute mullwo without branches, Richard Henderson, 2013/02/20
- [Qemu-devel] [PATCH 34/38] target-sparc: Use mul*2 for multiply, Richard Henderson, 2013/02/20
- [Qemu-devel] [PATCH 33/38] target-sparc: Use official add2/sub2 interfaces for addx/subx, Richard Henderson, 2013/02/20
- [Qemu-devel] [PATCH 30/38] target-ppc: Implement neg in terms of subf, Richard Henderson, 2013/02/20
- [Qemu-devel] [PATCH 36/38] target-unicore32: Use mul*2 for do_mult, Richard Henderson, 2013/02/20
  - Re: [Qemu-devel] [PATCH 36/38] target-unicore32: Use mul*2 for do_mult, guanxuetao <=
- [Qemu-devel] [PATCH 24/38] target-ppc: Use mul*2 in mulh* insns, Richard Henderson, 2013/02/20
- [Qemu-devel] [PATCH 20/38] target-arm: Implement adc_cc inline, Richard Henderson, 2013/02/20
  - Re: [Qemu-devel] [PATCH 20/38] target-arm: Implement adc_cc inline, Peter Crosthwaite, 2013/02/25
- [Qemu-devel] [PATCH 37/38] target-xtensa: Use mul*2 for mul*hi, Richard Henderson, 2013/02/20
- [Qemu-devel] [PATCH 35/38] target-sh4: Use mul*2 for dmul*, Richard Henderson, 2013/02/20
- [Qemu-devel] [PATCH 31/38] target-ppc: Compute arithmetic shift carry without branches, Richard Henderson, 2013/02/20
- [Qemu-devel] [PATCH 29/38] target-ppc: Use add2 for carry generation, Richard Henderson, 2013/02/20
- [Qemu-devel] [PATCH 19/38] target-arm: Use add2 in gen_add_CC, Richard Henderson, 2013/02/20
- [Qemu-devel] [PATCH 27/38] target-ppc: Compute addition overflow without branches, Richard Henderson, 2013/02/20
- [Qemu-devel] [PATCH 22/38] target-mips: Use mul[us]2 in [D]MULT[U] insns, Richard Henderson, 2013/02/20

Prev by Date: [Qemu-devel] [PATCH 1/3] target-i386: group cpu model definitions by vendor
Next by Date: Re: [Qemu-devel] [PATCH v4 21/23] hw/arm: add Faraday FTSPI020 SPI flash controller support
Previous by thread: [Qemu-devel] [PATCH 36/38] target-unicore32: Use mul*2 for do_mult
Next by thread: [Qemu-devel] [PATCH 24/38] target-ppc: Use mul*2 in mulh* insns
Index(es):
- Date
- Thread