arm/convolve: Fix the vfp4 real convolution for h_len=12

Change-Id: Ic73f0746edd3f1f22bb1d79d4c64aa740691dd48
Signed-off-by: Sylvain Munaut <tnt@246tNt.com>
This commit is contained in:
Sylvain Munaut 2018-12-21 16:47:12 +01:00
parent d20b7fa579
commit acf804c034
1 changed files with 2 additions and 2 deletions

View File

@ -92,8 +92,8 @@ neon_conv_real12:
vld2.32 {q8-q9}, [r4], r6 vld2.32 {q8-q9}, [r4], r6
vld2.32 {q10-q11}, [r5], r6 vld2.32 {q10-q11}, [r5], r6
#ifdef HAVE_NEON_FMA #ifdef HAVE_NEON_FMA
vfma.f32 q1, q6, q0 vmul.f32 q1, q6, q0
vfma.f32 q3, q7, q0 vmul.f32 q3, q7, q0
vfma.f32 q1, q8, q2 vfma.f32 q1, q8, q2
vfma.f32 q3, q9, q2 vfma.f32 q3, q9, q2
vfma.f32 q1, q10, q4 vfma.f32 q1, q10, q4