{"id":2230681,"url":"http://patchwork.ozlabs.org/api/1.1/patches/2230681/?format=json","web_url":"http://patchwork.ozlabs.org/project/qemu-devel/patch/20260430000524.56046-26-richard.henderson@linaro.org/","project":{"id":14,"url":"http://patchwork.ozlabs.org/api/1.1/projects/14/?format=json","name":"QEMU Development","link_name":"qemu-devel","list_id":"qemu-devel.nongnu.org","list_email":"qemu-devel@nongnu.org","web_url":"","scm_url":"","webscm_url":""},"msgid":"<20260430000524.56046-26-richard.henderson@linaro.org>","date":"2026-04-30T00:05:08","name":"[v2,25/40] fpu: Reorganize partsN(muladd)","commit_ref":null,"pull_url":null,"state":"new","archived":false,"hash":"b40f8973e3854ae649e6bec67db8194dc9f0d084","submitter":{"id":72104,"url":"http://patchwork.ozlabs.org/api/1.1/people/72104/?format=json","name":"Richard Henderson","email":"richard.henderson@linaro.org"},"delegate":null,"mbox":"http://patchwork.ozlabs.org/project/qemu-devel/patch/20260430000524.56046-26-richard.henderson@linaro.org/mbox/","series":[{"id":502170,"url":"http://patchwork.ozlabs.org/api/1.1/series/502170/?format=json","web_url":"http://patchwork.ozlabs.org/project/qemu-devel/list/?series=502170","date":"2026-04-30T00:04:48","name":"fpu: Export some internals for targets","version":2,"mbox":"http://patchwork.ozlabs.org/series/502170/mbox/"}],"comments":"http://patchwork.ozlabs.org/api/patches/2230681/comments/","check":"pending","checks":"http://patchwork.ozlabs.org/api/patches/2230681/checks/","tags":{},"headers":{"Return-Path":"<qemu-devel-bounces+incoming=patchwork.ozlabs.org@nongnu.org>","X-Original-To":"incoming@patchwork.ozlabs.org","Delivered-To":"patchwork-incoming@legolas.ozlabs.org","Authentication-Results":["legolas.ozlabs.org;\n\tdkim=pass (2048-bit key;\n unprotected) header.d=linaro.org header.i=@linaro.org header.a=rsa-sha256\n header.s=google header.b=gRVLtQQO;\n\tdkim-atps=neutral","legolas.ozlabs.org;\n spf=pass (sender SPF authorized) smtp.mailfrom=nongnu.org\n (client-ip=209.51.188.17; helo=lists1p.gnu.org;\n envelope-from=qemu-devel-bounces+incoming=patchwork.ozlabs.org@nongnu.org;\n receiver=patchwork.ozlabs.org)"],"Received":["from lists1p.gnu.org (lists1p.gnu.org [209.51.188.17])\n\t(using TLSv1.2 with cipher ECDHE-ECDSA-AES256-GCM-SHA384 (256/256 bits))\n\t(No client certificate requested)\n\tby legolas.ozlabs.org (Postfix) with ESMTPS id 4g5ZHm2zQmz1yHZ\n\tfor <incoming@patchwork.ozlabs.org>; Thu, 30 Apr 2026 10:07:48 +1000 (AEST)","from localhost ([::1] helo=lists1p.gnu.org)\n\tby lists1p.gnu.org with esmtp (Exim 4.90_1)\n\t(envelope-from <qemu-devel-bounces@nongnu.org>)\n\tid 1wIEwL-0001L4-Bn; Wed, 29 Apr 2026 20:07:37 -0400","from eggs.gnu.org ([2001:470:142:3::10])\n by lists1p.gnu.org with esmtps (TLS1.2:ECDHE_RSA_AES_256_GCM_SHA384:256)\n (Exim 4.90_1) (envelope-from <richard.henderson@linaro.org>)\n id 1wIEvE-0007sW-PW\n for qemu-devel@nongnu.org; Wed, 29 Apr 2026 20:06:30 -0400","from mail-pf1-x42a.google.com ([2607:f8b0:4864:20::42a])\n by eggs.gnu.org with esmtps (TLS1.2:ECDHE_RSA_AES_128_GCM_SHA256:128)\n (Exim 4.90_1) (envelope-from <richard.henderson@linaro.org>)\n id 1wIEvC-0001sm-Sz\n for qemu-devel@nongnu.org; Wed, 29 Apr 2026 20:06:28 -0400","by mail-pf1-x42a.google.com with SMTP id\n d2e1a72fcca58-82d0b68837aso184920b3a.2\n for <qemu-devel@nongnu.org>; Wed, 29 Apr 2026 17:06:26 -0700 (PDT)","from stoup.. ([180.233.125.15]) by smtp.gmail.com with ESMTPSA id\n d2e1a72fcca58-834ed7ef7a8sm2928667b3a.47.2026.04.29.17.06.23\n (version=TLS1_3 cipher=TLS_AES_256_GCM_SHA384 bits=256/256);\n Wed, 29 Apr 2026 17:06:25 -0700 (PDT)"],"DKIM-Signature":"v=1; a=rsa-sha256; c=relaxed/relaxed;\n d=linaro.org; s=google; t=1777507585; x=1778112385; darn=nongnu.org;\n h=content-transfer-encoding:mime-version:references:in-reply-to\n :message-id:date:subject:cc:to:from:from:to:cc:subject:date\n :message-id:reply-to;\n bh=5ufTVgbdGLWNTrUsYza5RsHlQnemu/cr0uM1Uo8UApo=;\n b=gRVLtQQOnuFa+vH+rU1Z3/FHa9tk0ObLSznN59xHEPCrA/vRPrvyLR14de9akv2+B3\n FVz3p817k9gGZH7B2cqd/sQjjYDzQme0DHyhWwtMLbj7s5DCReX2LHf2XdyFqCdQf0fo\n UP06eT+4W0nQPkqS9l2sUpvxpHseT8T9DIsFGCZuR0BaXSZSupwxQH+GjThAjEWvqw8D\n nIpNiOW2gCHCYY+0KqJ0X7MgH8KN9yHaUsCerj7FPt9cRvpbf0VEojP45lypqGSalScT\n 4iIkGngZDnCgBs6Phj/TZwtZPX5pakIH9yWZ212mjXyrHdowFT+0Xo0zhRnzuEf/s4FG\n IXog==","X-Google-DKIM-Signature":"v=1; a=rsa-sha256; c=relaxed/relaxed;\n d=1e100.net; s=20251104; t=1777507585; x=1778112385;\n h=content-transfer-encoding:mime-version:references:in-reply-to\n :message-id:date:subject:cc:to:from:x-gm-gg:x-gm-message-state:from\n :to:cc:subject:date:message-id:reply-to;\n bh=5ufTVgbdGLWNTrUsYza5RsHlQnemu/cr0uM1Uo8UApo=;\n b=TIXEIUpwLtZ24HS2aDVJ9DEBB39CqzFXfM4oQB5fTU822Xu9JHsm4KUMuynckKAFn/\n HvJKM5MW80BMwL9a2sItq9H5oUKc6ei9k/OcvMbnm/gbqByzCKx0yflOdkVUKDqD8SMa\n C8llxR9K/b+LD3O8OR+NMk57bKAACBzZ/GhHc6d5C+6E0u4inIXXMZldp2EuVfADB2SV\n YURakZVBkB5GXjNQgajIi+N9PMzu7UsZa2/kaWoa3i21omktqVEA5rWwM1cvzNkkUi47\n /XANX5PnkNjqgwqtVM4ctEeJp1xU1Kwq6jLyDLNCxzXHsHOXbGIbe5HjjMWfi/0yw+gS\n Y/kw==","X-Gm-Message-State":"AOJu0YwFkt+6cu4QAofQmh7cWiQoeD0aVJNz+spNWMiVWr6Cq54TcLCS\n cjw1xUtCvZ8QsOdsudXqO4PJtovMqLpZ01Eu9Dchfmd3Y3k1ll9r9vpywqNEEWGTaNLstW6qFuC\n J0AssqwU=","X-Gm-Gg":"AeBDietJ8pP4lxgW5r9xuaaB3BTNU2L5hyAWZLb8o1TcEmxCTCgb2y7VKK+sCFf3ZQH\n zn5BVGjCu6zj6ZR0NilO6PvB24tE/3lqRRDcA+LHNB3azHIxa7PZzDQYUZVJivj2DEg5ojh/0Q5\n w8cer45B/RdiG8YK7l3H2MEJU6VKwXFctLjAXWB2cfNUGTU3N+COvYvnSGiVQRd62KLu5VgVdJH\n VGLzwBlwf+DqWJr+4/xSpR/UaqwpDt+CrU1pJronh+xutc4jnij+OOB68DUwbbRJDnYTyjbcIfN\n +hoONg1Yonb3PzHu29qwsiP6LsPEdjdAM1vUpteOFKC+Cme80LeuzSlQ1i6Gl68/4ip31vXGYhL\n 6D41RLON8k42DLuCcGxkZu4UcVSUqMD0PhSmx3Go/8zZIHTSS3vUu6dhPTUJOEj5MMHI50XCTA2\n NIFgYt0l8K714N3GMNUjaFMjOtXeixB3FFvxyffRHl","X-Received":"by 2002:a05:6a00:2998:b0:82c:9897:70ef with SMTP id\n d2e1a72fcca58-834fdbd1668mr776079b3a.27.1777507585421;\n Wed, 29 Apr 2026 17:06:25 -0700 (PDT)","From":"Richard Henderson <richard.henderson@linaro.org>","To":"qemu-devel@nongnu.org","Cc":"philmd@linaro.org","Subject":"[PATCH v2 25/40] fpu: Reorganize partsN(muladd)","Date":"Thu, 30 Apr 2026 10:05:08 +1000","Message-ID":"<20260430000524.56046-26-richard.henderson@linaro.org>","X-Mailer":"git-send-email 2.43.0","In-Reply-To":"<20260430000524.56046-1-richard.henderson@linaro.org>","References":"<20260430000524.56046-1-richard.henderson@linaro.org>","MIME-Version":"1.0","Content-Transfer-Encoding":"8bit","Received-SPF":"pass client-ip=2607:f8b0:4864:20::42a;\n envelope-from=richard.henderson@linaro.org; helo=mail-pf1-x42a.google.com","X-Spam_score_int":"-20","X-Spam_score":"-2.1","X-Spam_bar":"--","X-Spam_report":"(-2.1 / 5.0 requ) BAYES_00=-1.9, DKIM_SIGNED=0.1,\n DKIM_VALID=-0.1, DKIM_VALID_AU=-0.1, DKIM_VALID_EF=-0.1,\n RCVD_IN_DNSWL_NONE=-0.0001, SPF_HELO_NONE=0.001,\n SPF_PASS=-0.001 autolearn=ham autolearn_force=no","X-Spam_action":"no action","X-BeenThere":"qemu-devel@nongnu.org","X-Mailman-Version":"2.1.29","Precedence":"list","List-Id":"qemu development <qemu-devel.nongnu.org>","List-Unsubscribe":"<https://lists.nongnu.org/mailman/options/qemu-devel>,\n <mailto:qemu-devel-request@nongnu.org?subject=unsubscribe>","List-Archive":"<https://lists.nongnu.org/archive/html/qemu-devel>","List-Post":"<mailto:qemu-devel@nongnu.org>","List-Help":"<mailto:qemu-devel-request@nongnu.org?subject=help>","List-Subscribe":"<https://lists.nongnu.org/mailman/listinfo/qemu-devel>,\n <mailto:qemu-devel-request@nongnu.org?subject=subscribe>","Errors-To":"qemu-devel-bounces+incoming=patchwork.ozlabs.org@nongnu.org","Sender":"qemu-devel-bounces+incoming=patchwork.ozlabs.org@nongnu.org"},"content":"Check the likely case of normal product and normal or\nzero addend first; shift NaN and infinity detection down;\nend with zero product + addend.\n\nSigned-off-by: Richard Henderson <richard.henderson@linaro.org>\n---\n fpu/softfloat-parts.c.inc | 155 +++++++++++++++++---------------------\n 1 file changed, 70 insertions(+), 85 deletions(-)","diff":"diff --git a/fpu/softfloat-parts.c.inc b/fpu/softfloat-parts.c.inc\nindex b8baaf1e76..77465cce6e 100644\n--- a/fpu/softfloat-parts.c.inc\n+++ b/fpu/softfloat-parts.c.inc\n@@ -683,11 +683,47 @@ static FloatPartsN *partsN(muladd)(FloatPartsN *a, FloatPartsN *b,\n                                    FloatPartsN *c,\n                                    int flags, float_status *s)\n {\n-    int ab_mask, abc_mask;\n-    FloatPartsW p_widen, c_widen;\n+    int ab_mask = float_cmask(a->cls) | float_cmask(b->cls);\n+    int c_mask = float_cmask(c->cls);\n+    int abc_mask = ab_mask | c_mask;\n+    bool c_sign = c->sign ^ !!(flags & float_muladd_negate_c);\n+    bool p_sign = a->sign ^ b->sign ^ !!(flags & float_muladd_negate_product);\n \n-    ab_mask = float_cmask(a->cls) | float_cmask(b->cls);\n-    abc_mask = float_cmask(c->cls) | ab_mask;\n+    /*\n+     * The \"likely\" case is A and B normal, so that the product is normal,\n+     * and C normal or zero so that the result is normal.\n+     */\n+    int likely_mask = ab_mask | (c_mask & ~float_cmask_zero);\n+    if (likely(cmask_is_only_normals(likely_mask))) {\n+        record_denormals_used(abc_mask, s);\n+\n+        /* Perform the multiplication step. */\n+        FloatPartsW p_widen = { .sign = p_sign, .exp = a->exp + b->exp + 1 };\n+        fracN(mulw)(&p_widen, a, b);\n+        if (!(p_widen.frac_hi & DECOMPOSED_IMPLICIT_BIT)) {\n+            fracW(add)(&p_widen, &p_widen, &p_widen);\n+            p_widen.exp -= 1;\n+        }\n+\n+        /* Perform the addition step. */\n+        if (!(c_mask & float_cmask_zero)) {\n+            /* Zero-extend C to less significant bits. */\n+            FloatPartsW c_widen = { .sign = c_sign, .exp = c->exp };\n+            fracN(widen)(&c_widen, c);\n+\n+            if (p_sign == c_sign) {\n+                partsW(add_normal)(&p_widen, &c_widen);\n+            } else if (!partsW(sub_normal)(&p_widen, &c_widen)) {\n+                goto return_sub_zero;\n+            }\n+        }\n+\n+        /* Narrow with sticky bit, for proper rounding later. */\n+        fracN(truncjam)(a, &p_widen);\n+        a->sign = p_widen.sign;\n+        a->exp = p_widen.exp;\n+        return a;\n+    }\n \n     /*\n      * It is implementation-defined whether the cases of (0,inf,qnan)\n@@ -700,97 +736,46 @@ static FloatPartsN *partsN(muladd)(FloatPartsN *a, FloatPartsN *b,\n         return a;\n     }\n \n-    if (flags & float_muladd_negate_c) {\n-        c->sign ^= 1;\n+    if (unlikely(ab_mask == float_cmask_infzero)) {\n+        /* Inf * Zero == NaN */\n+        float_raise(float_flag_invalid | float_flag_invalid_imz, s);\n+        goto d_nan;\n     }\n \n-    /* Compute the sign of the product into A. */\n-    a->sign ^= b->sign;\n-    if (flags & float_muladd_negate_product) {\n-        a->sign ^= 1;\n-    }\n-\n-    if (unlikely(!cmask_is_only_normals(ab_mask))) {\n-        if (unlikely(ab_mask == float_cmask_infzero)) {\n-            float_raise(float_flag_invalid | float_flag_invalid_imz, s);\n+    if (unlikely(ab_mask & float_cmask_inf)) {\n+        if ((c_mask & float_cmask_inf) && p_sign != c_sign) {\n+            /* Inf - Inf == NaN */\n+            float_raise(float_flag_invalid | float_flag_invalid_isi, s);\n             goto d_nan;\n         }\n-\n-        if (ab_mask & float_cmask_inf) {\n-            if (c->cls == float_class_inf && a->sign != c->sign) {\n-                float_raise(float_flag_invalid | float_flag_invalid_isi, s);\n-                goto d_nan;\n-            }\n-            goto return_inf;\n-        }\n-\n-        g_assert(ab_mask & float_cmask_zero);\n-        if (is_anynorm(c->cls)) {\n-            *a = *c;\n-            goto finish_sign;\n-        }\n-        if (c->cls == float_class_zero) {\n-            if (flags & float_muladd_suppress_add_product_zero) {\n-                a->sign = c->sign;\n-            } else if (a->sign != c->sign) {\n-                goto return_sub_zero;\n-            }\n-            goto return_zero;\n-        }\n-        g_assert(c->cls == float_class_inf);\n+        /* Inf + C == Inf */\n+        record_denormals_used(abc_mask, s);\n+        a->sign = p_sign;\n+        a->cls = float_class_inf;\n+        return a;\n     }\n-\n-    if (unlikely(c->cls == float_class_inf)) {\n-        a->sign = c->sign;\n-        goto return_inf;\n-    }\n-\n-    /* Perform the multiplication step. */\n-    p_widen.sign = a->sign;\n-    p_widen.exp = a->exp + b->exp + 1;\n-    fracN(mulw)(&p_widen, a, b);\n-    if (!(p_widen.frac_hi & DECOMPOSED_IMPLICIT_BIT)) {\n-        fracW(add)(&p_widen, &p_widen, &p_widen);\n-        p_widen.exp -= 1;\n-    }\n-\n-    /* Perform the addition step. */\n-    if (c->cls != float_class_zero) {\n-        /* Zero-extend C to less significant bits. */\n-        fracN(widen)(&c_widen, c);\n-        c_widen.exp = c->exp;\n-\n-        if (a->sign == c->sign) {\n-            partsW(add_normal)(&p_widen, &c_widen);\n-        } else if (!partsW(sub_normal)(&p_widen, &c_widen)) {\n-            goto return_sub_zero;\n-        }\n-    }\n-\n-    /* Narrow with sticky bit, for proper rounding later. */\n-    fracN(truncjam)(a, &p_widen);\n-    a->sign = p_widen.sign;\n-    a->exp = p_widen.exp;\n-\n- finish_sign:\n-    /*\n-     * All result types except for \"return the default NaN\n-     * because this is an Invalid Operation\" go through here;\n-     * this matches the set of cases where we consumed a\n-     * denormal input.\n-     */\n     record_denormals_used(abc_mask, s);\n-    return a;\n+\n+    /* Only remaining case is zero product. */\n+    assert(ab_mask & float_cmask_zero);\n+\n+    /*\n+     * 0 + C == C,\n+     * except for 0 - 0, which needs special rounding,\n+     * except for when we want to suppress this addition step.\n+     */\n+    if (!(c_mask & float_cmask_zero)\n+        || p_sign == c_sign\n+        || (flags & float_muladd_suppress_add_product_zero)) {\n+        c->sign = c_sign;\n+        return c;\n+    }\n \n  return_sub_zero:\n+    /* 0 - 0 == -0 for round_down, +0 otherwise. */\n     a->sign = s->float_rounding_mode == float_round_down;\n- return_zero:\n     a->cls = float_class_zero;\n-    goto finish_sign;\n-\n- return_inf:\n-    a->cls = float_class_inf;\n-    goto finish_sign;\n+    return a;\n \n  d_nan:\n     *a = partsN(default_nan)(s);\n","prefixes":["v2","25/40"]}