NotificationsYou must be signed in to change notification settings
Fork5
Star26

Commit0700965

committed

Repair roundoff-error problem for stddev/variance results near zero,

per complaint from Kemin Zhou.Fix lack of precision in numeric stddev/variance.

1 parent63cc56d commit0700965Copy full SHA for 0700965

File tree

2 files changed

+98

-41

lines changed

src/backend/utils/adt
- float.c
- numeric.c

2 files changed

+98

-41

lines changed

`‎src/backend/utils/adt/float.c`

Lines changed: 19 additions & 5 deletions

Original file line number	Diff line number	Diff line change
`@@ -8,7 +8,7 @@`
`8`	`8`	`*`
`9`	`9`	`*`
`10`	`10`	`* IDENTIFICATION`
`11`		`- * $Header: /cvsroot/pgsql/src/backend/utils/adt/float.c,v 1.77 2001/11/05 17:46:29 momjian Exp $`
	`11`	`+ * $Header: /cvsroot/pgsql/src/backend/utils/adt/float.c,v 1.78 2001/12/11 02:02:12 tgl Exp $`
`12`	`12`	`*`
`13`	`13`	`*-------------------------------------------------------------------------`
`14`	`14`	`*/`
`@@ -1580,7 +1580,8 @@ float8_variance(PG_FUNCTION_ARGS)`
`1580`	`1580`	`float8*transvalues;`
`1581`	`1581`	`float8N,`
`1582`	`1582`	`sumX,`
`1583`		`-sumX2;`
	`1583`	`+sumX2,`
	`1584`	`+numerator;`
`1584`	`1585`
`1585`	`1586`	`transvalues=check_float8_array(transarray,"float8_variance");`
`1586`	`1587`	`N=transvalues[0];`
`@@ -1594,7 +1595,13 @@ float8_variance(PG_FUNCTION_ARGS)`
`1594`	`1595`	`if (N <=1.0)`
`1595`	`1596`	`PG_RETURN_FLOAT8(0.0);`
`1596`	`1597`
`1597`		`-PG_RETURN_FLOAT8((NsumX2-sumXsumX) / (N* (N-1.0)));`
	`1598`	`+numerator=NsumX2-sumXsumX;`
	`1599`	`+`
	`1600`	`+/* Watch out for roundoff error producing a negative numerator */`
	`1601`	`+if (numerator <=0.0)`
	`1602`	`+PG_RETURN_FLOAT8(0.0);`
	`1603`	`+`
	`1604`	`+PG_RETURN_FLOAT8(numerator / (N* (N-1.0)));`
`1598`	`1605`	`}`
`1599`	`1606`
`1600`	`1607`	`Datum`
`@@ -1604,7 +1611,8 @@ float8_stddev(PG_FUNCTION_ARGS)`
`1604`	`1611`	`float8*transvalues;`
`1605`	`1612`	`float8N,`
`1606`	`1613`	`sumX,`
`1607`		`-sumX2;`
	`1614`	`+sumX2,`
	`1615`	`+numerator;`
`1608`	`1616`
`1609`	`1617`	`transvalues=check_float8_array(transarray,"float8_stddev");`
`1610`	`1618`	`N=transvalues[0];`
`@@ -1618,7 +1626,13 @@ float8_stddev(PG_FUNCTION_ARGS)`
`1618`	`1626`	`if (N <=1.0)`
`1619`	`1627`	`PG_RETURN_FLOAT8(0.0);`
`1620`	`1628`
`1621`		`-PG_RETURN_FLOAT8(sqrt((NsumX2-sumXsumX) / (N* (N-1.0))));`
	`1629`	`+numerator=NsumX2-sumXsumX;`
	`1630`	`+`
	`1631`	`+/* Watch out for roundoff error producing a negative numerator */`
	`1632`	`+if (numerator <=0.0)`
	`1633`	`+PG_RETURN_FLOAT8(0.0);`
	`1634`	`+`
	`1635`	`+PG_RETURN_FLOAT8(sqrt(numerator / (N* (N-1.0))));`
`1622`	`1636`	`}`
`1623`	`1637`
`1624`	`1638`

`‎src/backend/utils/adt/numeric.c`

Lines changed: 79 additions & 36 deletions

Original file line number	Diff line number	Diff line change
`@@ -5,7 +5,7 @@`
`5`	`5`	`*`
`6`	`6`	`*1998 Jan Wieck`
`7`	`7`	`*`
`8`		`- * $Header: /cvsroot/pgsql/src/backend/utils/adt/numeric.c,v 1.48 2001/11/05 17:46:29 momjian Exp $`
	`8`	`+ * $Header: /cvsroot/pgsql/src/backend/utils/adt/numeric.c,v 1.49 2001/12/11 02:02:12 tgl Exp $`
`9`	`9`	`*`
`10`	`10`	`* ----------`
`11`	`11`	`*/`
`@@ -159,6 +159,7 @@ static void add_var(NumericVar var1, NumericVar var2, NumericVar *result);`
`159`	`159`	`staticvoidsub_var(NumericVarvar1,NumericVarvar2,NumericVar*result);`
`160`	`160`	`staticvoidmul_var(NumericVarvar1,NumericVarvar2,NumericVar*result);`
`161`	`161`	`staticvoiddiv_var(NumericVarvar1,NumericVarvar2,NumericVar*result);`
	`162`	`+staticintselect_div_scale(NumericVarvar1,NumericVarvar2);`
`162`	`163`	`staticvoidmod_var(NumericVarvar1,NumericVarvar2,NumericVar*result);`
`163`	`164`	`staticvoidceil_var(NumericVarvar,NumericVarresult);`
`164`	`165`	`staticvoidfloor_var(NumericVarvar,NumericVarresult);`
`@@ -999,28 +1000,7 @@ numeric_div(PG_FUNCTION_ARGS)`
`999`	`1000`	`set_var_from_num(num1,&arg1);`
`1000`	`1001`	`set_var_from_num(num2,&arg2);`
`1001`	`1002`
`1002`		`-/* ----------`
`1003`		`- * The result scale of a division isn't specified in any`
`1004`		`- * SQL standard. For Postgres it is the following (where`
`1005`		`- * SR, DR are the result- and display-scales of the returned`
`1006`		`- * value, S1, D1, S2 and D2 are the scales of the two arguments,`
`1007`		`- * The minimum and maximum scales are compile time options from`
`1008`		`- * numeric.h):`
`1009`		`- *`
`1010`		`- *DR = MIN(MAX(D1 + D2, MIN_DISPLAY_SCALE), MAX_DISPLAY_SCALE)`
`1011`		`- *SR = MIN(MAX(MAX(S1 + S2, MIN_RESULT_SCALE), DR + 4), MAX_RESULT_SCALE)`
`1012`		`- *`
`1013`		`- * By default, any result is computed with a minimum of 34 digits`
`1014`		`- * after the decimal point or at least with 4 digits more than`
`1015`		`- * displayed.`
`1016`		`- * ----------`
`1017`		`- */`
`1018`		`-res_dscale=MAX(arg1.dscale+arg2.dscale,NUMERIC_MIN_DISPLAY_SCALE);`
`1019`		`-res_dscale=MIN(res_dscale,NUMERIC_MAX_DISPLAY_SCALE);`
`1020`		`-global_rscale=MAX(arg1.rscale+arg2.rscale,`
`1021`		`-NUMERIC_MIN_RESULT_SCALE);`
`1022`		`-global_rscale=MAX(global_rscale,res_dscale+4);`
`1023`		`-global_rscale=MIN(global_rscale,NUMERIC_MAX_RESULT_SCALE);`
	`1003`	`+res_dscale=select_div_scale(&arg1,&arg2);`
`1024`	`1004`
`1025`	`1005`	`/*`
`1026`	`1006`	`* Do the divide, set the display scale and return the result`
`@@ -1884,6 +1864,7 @@ numeric_variance(PG_FUNCTION_ARGS)`
`1884`	`1864`	`vsumX,`
`1885`	`1865`	`vsumX2,`
`1886`	`1866`	`vNminus1;`
	`1867`	`+intdiv_dscale;`
`1887`	`1868`
`1888`	`1869`	`/* We assume the input is array of numeric */`
`1889`	`1870`	`deconstruct_array(transarray,`
`@@ -1924,10 +1905,21 @@ numeric_variance(PG_FUNCTION_ARGS)`
`1924`	`1905`	`mul_var(&vsumX,&vsumX,&vsumX);/* now vsumX contains sumX * sumX */`
`1925`	`1906`	`mul_var(&vN,&vsumX2,&vsumX2);/* now vsumX2 contains N * sumX2 */`
`1926`	`1907`	`sub_var(&vsumX2,&vsumX,&vsumX2);/* N * sumX2 - sumX * sumX */`
`1927`		`-mul_var(&vN,&vNminus1,&vNminus1);/* N * (N - 1) */`
`1928`		`-div_var(&vsumX2,&vNminus1,&vsumX);/* variance */`
`1929`	`1908`
`1930`		`-res=make_result(&vsumX);`
	`1909`	`+if (cmp_var(&vsumX2,&const_zero) <=0)`
	`1910`	`+{`
	`1911`	`+/* Watch out for roundoff error producing a negative numerator */`
	`1912`	`+res=make_result(&const_zero);`
	`1913`	`+}`
	`1914`	`+else`
	`1915`	`+{`
	`1916`	`+mul_var(&vN,&vNminus1,&vNminus1);/* N * (N - 1) */`
	`1917`	`+div_dscale=select_div_scale(&vsumX2,&vNminus1);`
	`1918`	`+div_var(&vsumX2,&vNminus1,&vsumX);/* variance */`
	`1919`	`+vsumX.dscale=div_dscale;`
	`1920`	`+`
	`1921`	`+res=make_result(&vsumX);`
	`1922`	`+}`
`1931`	`1923`
`1932`	`1924`	`free_var(&vN);`
`1933`	`1925`	`free_var(&vNminus1);`
`@@ -1951,6 +1943,7 @@ numeric_stddev(PG_FUNCTION_ARGS)`
`1951`	`1943`	`vsumX,`
`1952`	`1944`	`vsumX2,`
`1953`	`1945`	`vNminus1;`
	`1946`	`+intdiv_dscale;`
`1954`	`1947`
`1955`	`1948`	`/* We assume the input is array of numeric */`
`1956`	`1949`	`deconstruct_array(transarray,`
`@@ -1991,11 +1984,22 @@ numeric_stddev(PG_FUNCTION_ARGS)`
`1991`	`1984`	`mul_var(&vsumX,&vsumX,&vsumX);/* now vsumX contains sumX * sumX */`
`1992`	`1985`	`mul_var(&vN,&vsumX2,&vsumX2);/* now vsumX2 contains N * sumX2 */`
`1993`	`1986`	`sub_var(&vsumX2,&vsumX,&vsumX2);/* N * sumX2 - sumX * sumX */`
`1994`		`-mul_var(&vN,&vNminus1,&vNminus1);/* N * (N - 1) */`
`1995`		`-div_var(&vsumX2,&vNminus1,&vsumX);/* variance */`
`1996`		`-sqrt_var(&vsumX,&vsumX);/* stddev */`
`1997`	`1987`
`1998`		`-res=make_result(&vsumX);`
	`1988`	`+if (cmp_var(&vsumX2,&const_zero) <=0)`
	`1989`	`+{`
	`1990`	`+/* Watch out for roundoff error producing a negative numerator */`
	`1991`	`+res=make_result(&const_zero);`
	`1992`	`+}`
	`1993`	`+else`
	`1994`	`+{`
	`1995`	`+mul_var(&vN,&vNminus1,&vNminus1);/* N * (N - 1) */`
	`1996`	`+div_dscale=select_div_scale(&vsumX2,&vNminus1);`
	`1997`	`+div_var(&vsumX2,&vNminus1,&vsumX);/* variance */`
	`1998`	`+vsumX.dscale=div_dscale;`
	`1999`	`+sqrt_var(&vsumX,&vsumX);/* stddev */`
	`2000`	`+`
	`2001`	`+res=make_result(&vsumX);`
	`2002`	`+}`
`1999`	`2003`
`2000`	`2004`	`free_var(&vN);`
`2001`	`2005`	`free_var(&vNminus1);`
`@@ -3318,6 +3322,50 @@ div_var(NumericVar var1, NumericVar var2, NumericVar *result)`
`3318`	`3322`	`}`
`3319`	`3323`
`3320`	`3324`
	`3325`	`+/*`
	`3326`	`+ * Default scale selection for division`
	`3327`	`+ *`
	`3328`	`+ * Returns the appropriate display scale for the division result,`
	`3329`	`+ * and sets global_rscale to the result scale to use during div_var.`
	`3330`	`+ *`
	`3331`	`+ * Note that this must be called before div_var.`
	`3332`	`+ */`
	`3333`	`+staticint`
	`3334`	`+select_div_scale(NumericVarvar1,NumericVarvar2)`
	`3335`	`+{`
	`3336`	`+intres_dscale;`
	`3337`	`+intres_rscale;`
	`3338`	`+`
	`3339`	`+/* ----------`
	`3340`	`+ * The result scale of a division isn't specified in any`
	`3341`	`+ * SQL standard. For Postgres it is the following (where`
	`3342`	`+ * SR, DR are the result- and display-scales of the returned`
	`3343`	`+ * value, S1, D1, S2 and D2 are the scales of the two arguments,`
	`3344`	`+ * The minimum and maximum scales are compile time options from`
	`3345`	`+ * numeric.h):`
	`3346`	`+ *`
	`3347`	`+ *DR = MIN(MAX(D1 + D2, MIN_DISPLAY_SCALE), MAX_DISPLAY_SCALE)`
	`3348`	`+ *SR = MIN(MAX(MAX(S1 + S2, DR + 4), MIN_RESULT_SCALE), MAX_RESULT_SCALE)`
	`3349`	`+ *`
	`3350`	`+ * By default, any result is computed with a minimum of 34 digits`
	`3351`	`+ * after the decimal point or at least with 4 digits more than`
	`3352`	`+ * displayed.`
	`3353`	`+ * ----------`
	`3354`	`+ */`
	`3355`	`+res_dscale=var1->dscale+var2->dscale;`
	`3356`	`+res_dscale=MAX(res_dscale,NUMERIC_MIN_DISPLAY_SCALE);`
	`3357`	`+res_dscale=MIN(res_dscale,NUMERIC_MAX_DISPLAY_SCALE);`
	`3358`	`+`
	`3359`	`+res_rscale=var1->rscale+var2->rscale;`
	`3360`	`+res_rscale=MAX(res_rscale,res_dscale+4);`
	`3361`	`+res_rscale=MAX(res_rscale,NUMERIC_MIN_RESULT_SCALE);`
	`3362`	`+res_rscale=MIN(res_rscale,NUMERIC_MAX_RESULT_SCALE);`
	`3363`	`+global_rscale=res_rscale;`
	`3364`	`+`
	`3365`	`+returnres_dscale;`
	`3366`	`+}`
	`3367`	`+`
	`3368`	`+`
`3321`	`3369`	`/* ----------`
`3322`	`3370`	`* mod_var() -`
`3323`	`3371`	`*`
`@@ -3343,12 +3391,7 @@ mod_var(NumericVar var1, NumericVar var2, NumericVar *result)`
`3343`	`3391`	`*/`
`3344`	`3392`	`save_global_rscale=global_rscale;`
`3345`	`3393`
`3346`		`-div_dscale=MAX(var1->dscale+var2->dscale,NUMERIC_MIN_DISPLAY_SCALE);`
`3347`		`-div_dscale=MIN(div_dscale,NUMERIC_MAX_DISPLAY_SCALE);`
`3348`		`-global_rscale=MAX(var1->rscale+var2->rscale,`
`3349`		`-NUMERIC_MIN_RESULT_SCALE);`
`3350`		`-global_rscale=MAX(global_rscale,div_dscale+4);`
`3351`		`-global_rscale=MIN(global_rscale,NUMERIC_MAX_RESULT_SCALE);`
	`3394`	`+div_dscale=select_div_scale(var1,var2);`
`3352`	`3395`
`3353`	`3396`	`div_var(var1,var2,&tmp);`
`3354`	`3397`

0 commit comments

Comments

(0)

Movatterモバイル変換

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Commit0700965

File tree

2 files changed

2 files changed

`‎src/backend/utils/adt/float.c`

`‎src/backend/utils/adt/numeric.c`

0 commit comments