Stefan Pohl Computer Chess

private website for chessengine-tests


UHO Top 10 Ratinglist with Stockfish Dev progression 

 

 

The 10 strongest engines of my SPCC Ratinglist and the latest StockfishDev version are playing 1000 games vs. each opponent: 10000 games per engine are played. A RoundRobin Tournament with 55000 games overall !
Results evaluated by ORDO, reference engine is the latest official Stockfish (Stockfish 15.1 right now), its Elo is set to 0. Why? Because using my UHO openings spread Elo-results wider than balanced openings, so it makes no sense to set the reference-Elo to any "realistic" value of 3800 or so... And mention, that all Computer Elo (Celo) in the various ratinglists are fictional in these days of superstrong engines, because the Celos can not be compared with human Elos anymore and since a long time.

 

 

Latest testrun: 2023/01/28: Stockfish 230123 (0 Elo to Stockfish 230114)
Reference point (opponent) is the full latest official SF-release (Stockfish 15.1 right now).

 

Hardware: AMD Ryzen 3900 12-core (24 threads) notebook with 32GB RAM. 20 games are played simultaneously

Speed: Singlethread, TurboBoost-mode switched off, chess starting position: Stockfish 15: 750000 n/s

Hash: 256MB per engine

GUI: Cutechess-cli (GUI ends game, when a 5-piece endgame is on the board)

Tablebases: None for engines, 5 Syzygy for cutechess-cli

Openings: My UHO_2022_6mvs_+120_+129 openings are used (first 500 lines) (part of my UHO 2022 download). 

Ponder, Large Memory Pages & learning: Off

Thinking time: 3min+1sec per game/engine

The version-numbers of the Stockfish engines are the date of the latest patch, which was included in the Stockfish sourcecode, not the release-date of the engine-file, written backwards (year,month,day) (example: 200807 = August, 7, 2020). The used SF compile is the AVX2-compile, which is the fastest on my AMD Ryzen CPU. SF binaries are taken from abrok.eu (except the official SF-release versions, which are taken form the official Stockfish website).

 

ORDO calculation fixed to reference-engine (Elo = 0)

See the individual statistics of engine results here

See the EAS-Ratinglists of the UHO Top10 Ratinglist games here

You can download all played games from my Google-Drive. Download here

     Program                    Elo    +    -  Games    Score   Av.Op. Draws

   1 Stockfish 230123 avx2    :    7    5    5 10000    73.1%   -176   45.9%
   2 Stockfish 15.1 221204    :    0    5    5 10000    72.3%   -175   46.1%
   3 KomodoDragon 3.2 avx2    :  -51    5    5 10000    65.6%   -170   46.4%
   4 Berserk 10 avx2          : -165    5    5 10000    49.4%   -158   49.5%
   5 Koivisto 9 avx2          : -184    5    5 10000    46.6%   -156   49.7%
   6 RubiChess 221120 avx2    : -208    5    5 10000    43.1%   -154   48.4%
   7 Revenge 3.0 avx2         : -210    5    5 10000    42.8%   -154   48.5%
   8 Ethereal 13.75 nnue      : -226    4    4 10000    40.5%   -152   48.5%
   9 Rebel 16.1               : -229    5    5 10000    40.1%   -152   49.3%
  10 Fire 8.NN avx2           : -235    5    5 10000    39.2%   -151   47.3%
  11 Seer 2.6.0 avx2          : -248    5    5 10000    37.4%   -150   47.4%


Games        : 55000 (finished)

White Wins   : 26770 (48.7 %)
Black Wins   : 1875 (3.4 %)
Draws        : 26355 (47.9 %)

 

Here the progress in regression-testing since Stockfish 15.1 (2022/12/04), with Elo of SF 15.1 set to 0 in a diagram:


Below the UHO Top10 gamebase recalculated with my Gamepairs Rescorer Batch-Tool. Realizing Vondele's (Stockfish maintainer) idea: "Thinking uniquely in game pairs makes sense with the biased openings used these days. While pentanomial makes sense it is a bit complicated so we could simplify and score game pairs only (not games) as W-L-D (a traditional  score of 2-0, or 1.5-0.5 is just a W)."

 

   # PLAYER                   :  RATING  ERROR  PLAYED     W     D     L   (%)  CFS(%)
   1 Stockfish 230123 avx2    :      31     17    5000  4308   582   110  92.0     100
   2 Stockfish 15.1 221204    :       0   ----    5000  4205   640   155  90.5     100
   3 KomodoDragon 3.2 avx2    :    -216     17    5000  3472   900   628  78.4     100
   4 Berserk 10 avx2          :    -564     18    5000  1586  1672  1742  48.4     100
   5 Koivisto 9 avx2          :    -610     19    5000  1291  1735  1974  43.2     100
   6 RubiChess 221120 avx2    :    -653     19    5000  1037  1750  2213  38.2     100
   7 Revenge 3.0 avx2         :    -671     18    5000   925  1760  2315  36.1     100
   8 Ethereal 13.75 nnue      :    -697     19    5000   769  1771  2460  33.1      98
   9 Rebel 16.1               :    -709     19    5000   722  1727  2551  31.7      99
  10 Fire 8.NN avx2           :    -721     19    5000   660  1707  2633  30.3     100
  11 Seer 2.6.0 avx2          :    -741     19    5000   599  1608  2793  28.1     ---

 

You can download my Gamepairs Rescorer Tool right here


Below the head to head statistics of the Gamepairs-rescoring, with all WDL-statistics:

Head to head statistics:

 1) Stockfish 230123 avx2   31 :   5000 (+4308,=582,-110),  92.0 %

    vs.                         :  games (    +,   =,   -),   (%) :   Diff,   SD, CFS (%)
    Stockfish 15.1 221204       :    500 (  135, 273,  92),  54.3 :    +31,    9,  100.0
    KomodoDragon 3.2 avx2       :    500 (  314, 169,  17),  79.7 :   +247,    9,  100.0
    Berserk 10 avx2             :    500 (  479,  21,   0),  97.9 :   +596,   10,  100.0
    Koivisto 9 avx2             :    500 (  475,  24,   1),  97.4 :   +642,   10,  100.0
    RubiChess 221120 avx2       :    500 (  481,  19,   0),  98.1 :   +684,   10,  100.0
    Revenge 3.0 avx2            :    500 (  488,  12,   0),  98.8 :   +702,   10,  100.0
    Ethereal 13.75 nnue         :    500 (  484,  16,   0),  98.4 :   +728,   10,  100.0
    Rebel 16.1                  :    500 (  485,  15,   0),  98.5 :   +740,   10,  100.0
    Fire 8.NN avx2              :    500 (  479,  21,   0),  97.9 :   +753,   10,  100.0
    Seer 2.6.0 avx2             :    500 (  488,  12,   0),  98.8 :   +772,   10,  100.0


 2) Stockfish 15.1 221204    0 :   5000 (+4205,=640,-155),  90.5 %

    vs.                         :  games (    +,   =,   -),   (%) :   Diff,   SD, CFS (%)
    Stockfish 230123 avx2       :    500 (   92, 273, 135),  45.7 :    -31,    9,    0.0
    KomodoDragon 3.2 avx2       :    500 (  284, 197,  19),  76.5 :   +216,    9,  100.0
    Berserk 10 avx2             :    500 (  465,  35,   0),  96.5 :   +564,    9,  100.0
    Koivisto 9 avx2             :    500 (  472,  27,   1),  97.1 :   +610,    9,  100.0
    RubiChess 221120 avx2       :    500 (  476,  24,   0),  97.6 :   +653,   10,  100.0
    Revenge 3.0 avx2            :    500 (  484,  16,   0),  98.4 :   +671,    9,  100.0
    Ethereal 13.75 nnue         :    500 (  478,  22,   0),  97.8 :   +697,   10,  100.0
    Rebel 16.1                  :    500 (  485,  15,   0),  98.5 :   +709,   10,  100.0
    Fire 8.NN avx2              :    500 (  481,  19,   0),  98.1 :   +721,   10,  100.0
    Seer 2.6.0 avx2             :    500 (  488,  12,   0),  98.8 :   +741,   10,  100.0


 3) KomodoDragon 3.2 avx2 -216 :   5000 (+3472,=900,-628),  78.4 %

    vs.                         :  games (    +,   =,   -),   (%) :   Diff,   SD, CFS (%)
    Stockfish 230123 avx2       :    500 (   17, 169, 314),  20.3 :   -247,    9,    0.0
    Stockfish 15.1 221204       :    500 (   19, 197, 284),  23.5 :   -216,    9,    0.0
    Berserk 10 avx2             :    500 (  388, 104,   8),  88.0 :   +349,    8,  100.0
    Koivisto 9 avx2             :    500 (  411,  86,   3),  90.8 :   +395,    8,  100.0
    RubiChess 221120 avx2       :    500 (  427,  70,   3),  92.4 :   +437,    8,  100.0
    Revenge 3.0 avx2            :    500 (  432,  65,   3),  92.9 :   +455,    7,  100.0
    Ethereal 13.75 nnue         :    500 (  436,  61,   3),  93.3 :   +481,    8,  100.0
    Rebel 16.1                  :    500 (  448,  48,   4),  94.4 :   +493,    8,  100.0
    Fire 8.NN avx2              :    500 (  448,  49,   3),  94.5 :   +506,    8,  100.0
    Seer 2.6.0 avx2             :    500 (  446,  51,   3),  94.3 :   +525,    8,  100.0


 4) Berserk 10 avx2       -564 :   5000 (+1586,=1672,-1742),  48.4 %

    vs.                         :  games (    +,    =,    -),   (%) :   Diff,   SD, CFS (%)
    Stockfish 230123 avx2       :    500 (    0,   21,  479),   2.1 :   -596,   10,    0.0
    Stockfish 15.1 221204       :    500 (    0,   35,  465),   3.5 :   -564,    9,    0.0
    KomodoDragon 3.2 avx2       :    500 (    8,  104,  388),  12.0 :   -349,    8,    0.0
    Koivisto 9 avx2             :    500 (  168,  248,   84),  58.4 :    +46,    5,  100.0
    RubiChess 221120 avx2       :    500 (  189,  216,   95),  59.4 :    +88,    6,  100.0
    Revenge 3.0 avx2            :    500 (  213,  229,   58),  65.5 :   +106,    5,  100.0
    Ethereal 13.75 nnue         :    500 (  249,  209,   42),  70.7 :   +132,    5,  100.0
    Rebel 16.1                  :    500 (  232,  222,   46),  68.6 :   +144,    6,  100.0
    Fire 8.NN avx2              :    500 (  250,  203,   47),  70.3 :   +157,    6,  100.0
    Seer 2.6.0 avx2             :    500 (  277,  185,   38),  73.9 :   +176,    6,  100.0


 5) Koivisto 9 avx2       -610 :   5000 (+1291,=1735,-1974),  43.2 %

    vs.                         :  games (    +,    =,    -),   (%) :   Diff,   SD, CFS (%)
    Stockfish 230123 avx2       :    500 (    1,   24,  475),   2.6 :   -642,   10,    0.0
    Stockfish 15.1 221204       :    500 (    1,   27,  472),   2.9 :   -610,    9,    0.0
    KomodoDragon 3.2 avx2       :    500 (    3,   86,  411),   9.2 :   -395,    8,    0.0
    Berserk 10 avx2             :    500 (   84,  248,  168),  41.6 :    -46,    5,    0.0
    RubiChess 221120 avx2       :    500 (  160,  237,  103),  55.7 :    +42,    5,  100.0
    Revenge 3.0 avx2            :    500 (  166,  246,   88),  57.8 :    +60,    5,  100.0
    Ethereal 13.75 nnue         :    500 (  181,  242,   77),  60.4 :    +86,    5,  100.0
    Rebel 16.1                  :    500 (  223,  213,   64),  65.9 :    +98,    6,  100.0
    Fire 8.NN avx2              :    500 (  225,  208,   67),  65.8 :   +111,    5,  100.0
    Seer 2.6.0 avx2             :    500 (  247,  204,   49),  69.8 :   +130,    5,  100.0


 6) RubiChess 221120 avx2 -653 :   5000 (+1037,=1750,-2213),  38.2 %

    vs.                         :  games (    +,    =,    -),   (%) :   Diff,   SD, CFS (%)
    Stockfish 230123 avx2       :    500 (    0,   19,  481),   1.9 :   -684,   10,    0.0
    Stockfish 15.1 221204       :    500 (    0,   24,  476),   2.4 :   -653,   10,    0.0
    KomodoDragon 3.2 avx2       :    500 (    3,   70,  427),   7.6 :   -437,    8,    0.0
    Berserk 10 avx2             :    500 (   95,  216,  189),  40.6 :    -88,    6,    0.0
    Koivisto 9 avx2             :    500 (  103,  237,  160),  44.3 :    -42,    5,    0.0
    Revenge 3.0 avx2            :    500 (  137,  247,  116),  52.1 :    +18,    5,  100.0
    Ethereal 13.75 nnue         :    500 (  164,  237,   99),  56.5 :    +44,    6,  100.0
    Rebel 16.1                  :    500 (  167,  236,   97),  57.0 :    +56,    6,  100.0
    Fire 8.NN avx2              :    500 (  170,  246,   84),  58.6 :    +69,    6,  100.0
    Seer 2.6.0 avx2             :    500 (  198,  218,   84),  61.4 :    +88,    6,  100.0


 7) Revenge 3.0 avx2      -671 :   5000 (+925,=1760,-2315),  36.1 %

    vs.                         :  games (   +,    =,    -),   (%) :   Diff,   SD, CFS (%)
    Stockfish 230123 avx2       :    500 (   0,   12,  488),   1.2 :   -702,   10,    0.0
    Stockfish 15.1 221204       :    500 (   0,   16,  484),   1.6 :   -671,    9,    0.0
    KomodoDragon 3.2 avx2       :    500 (   3,   65,  432),   7.1 :   -455,    7,    0.0
    Berserk 10 avx2             :    500 (  58,  229,  213),  34.5 :   -106,    5,    0.0
    Koivisto 9 avx2             :    500 (  88,  246,  166),  42.2 :    -60,    5,    0.0
    RubiChess 221120 avx2       :    500 ( 116,  247,  137),  47.9 :    -18,    5,    0.0
    Ethereal 13.75 nnue         :    500 ( 143,  252,  105),  53.8 :    +26,    5,  100.0
    Rebel 16.1                  :    500 ( 154,  254,   92),  56.2 :    +38,    6,  100.0
    Fire 8.NN avx2              :    500 ( 175,  233,   92),  58.3 :    +50,    5,  100.0
    Seer 2.6.0 avx2             :    500 ( 188,  206,  106),  58.2 :    +70,    6,  100.0


 8) Ethereal 13.75 nnue   -697 :   5000 (+769,=1771,-2460),  33.1 %

    vs.                         :  games (   +,    =,    -),   (%) :   Diff,   SD, CFS (%)
    Stockfish 230123 avx2       :    500 (   0,   16,  484),   1.6 :   -728,   10,    0.0
    Stockfish 15.1 221204       :    500 (   0,   22,  478),   2.2 :   -697,   10,    0.0
    KomodoDragon 3.2 avx2       :    500 (   3,   61,  436),   6.7 :   -481,    8,    0.0
    Berserk 10 avx2             :    500 (  42,  209,  249),  29.3 :   -132,    5,    0.0
    Koivisto 9 avx2             :    500 (  77,  242,  181),  39.6 :    -86,    5,    0.0
    RubiChess 221120 avx2       :    500 (  99,  237,  164),  43.5 :    -44,    6,    0.0
    Revenge 3.0 avx2            :    500 ( 105,  252,  143),  46.2 :    -26,    5,    0.0
    Rebel 16.1                  :    500 ( 121,  233,  146),  47.5 :    +12,    6,   98.4
    Fire 8.NN avx2              :    500 ( 152,  252,   96),  55.6 :    +25,    5,  100.0
    Seer 2.6.0 avx2             :    500 ( 170,  247,   83),  58.7 :    +44,    6,  100.0


 9) Rebel 16.1            -709 :   5000 (+722,=1727,-2551),  31.7 %

    vs.                         :  games (   +,    =,    -),   (%) :   Diff,   SD, CFS (%)
    Stockfish 230123 avx2       :    500 (   0,   15,  485),   1.5 :   -740,   10,    0.0
    Stockfish 15.1 221204       :    500 (   0,   15,  485),   1.5 :   -709,   10,    0.0
    KomodoDragon 3.2 avx2       :    500 (   4,   48,  448),   5.6 :   -493,    8,    0.0
    Berserk 10 avx2             :    500 (  46,  222,  232),  31.4 :   -144,    6,    0.0
    Koivisto 9 avx2             :    500 (  64,  213,  223),  34.1 :    -98,    6,    0.0
    RubiChess 221120 avx2       :    500 (  97,  236,  167),  43.0 :    -56,    6,    0.0
    Revenge 3.0 avx2            :    500 (  92,  254,  154),  43.8 :    -38,    6,    0.0
    Ethereal 13.75 nnue         :    500 ( 146,  233,  121),  52.5 :    -12,    6,    1.6
    Fire 8.NN avx2              :    500 ( 129,  247,  124),  50.5 :    +13,    6,   98.9
    Seer 2.6.0 avx2             :    500 ( 144,  244,  112),  53.2 :    +32,    6,  100.0


10) Fire 8.NN avx2        -721 :   5000 (+660,=1707,-2633),  30.3 %

    vs.                         :  games (   +,    =,    -),   (%) :   Diff,   SD, CFS (%)
    Stockfish 230123 avx2       :    500 (   0,   21,  479),   2.1 :   -753,   10,    0.0
    Stockfish 15.1 221204       :    500 (   0,   19,  481),   1.9 :   -721,   10,    0.0
    KomodoDragon 3.2 avx2       :    500 (   3,   49,  448),   5.5 :   -506,    8,    0.0
    Berserk 10 avx2             :    500 (  47,  203,  250),  29.7 :   -157,    6,    0.0
    Koivisto 9 avx2             :    500 (  67,  208,  225),  34.2 :   -111,    5,    0.0
    RubiChess 221120 avx2       :    500 (  84,  246,  170),  41.4 :    -69,    6,    0.0
    Revenge 3.0 avx2            :    500 (  92,  233,  175),  41.7 :    -50,    5,    0.0
    Ethereal 13.75 nnue         :    500 (  96,  252,  152),  44.4 :    -25,    5,    0.0
    Rebel 16.1                  :    500 ( 124,  247,  129),  49.5 :    -13,    6,    1.1
    Seer 2.6.0 avx2             :    500 ( 147,  229,  124),  52.3 :    +20,    5,  100.0


11) Seer 2.6.0 avx2       -741 :   5000 (+599,=1608,-2793),  28.1 %

    vs.                         :  games (   +,    =,    -),   (%) :   Diff,   SD, CFS (%)
    Stockfish 230123 avx2       :    500 (   0,   12,  488),   1.2 :   -772,   10,    0.0
    Stockfish 15.1 221204       :    500 (   0,   12,  488),   1.2 :   -741,   10,    0.0
    KomodoDragon 3.2 avx2       :    500 (   3,   51,  446),   5.7 :   -525,    8,    0.0
    Berserk 10 avx2             :    500 (  38,  185,  277),  26.1 :   -176,    6,    0.0
    Koivisto 9 avx2             :    500 (  49,  204,  247),  30.2 :   -130,    5,    0.0
    RubiChess 221120 avx2       :    500 (  84,  218,  198),  38.6 :    -88,    6,    0.0
    Revenge 3.0 avx2            :    500 ( 106,  206,  188),  41.8 :    -70,    6,    0.0
    Ethereal 13.75 nnue         :    500 (  83,  247,  170),  41.3 :    -44,    6,    0.0
    Rebel 16.1                  :    500 ( 112,  244,  144),  46.8 :    -32,    6,    0.0
    Fire 8.NN avx2              :    500 ( 124,  229,  147),  47.7 :    -20,    5,    0.0