{
 "cells": [
  {
   "cell_type": "markdown",
   "id": "9eb97885",
   "metadata": {},
   "source": [
    "# Leaderboard"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "id": "e07fb041",
   "metadata": {
    "tags": [
     "hide-input"
    ]
   },
   "outputs": [
    {
     "data": {
      "text/html": [
       "<style type=\"text/css\">\n",
       "#T_5cb70_ td {\n",
       "  font-style: italic;\n",
       "  color: black;\n",
       "  font-weight: normal;\n",
       "}\n",
       "#T_5cb70_ caption {\n",
       "  caption-side: bottom;\n",
       "}\n",
       "#T_5cb70_ td:hover {\n",
       "  background-color: #ffffb3;\n",
       "  font-size: 130%;\n",
       "  font-weight: bold;\n",
       "}\n",
       "#T_5cb70_ .index_name {\n",
       "  font-style: normal;\n",
       "  color: black;\n",
       "  font-weight: bold;\n",
       "  width: 300px;\n",
       "  font-size: 12px;\n",
       "}\n",
       "#T_5cb70_ th {\n",
       "  background-color: white;\n",
       "  color: black;\n",
       "  width: 75px;\n",
       "  font-weight: bold;\n",
       "  font-size: 11px;\n",
       "}\n",
       "</style>\n",
       "<table id=\"T_5cb70_\" style=\"font-size: 14px\">\n",
       "  <caption>*WER(p): WER for slue-voxpopuli, WER(c): WER for slue-voxceleb</caption>\n",
       "  <thead>\n",
       "    <tr>\n",
       "      <th class=\"blank level0\" >&nbsp;</th>\n",
       "      <th class=\"col_heading level0 col0\" >Ranking</th>\n",
       "      <th class=\"col_heading level0 col1\" >System type</th>\n",
       "      <th class=\"col_heading level0 col2\" >SLUE-score</th>\n",
       "      <th class=\"col_heading level0 col3\" >WER(p)</th>\n",
       "      <th class=\"col_heading level0 col4\" >WER(c)</th>\n",
       "      <th class=\"col_heading level0 col5\" >NER f-1</th>\n",
       "      <th class=\"col_heading level0 col6\" >SA f-1</th>\n",
       "      <th class=\"col_heading level0 col7\" >ref</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th class=\"index_name level0\" >Submission</th>\n",
       "      <th class=\"blank col0\" >&nbsp;</th>\n",
       "      <th class=\"blank col1\" >&nbsp;</th>\n",
       "      <th class=\"blank col2\" >&nbsp;</th>\n",
       "      <th class=\"blank col3\" >&nbsp;</th>\n",
       "      <th class=\"blank col4\" >&nbsp;</th>\n",
       "      <th class=\"blank col5\" >&nbsp;</th>\n",
       "      <th class=\"blank col6\" >&nbsp;</th>\n",
       "      <th class=\"blank col7\" >&nbsp;</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th id=\"T_5cb70_level0_row0\" class=\"row_heading level0 row0\" >DEBERTA-L</th>\n",
       "      <td id=\"T_5cb70_row0_col0\" class=\"data row0 col0\" >1</td>\n",
       "      <td id=\"T_5cb70_row0_col1\" class=\"data row0 col1\" >NLP-topline</td>\n",
       "      <td id=\"T_5cb70_row0_col2\" class=\"data row0 col2\" >82.7</td>\n",
       "      <td id=\"T_5cb70_row0_col3\" class=\"data row0 col3\" >0.0</td>\n",
       "      <td id=\"T_5cb70_row0_col4\" class=\"data row0 col4\" >0.0</td>\n",
       "      <td id=\"T_5cb70_row0_col5\" class=\"data row0 col5\" >81.4</td>\n",
       "      <td id=\"T_5cb70_row0_col6\" class=\"data row0 col6\" >66.8</td>\n",
       "      <td id=\"T_5cb70_row0_col7\" class=\"data row0 col7\" ><a target=\"_blank\" href=\"https://arxiv.org/abs/2111.10367\">link</a></td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5cb70_level0_row1\" class=\"row_heading level0 row1\" >DEBERTA-B</th>\n",
       "      <td id=\"T_5cb70_row1_col0\" class=\"data row1 col0\" >2</td>\n",
       "      <td id=\"T_5cb70_row1_col1\" class=\"data row1 col1\" >NLP-topline</td>\n",
       "      <td id=\"T_5cb70_row1_col2\" class=\"data row1 col2\" >82.3</td>\n",
       "      <td id=\"T_5cb70_row1_col3\" class=\"data row1 col3\" >0.0</td>\n",
       "      <td id=\"T_5cb70_row1_col4\" class=\"data row1 col4\" >0.0</td>\n",
       "      <td id=\"T_5cb70_row1_col5\" class=\"data row1 col5\" >81.4</td>\n",
       "      <td id=\"T_5cb70_row1_col6\" class=\"data row1 col6\" >65.5</td>\n",
       "      <td id=\"T_5cb70_row1_col7\" class=\"data row1 col7\" ><a target=\"_blank\" href=\"https://arxiv.org/abs/2111.10367\">link</a></td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5cb70_level0_row2\" class=\"row_heading level0 row2\" >BERT-B</th>\n",
       "      <td id=\"T_5cb70_row2_col0\" class=\"data row2 col0\" >3</td>\n",
       "      <td id=\"T_5cb70_row2_col1\" class=\"data row2 col1\" >NLP-topline</td>\n",
       "      <td id=\"T_5cb70_row2_col2\" class=\"data row2 col2\" >81.5</td>\n",
       "      <td id=\"T_5cb70_row2_col3\" class=\"data row2 col3\" >0.0</td>\n",
       "      <td id=\"T_5cb70_row2_col4\" class=\"data row2 col4\" >0.0</td>\n",
       "      <td id=\"T_5cb70_row2_col5\" class=\"data row2 col5\" >81.2</td>\n",
       "      <td id=\"T_5cb70_row2_col6\" class=\"data row2 col6\" >63.3</td>\n",
       "      <td id=\"T_5cb70_row2_col7\" class=\"data row2 col7\" ><a target=\"_blank\" href=\"https://arxiv.org/abs/2111.10367\">link</a></td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5cb70_level0_row3\" class=\"row_heading level0 row3\" >W2V2-L-LL60K+LM_DEBERTA-L</th>\n",
       "      <td id=\"T_5cb70_row3_col0\" class=\"data row3 col0\" >4</td>\n",
       "      <td id=\"T_5cb70_row3_col1\" class=\"data row3 col1\" >pipeline</td>\n",
       "      <td id=\"T_5cb70_row3_col2\" class=\"data row3 col2\" >75.7</td>\n",
       "      <td id=\"T_5cb70_row3_col3\" class=\"data row3 col3\" >9.3</td>\n",
       "      <td id=\"T_5cb70_row3_col4\" class=\"data row3 col4\" >11.1</td>\n",
       "      <td id=\"T_5cb70_row3_col5\" class=\"data row3 col5\" >71.8</td>\n",
       "      <td id=\"T_5cb70_row3_col6\" class=\"data row3 col6\" >65.5</td>\n",
       "      <td id=\"T_5cb70_row3_col7\" class=\"data row3 col7\" ><a target=\"_blank\" href=\"https://arxiv.org/abs/2111.10367\">link</a></td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5cb70_level0_row4\" class=\"row_heading level0 row4\" >W2V2-B-LS960+LM_DEBERTA-L</th>\n",
       "      <td id=\"T_5cb70_row4_col0\" class=\"data row4 col0\" >5</td>\n",
       "      <td id=\"T_5cb70_row4_col1\" class=\"data row4 col1\" >pipeline</td>\n",
       "      <td id=\"T_5cb70_row4_col2\" class=\"data row4 col2\" >73.5</td>\n",
       "      <td id=\"T_5cb70_row4_col3\" class=\"data row4 col3\" >12.3</td>\n",
       "      <td id=\"T_5cb70_row4_col4\" class=\"data row4 col4\" >16.1</td>\n",
       "      <td id=\"T_5cb70_row4_col5\" class=\"data row4 col5\" >69.2</td>\n",
       "      <td id=\"T_5cb70_row4_col6\" class=\"data row4 col6\" >65.4</td>\n",
       "      <td id=\"T_5cb70_row4_col7\" class=\"data row4 col7\" ><a target=\"_blank\" href=\"https://arxiv.org/abs/2111.10367\">link</a></td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5cb70_level0_row5\" class=\"row_heading level0 row5\" >W2V2-B-LS960+LM_DEBERTA-B</th>\n",
       "      <td id=\"T_5cb70_row5_col0\" class=\"data row5 col0\" >6</td>\n",
       "      <td id=\"T_5cb70_row5_col1\" class=\"data row5 col1\" >pipeline</td>\n",
       "      <td id=\"T_5cb70_row5_col2\" class=\"data row5 col2\" >72.6</td>\n",
       "      <td id=\"T_5cb70_row5_col3\" class=\"data row5 col3\" >12.3</td>\n",
       "      <td id=\"T_5cb70_row5_col4\" class=\"data row5 col4\" >16.1</td>\n",
       "      <td id=\"T_5cb70_row5_col5\" class=\"data row5 col5\" >68.5</td>\n",
       "      <td id=\"T_5cb70_row5_col6\" class=\"data row5 col6\" >63.6</td>\n",
       "      <td id=\"T_5cb70_row5_col7\" class=\"data row5 col7\" ><a target=\"_blank\" href=\"https://arxiv.org/abs/2111.10367\">link</a></td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5cb70_level0_row6\" class=\"row_heading level0 row6\" >W2V2-B-LS960+LM_BERT-B</th>\n",
       "      <td id=\"T_5cb70_row6_col0\" class=\"data row6 col0\" >7</td>\n",
       "      <td id=\"T_5cb70_row6_col1\" class=\"data row6 col1\" >pipeline</td>\n",
       "      <td id=\"T_5cb70_row6_col2\" class=\"data row6 col2\" >71.6</td>\n",
       "      <td id=\"T_5cb70_row6_col3\" class=\"data row6 col3\" >12.3</td>\n",
       "      <td id=\"T_5cb70_row6_col4\" class=\"data row6 col4\" >16.1</td>\n",
       "      <td id=\"T_5cb70_row6_col5\" class=\"data row6 col5\" >68.6</td>\n",
       "      <td id=\"T_5cb70_row6_col6\" class=\"data row6 col6\" >60.5</td>\n",
       "      <td id=\"T_5cb70_row6_col7\" class=\"data row6 col7\" ><a target=\"_blank\" href=\"https://arxiv.org/abs/2111.10367\">link</a></td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5cb70_level0_row7\" class=\"row_heading level0 row7\" >W2V2-L-LL60K_DEBERTA-L</th>\n",
       "      <td id=\"T_5cb70_row7_col0\" class=\"data row7 col0\" >8</td>\n",
       "      <td id=\"T_5cb70_row7_col1\" class=\"data row7 col1\" >pipeline</td>\n",
       "      <td id=\"T_5cb70_row7_col2\" class=\"data row7 col2\" >70.8</td>\n",
       "      <td id=\"T_5cb70_row7_col3\" class=\"data row7 col3\" >12.1</td>\n",
       "      <td id=\"T_5cb70_row7_col4\" class=\"data row7 col4\" >13.8</td>\n",
       "      <td id=\"T_5cb70_row7_col5\" class=\"data row7 col5\" >59.7</td>\n",
       "      <td id=\"T_5cb70_row7_col6\" class=\"data row7 col6\" >65.7</td>\n",
       "      <td id=\"T_5cb70_row7_col7\" class=\"data row7 col7\" ><a target=\"_blank\" href=\"https://arxiv.org/abs/2111.10367\">link</a></td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5cb70_level0_row8\" class=\"row_heading level0 row8\" >W2V2-L-LL60K+LM</th>\n",
       "      <td id=\"T_5cb70_row8_col0\" class=\"data row8 col0\" >9</td>\n",
       "      <td id=\"T_5cb70_row8_col1\" class=\"data row8 col1\" >e2e</td>\n",
       "      <td id=\"T_5cb70_row8_col2\" class=\"data row8 col2\" >68.2</td>\n",
       "      <td id=\"T_5cb70_row8_col3\" class=\"data row8 col3\" >9.3</td>\n",
       "      <td id=\"T_5cb70_row8_col4\" class=\"data row8 col4\" >11.1</td>\n",
       "      <td id=\"T_5cb70_row8_col5\" class=\"data row8 col5\" >64.8</td>\n",
       "      <td id=\"T_5cb70_row8_col6\" class=\"data row8 col6\" >50.1</td>\n",
       "      <td id=\"T_5cb70_row8_col7\" class=\"data row8 col7\" ><a target=\"_blank\" href=\"https://arxiv.org/abs/2111.10367\">link</a></td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5cb70_level0_row9\" class=\"row_heading level0 row9\" >W2V2-B-LS960+LM</th>\n",
       "      <td id=\"T_5cb70_row9_col0\" class=\"data row9 col0\" >10</td>\n",
       "      <td id=\"T_5cb70_row9_col1\" class=\"data row9 col1\" >e2e</td>\n",
       "      <td id=\"T_5cb70_row9_col2\" class=\"data row9 col2\" >65.9</td>\n",
       "      <td id=\"T_5cb70_row9_col3\" class=\"data row9 col3\" >12.3</td>\n",
       "      <td id=\"T_5cb70_row9_col4\" class=\"data row9 col4\" >16.1</td>\n",
       "      <td id=\"T_5cb70_row9_col5\" class=\"data row9 col5\" >63.4</td>\n",
       "      <td id=\"T_5cb70_row9_col6\" class=\"data row9 col6\" >48.6</td>\n",
       "      <td id=\"T_5cb70_row9_col7\" class=\"data row9 col7\" ><a target=\"_blank\" href=\"https://arxiv.org/abs/2111.10367\">link</a></td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5cb70_level0_row10\" class=\"row_heading level0 row10\" >HUBERT-B-LS960+LM</th>\n",
       "      <td id=\"T_5cb70_row10_col0\" class=\"data row10 col0\" >11</td>\n",
       "      <td id=\"T_5cb70_row10_col1\" class=\"data row10 col1\" >e2e</td>\n",
       "      <td id=\"T_5cb70_row10_col2\" class=\"data row10 col2\" >64.9</td>\n",
       "      <td id=\"T_5cb70_row10_col3\" class=\"data row10 col3\" >16.8</td>\n",
       "      <td id=\"T_5cb70_row10_col4\" class=\"data row10 col4\" >16.9</td>\n",
       "      <td id=\"T_5cb70_row10_col5\" class=\"data row10 col5\" >61.9</td>\n",
       "      <td id=\"T_5cb70_row10_col6\" class=\"data row10 col6\" >49.4</td>\n",
       "      <td id=\"T_5cb70_row10_col7\" class=\"data row10 col7\" ><a target=\"_blank\" href=\"https://arxiv.org/abs/2111.10367\">link</a></td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5cb70_level0_row11\" class=\"row_heading level0 row11\" >W2V2-B-LS960_DEBERTA-L</th>\n",
       "      <td id=\"T_5cb70_row11_col0\" class=\"data row11 col0\" >12</td>\n",
       "      <td id=\"T_5cb70_row11_col1\" class=\"data row11 col1\" >pipeline</td>\n",
       "      <td id=\"T_5cb70_row11_col2\" class=\"data row11 col2\" >64.5</td>\n",
       "      <td id=\"T_5cb70_row11_col3\" class=\"data row11 col3\" >18.4</td>\n",
       "      <td id=\"T_5cb70_row11_col4\" class=\"data row11 col4\" >20.9</td>\n",
       "      <td id=\"T_5cb70_row11_col5\" class=\"data row11 col5\" >49.5</td>\n",
       "      <td id=\"T_5cb70_row11_col6\" class=\"data row11 col6\" >63.6</td>\n",
       "      <td id=\"T_5cb70_row11_col7\" class=\"data row11 col7\" ><a target=\"_blank\" href=\"https://arxiv.org/abs/2111.10367\">link</a></td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5cb70_level0_row12\" class=\"row_heading level0 row12\" >W2V2-B-LS960_DEBERTA-B</th>\n",
       "      <td id=\"T_5cb70_row12_col0\" class=\"data row12 col0\" >13</td>\n",
       "      <td id=\"T_5cb70_row12_col1\" class=\"data row12 col1\" >pipeline</td>\n",
       "      <td id=\"T_5cb70_row12_col2\" class=\"data row12 col2\" >63.0</td>\n",
       "      <td id=\"T_5cb70_row12_col3\" class=\"data row12 col3\" >18.4</td>\n",
       "      <td id=\"T_5cb70_row12_col4\" class=\"data row12 col4\" >20.9</td>\n",
       "      <td id=\"T_5cb70_row12_col5\" class=\"data row12 col5\" >46.4</td>\n",
       "      <td id=\"T_5cb70_row12_col6\" class=\"data row12 col6\" >62.1</td>\n",
       "      <td id=\"T_5cb70_row12_col7\" class=\"data row12 col7\" ><a target=\"_blank\" href=\"https://arxiv.org/abs/2111.10367\">link</a></td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5cb70_level0_row13\" class=\"row_heading level0 row13\" >W2V2-B-LS960_BERT-B</th>\n",
       "      <td id=\"T_5cb70_row13_col0\" class=\"data row13 col0\" >14</td>\n",
       "      <td id=\"T_5cb70_row13_col1\" class=\"data row13 col1\" >pipeline</td>\n",
       "      <td id=\"T_5cb70_row13_col2\" class=\"data row13 col2\" >62.6</td>\n",
       "      <td id=\"T_5cb70_row13_col3\" class=\"data row13 col3\" >18.4</td>\n",
       "      <td id=\"T_5cb70_row13_col4\" class=\"data row13 col4\" >20.9</td>\n",
       "      <td id=\"T_5cb70_row13_col5\" class=\"data row13 col5\" >47.4</td>\n",
       "      <td id=\"T_5cb70_row13_col6\" class=\"data row13 col6\" >60.1</td>\n",
       "      <td id=\"T_5cb70_row13_col7\" class=\"data row13 col7\" ><a target=\"_blank\" href=\"https://arxiv.org/abs/2111.10367\">link</a></td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5cb70_level0_row14\" class=\"row_heading level0 row14\" >W2V2-L-LL60K</th>\n",
       "      <td id=\"T_5cb70_row14_col0\" class=\"data row14 col0\" >15</td>\n",
       "      <td id=\"T_5cb70_row14_col1\" class=\"data row14 col1\" >e2e</td>\n",
       "      <td id=\"T_5cb70_row14_col2\" class=\"data row14 col2\" >62.5</td>\n",
       "      <td id=\"T_5cb70_row14_col3\" class=\"data row14 col3\" >12.1</td>\n",
       "      <td id=\"T_5cb70_row14_col4\" class=\"data row14 col4\" >13.8</td>\n",
       "      <td id=\"T_5cb70_row14_col5\" class=\"data row14 col5\" >50.5</td>\n",
       "      <td id=\"T_5cb70_row14_col6\" class=\"data row14 col6\" >50.1</td>\n",
       "      <td id=\"T_5cb70_row14_col7\" class=\"data row14 col7\" ><a target=\"_blank\" href=\"https://arxiv.org/abs/2111.10367\">link</a></td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5cb70_level0_row15\" class=\"row_heading level0 row15\" >W2V2-B-VP100K+LM</th>\n",
       "      <td id=\"T_5cb70_row15_col0\" class=\"data row15 col0\" >16</td>\n",
       "      <td id=\"T_5cb70_row15_col1\" class=\"data row15 col1\" >e2e</td>\n",
       "      <td id=\"T_5cb70_row15_col2\" class=\"data row15 col2\" >60.2</td>\n",
       "      <td id=\"T_5cb70_row15_col3\" class=\"data row15 col3\" >17.3</td>\n",
       "      <td id=\"T_5cb70_row15_col4\" class=\"data row15 col4\" >23.0</td>\n",
       "      <td id=\"T_5cb70_row15_col5\" class=\"data row15 col5\" >61.8</td>\n",
       "      <td id=\"T_5cb70_row15_col6\" class=\"data row15 col6\" >38.9</td>\n",
       "      <td id=\"T_5cb70_row15_col7\" class=\"data row15 col7\" ><a target=\"_blank\" href=\"https://arxiv.org/abs/2111.10367\">link</a></td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5cb70_level0_row16\" class=\"row_heading level0 row16\" >W2V2-B-LS960</th>\n",
       "      <td id=\"T_5cb70_row16_col0\" class=\"data row16 col0\" >17</td>\n",
       "      <td id=\"T_5cb70_row16_col1\" class=\"data row16 col1\" >e2e</td>\n",
       "      <td id=\"T_5cb70_row16_col2\" class=\"data row16 col2\" >59.5</td>\n",
       "      <td id=\"T_5cb70_row16_col3\" class=\"data row16 col3\" >18.4</td>\n",
       "      <td id=\"T_5cb70_row16_col4\" class=\"data row16 col4\" >20.9</td>\n",
       "      <td id=\"T_5cb70_row16_col5\" class=\"data row16 col5\" >49.6</td>\n",
       "      <td id=\"T_5cb70_row16_col6\" class=\"data row16 col6\" >48.6</td>\n",
       "      <td id=\"T_5cb70_row16_col7\" class=\"data row16 col7\" ><a target=\"_blank\" href=\"https://arxiv.org/abs/2111.10367\">link</a></td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5cb70_level0_row17\" class=\"row_heading level0 row17\" >HUBERT-B-LS960</th>\n",
       "      <td id=\"T_5cb70_row17_col0\" class=\"data row17 col0\" >18</td>\n",
       "      <td id=\"T_5cb70_row17_col1\" class=\"data row17 col1\" >e2e</td>\n",
       "      <td id=\"T_5cb70_row17_col2\" class=\"data row17 col2\" >59.5</td>\n",
       "      <td id=\"T_5cb70_row17_col3\" class=\"data row17 col3\" >19.6</td>\n",
       "      <td id=\"T_5cb70_row17_col4\" class=\"data row17 col4\" >21.7</td>\n",
       "      <td id=\"T_5cb70_row17_col5\" class=\"data row17 col5\" >49.8</td>\n",
       "      <td id=\"T_5cb70_row17_col6\" class=\"data row17 col6\" >49.4</td>\n",
       "      <td id=\"T_5cb70_row17_col7\" class=\"data row17 col7\" ><a target=\"_blank\" href=\"https://arxiv.org/abs/2111.10367\">link</a></td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5cb70_level0_row18\" class=\"row_heading level0 row18\" >W2V2-B-VP100K</th>\n",
       "      <td id=\"T_5cb70_row18_col0\" class=\"data row18 col0\" >19</td>\n",
       "      <td id=\"T_5cb70_row18_col1\" class=\"data row18 col1\" >e2e</td>\n",
       "      <td id=\"T_5cb70_row18_col2\" class=\"data row18 col2\" >52.8</td>\n",
       "      <td id=\"T_5cb70_row18_col3\" class=\"data row18 col3\" >22.8</td>\n",
       "      <td id=\"T_5cb70_row18_col4\" class=\"data row18 col4\" >33.7</td>\n",
       "      <td id=\"T_5cb70_row18_col5\" class=\"data row18 col5\" >47.9</td>\n",
       "      <td id=\"T_5cb70_row18_col6\" class=\"data row18 col6\" >38.9</td>\n",
       "      <td id=\"T_5cb70_row18_col7\" class=\"data row18 col7\" ><a target=\"_blank\" href=\"https://arxiv.org/abs/2111.10367\">link</a></td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n"
      ],
      "text/plain": [
       "<IPython.core.display.HTML object>"
      ]
     },
     "execution_count": 3,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "import editdistance, argparse\n",
    "import pandas as pd\n",
    "import numpy as np\n",
    "from sklearn.metrics import f1_score, precision_score, recall_score\n",
    "from slue_toolkit.eval import eval_utils\n",
    "from slue_toolkit.eval.eval_w2v_ner import make_distinct\n",
    "eval_utils.get_stats = eval_utils.get_ner_stats #quickpatch\n",
    "from IPython.display import HTML\n",
    "\n",
    "def get_asr_wer(gold_df,submission_df):\n",
    "    assert len(gold_df)==len(submission_df), \"tsv length mismatch\"\n",
    "    errs_t = 0\n",
    "    lengths_t = 0\n",
    "\n",
    "    for tgt_words,hyp_words in zip(gold_df.pred_text.to_list(), submission_df.pred_text.to_list()):\n",
    "        tgt_words = tgt_words.split()\n",
    "        if pd.isna(hyp_words):\n",
    "            hyp_words = []\n",
    "        else:\n",
    "            hyp_words = hyp_words.split()\n",
    "        errs = editdistance.eval(hyp_words, tgt_words)\n",
    "        length = len(tgt_words)\n",
    "        errs_t += errs\n",
    "        lengths_t += length\n",
    "\n",
    "    wer = errs_t * 100.0 / lengths_t\n",
    "    return wer\n",
    "\n",
    "def get_sentiment_f1(gold_df,submission_df):\n",
    "    \n",
    "    gt = gold_df.pred_sentiment.to_list()\n",
    "    pred = submission_df.pred_sentiment.to_list()\n",
    "    macro_f1 = f1_score(gt, pred, average=\"macro\") * 100\n",
    "    \n",
    "    return macro_f1\n",
    "\n",
    "def get_ner_distinct_label_lst(submission_df,gold_df):\n",
    "    gold_distinct_label_lst = []\n",
    "    for label in submission_df[gold_df.set_name==\"slue-voxpopuli\"].pred_ner.to_list():\n",
    "        label_lst = []\n",
    "        if eval(label):\n",
    "            for lab in eval(label):\n",
    "                label_lst.append(tuple(lab))\n",
    "            gold_distinct_label_lst.append(make_distinct(label_lst))\n",
    "        else:\n",
    "            gold_distinct_label_lst.append([])\n",
    "    return gold_distinct_label_lst\n",
    "\n",
    "def get_slue_score(submission_file,gt_file = \"submissions_rebalanced/gold.tsv\",submission_name=None):\n",
    "    \n",
    "    leaderboard_score = {}\n",
    "    gold = pd.read_csv(gt_file,sep=\"\\t\")\n",
    "    submission = pd.read_csv(f\"{submission_file}\",sep=\"\\t\")\n",
    "    \n",
    "    #sort submission based on utterance id\n",
    "    new_order = []\n",
    "    for utterance_id in gold.id:\n",
    "        assert utterance_id in submission.id.to_list(),f\"missing id = {utterance_id}\"\n",
    "        index = submission.index[submission.id == utterance_id]\n",
    "        assert len(index)==1, f\"too many entities for id = {utterance_id}\"\n",
    "        new_order.append(index[0])\n",
    "    submission = submission.loc[new_order]\n",
    "    submission = submission.reset_index()\n",
    "    submission.pop('index')\n",
    "\n",
    "    #WER-Voxpopuli\n",
    "    leaderboard_score['wer_voxpopuli'] = get_asr_wer(gold[gold.set_name==\"slue-voxpopuli\"],submission[gold.set_name==\"slue-voxpopuli\"])\n",
    "    \n",
    "    #WER-Voxceleb\n",
    "    leaderboard_score['wer_voxceleb'] = get_asr_wer(gold[gold.set_name==\"slue-voxceleb\"],submission[gold.set_name==\"slue-voxceleb\"])\n",
    "\n",
    "    # sentiment analysis f1 score\n",
    "    leaderboard_score['sentiment_macro_f1'] = get_sentiment_f1(gold[gold.set_name==\"slue-voxceleb\"],submission[gold.set_name==\"slue-voxceleb\"])\n",
    "    \n",
    "    # NER f1 score\n",
    "    gold_distinct_label_lst = get_ner_distinct_label_lst(gold,gold)\n",
    "    submission_distinct_label_lst = get_ner_distinct_label_lst(submission,gold)\n",
    "    ner_result = eval_utils.get_ner_scores(gold_distinct_label_lst,submission_distinct_label_lst)\n",
    "    leaderboard_score['ner_micro_f1'] = ner_result['overall_micro']['fscore']*100\n",
    "    \n",
    "    # SLUE-score\n",
    "    leaderboard_score['slue_score'] = ((100 - (leaderboard_score['wer_voxpopuli']+leaderboard_score['wer_voxceleb'])/2)\\\n",
    "                                       + leaderboard_score['sentiment_macro_f1']\\\n",
    "                                       + leaderboard_score['ner_micro_f1'])/3.0\n",
    "    \n",
    "    return leaderboard_score\n",
    "\n",
    "submissions = {\n",
    "#     \"arxiv_indomain_w2v2-base-ls960\": \"https://arxiv.org/abs/2111.10367\",\n",
    "#     \"arxiv_indomain_w2v2-large-ll60k\": \"https://arxiv.org/abs/2111.10367\",    \n",
    "    \"NLP-topline_bert-b\": \"https://arxiv.org/abs/2111.10367\",\n",
    "    \"NLP-topline_deberta-b\": \"https://arxiv.org/abs/2111.10367\",\n",
    "    \"NLP-topline_deberta-l\": \"https://arxiv.org/abs/2111.10367\",\n",
    "    \"pipeline_w2v2-b-ls960_bert-b\": \"https://arxiv.org/abs/2111.10367\",\n",
    "    \"pipeline_w2v2-b-ls960_deberta-b\": \"https://arxiv.org/abs/2111.10367\",\n",
    "    \"pipeline_w2v2-b-ls960_deberta-l\": \"https://arxiv.org/abs/2111.10367\",\n",
    "    \"pipeline_w2v2-l-ll60k_deberta-l\": \"https://arxiv.org/abs/2111.10367\",\n",
    "    \"pipeline_w2v2-b-ls960+lm_bert-b\": \"https://arxiv.org/abs/2111.10367\",\n",
    "    \"pipeline_w2v2-b-ls960+lm_deberta-b\": \"https://arxiv.org/abs/2111.10367\",\n",
    "    \"pipeline_w2v2-b-ls960+lm_deberta-l\": \"https://arxiv.org/abs/2111.10367\",\n",
    "    \"pipeline_w2v2-l-ll60k+lm_deberta-l\": \"https://arxiv.org/abs/2111.10367\",\n",
    "    \"e2e_w2v2-b-ls960\": \"https://arxiv.org/abs/2111.10367\",\n",
    "    \"e2e_w2v2-b-vp100k\": \"https://arxiv.org/abs/2111.10367\",\n",
    "    \"e2e_hubert-b-ls960\": \"https://arxiv.org/abs/2111.10367\",\n",
    "    \"e2e_w2v2-l-ll60k\": \"https://arxiv.org/abs/2111.10367\",\n",
    "    \"e2e_w2v2-b-ls960+lm\": \"https://arxiv.org/abs/2111.10367\",\n",
    "    \"e2e_w2v2-b-vp100k+lm\": \"https://arxiv.org/abs/2111.10367\",\n",
    "    \"e2e_hubert-b-ls960+lm\": \"https://arxiv.org/abs/2111.10367\",\n",
    "    \"e2e_w2v2-l-ll60k+lm\": \"https://arxiv.org/abs/2111.10367\",\n",
    "}\n",
    "#                \"e2e_SEW-D-mid-LS960\": \"https://arxiv.org/abs/2109.06870\",\\\n",
    "#                \"e2e_SEW-D-mid-LS960+LM\": \"https://arxiv.org/abs/2109.06870\"}\n",
    "\n",
    "\n",
    "leaderboard_scores = {}\n",
    "leaderboard_scores['ref'] = []\n",
    "leaderboard_scores['submission'] = []\n",
    "leaderboard_scores['system type'] = []\n",
    "for submission_name in submissions.keys():\n",
    "    score = get_slue_score(f\"submissions_rebalanced/{submission_name}.tsv\")\n",
    "    leaderboard_scores['submission'].append('_'.join(submission_name.split(\"_\")[1:]).upper())\n",
    "    leaderboard_scores['system type'].append(submission_name.split(\"_\")[0])\n",
    "    ref_link = '-'\n",
    "    if submissions[submission_name]:\n",
    "        ref_link = f'<a target=\"_blank\" href=\"{submissions[submission_name]}\">link</a>'\n",
    "    leaderboard_scores['ref'].append(ref_link)\n",
    "    for key in score.keys():\n",
    "        if not key in leaderboard_scores:\n",
    "            leaderboard_scores[key]=[]\n",
    "        leaderboard_scores[key].append(score[key])\n",
    "\n",
    "\n",
    "\n",
    "rank_order = np.argsort(leaderboard_scores['slue_score'])\n",
    "rank_order = rank_order[::-1]\n",
    "df = pd.DataFrame.from_dict(leaderboard_scores)\n",
    "# rank_order = max(rank_order)-rank_order\n",
    "df = df.loc[rank_order]\n",
    "df['Ranking'] = np.arange(len(rank_order))+1\n",
    "df = df[['submission','Ranking','system type', 'slue_score','wer_voxpopuli', 'wer_voxceleb', 'ner_micro_f1','sentiment_macro_f1','ref']]\n",
    "df = df.rename(columns={\"submission\": \"Submission\"})\n",
    "df = df.rename(columns={\"system type\": \"System type\"})\n",
    "df = df.rename(columns={\"slue_score\": \"SLUE-score\"})\n",
    "df = df.rename(columns={\"wer_voxpopuli\": \"WER(p)\"})\n",
    "df = df.rename(columns={\"wer_voxceleb\": \"WER(c)\"})\n",
    "df = df.rename(columns={\"ner_micro_f1\": \"NER f-1\"})\n",
    "df = df.rename(columns={\"sentiment_macro_f1\": \"SA f-1\"})\n",
    "df = df.set_index(\"Submission\")\n",
    "\n",
    "headers = {\n",
    "    'selector': 'th',\n",
    "    'props': 'background-color: white; color: black; width: 75px; font-weight:bold;font-size:11px'\n",
    "}\n",
    "index_names = {\n",
    "    'selector': '.index_name',\n",
    "    'props': 'font-style: normal; color: black; font-weight:bold; width:300px;font-size:12px'}\n",
    "cell_hover = {  # for row hover use <tr> instead of <td>\n",
    "    'selector': 'td:hover',\n",
    "    'props': [('background-color', '#ffffb3'),(\"font-size\", \"130%\"),(\"font-weight\",\"bold\")]\n",
    "}\n",
    "submission = {\n",
    "    'selector': 'td',\n",
    "    'props': 'font-style: italic; color: black; font-weight:normal;'}\n",
    "caption = dict(selector=\"caption\", props=[(\"caption-side\", \"bottom\")])\n",
    "\n",
    "\n",
    "# df.style.\\\n",
    "#     set_table_attributes('style=\"font-size: 14px\"',).\\\n",
    "#     set_table_styles([submission,caption,cell_hover,index_names,headers], overwrite=False).\\\n",
    "#     format(precision=1).\\\n",
    "#     set_caption(\"*WER(p): WER for slue-voxpopuli, WER(c): WER for slue-voxceleb\")\n",
    "\n",
    "\n",
    "\n",
    "HTML(df.style.\\\n",
    "    set_table_attributes('style=\"font-size: 14px\"',).\\\n",
    "    set_table_styles([submission,caption,cell_hover,index_names,headers], overwrite=False).\\\n",
    "    format(precision=1).\\\n",
    "    set_caption(\"*WER(p): WER for slue-voxpopuli, WER(c): WER for slue-voxceleb\").to_html())\n",
    "        "
   ]
  }
 ],
 "metadata": {
  "celltoolbar": "Tags",
  "kernelspec": {
   "display_name": "Python 3 (ipykernel)",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.8.0"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 5
}