{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {
    "cell_id": "1596786f-e64f-4ad9-b663-6c4212b7f1e4",
    "deepnote_cell_type": "markdown",
    "tags": []
   },
   "source": [
    "# Week 10, Monday\n",
    "\n",
    "[YuJa recording](https://uci.yuja.com/V/Video?v=4539948&node=15119194&a=1725214600&autoplay=1)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {
    "cell_id": "1d0b28e8-327e-41b0-b327-1e5953bef295",
    "deepnote_cell_type": "code",
    "deepnote_to_be_reexecuted": false,
    "execution_millis": 2047,
    "execution_start": 1646673562178,
    "source_hash": "66ddaf3f",
    "tags": []
   },
   "outputs": [],
   "source": [
    "import seaborn as sns\n",
    "import numpy as np\n",
    "import pandas as pd"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "cell_id": "f9352b56-a5b5-46d3-914f-92de23de05e7",
    "deepnote_cell_type": "markdown",
    "tags": []
   },
   "source": [
    "## Lecture\n",
    "\n",
    "We will practice analyzing and cleaning a dataset.  This dataset contains scaled versions of the Midterm 2 scores.\n",
    "\n",
    "* Can you identify which problem needed to be curved differently between the two versions of the midterm?"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "metadata": {
    "cell_id": "8b0737dc-d8ac-4702-aac1-4c3af7be3e18",
    "deepnote_cell_type": "code",
    "deepnote_to_be_reexecuted": false,
    "execution_millis": 3,
    "execution_start": 1646673564236,
    "source_hash": "9c374d52",
    "tags": []
   },
   "outputs": [],
   "source": [
    "df = pd.read_csv(\"../data/Midterm_scaled.csv\")"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Student</th>\n",
       "      <th>ID</th>\n",
       "      <th>SIS User ID</th>\n",
       "      <th>SIS Login ID</th>\n",
       "      <th>Section</th>\n",
       "      <th>1a</th>\n",
       "      <th>1b</th>\n",
       "      <th>1c</th>\n",
       "      <th>1d</th>\n",
       "      <th>1e</th>\n",
       "      <th>1f</th>\n",
       "      <th>2</th>\n",
       "      <th>3</th>\n",
       "      <th>Column that is randomly blank.</th>\n",
       "      <th>Version</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>Out of 3</td>\n",
       "      <td>Out of 3</td>\n",
       "      <td>Out of 3</td>\n",
       "      <td>Out of 3</td>\n",
       "      <td>Out of 3</td>\n",
       "      <td>Out of 3</td>\n",
       "      <td>Out of 4</td>\n",
       "      <td>Out of 8</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>Chris Davis</td>\n",
       "      <td>23232.0</td>\n",
       "      <td>23251.0</td>\n",
       "      <td>daviscj</td>\n",
       "      <td>MATH 10 LEC A: INTRO PROG DATA SCI (44870)</td>\n",
       "      <td>-0.717101719</td>\n",
       "      <td>0.842970667</td>\n",
       "      <td>0.887970408</td>\n",
       "      <td>0.972078231</td>\n",
       "      <td>0.654139006</td>\n",
       "      <td>0.264135272</td>\n",
       "      <td>1.072380529</td>\n",
       "      <td>0.887667048</td>\n",
       "      <td>NaN</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>Chris Davis</td>\n",
       "      <td>23232.0</td>\n",
       "      <td>23251.0</td>\n",
       "      <td>daviscj</td>\n",
       "      <td>MATH 10 LEC A: INTRO PROG DATA SCI (44870)</td>\n",
       "      <td>1.223291168</td>\n",
       "      <td>-1.351934088</td>\n",
       "      <td>0.887970408</td>\n",
       "      <td>0.972078231</td>\n",
       "      <td>0.654139006</td>\n",
       "      <td>0.264135272</td>\n",
       "      <td>0</td>\n",
       "      <td>0.887667048</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>Chris Davis</td>\n",
       "      <td>23232.0</td>\n",
       "      <td>23251.0</td>\n",
       "      <td>daviscj</td>\n",
       "      <td>MATH 10 LEC A: INTRO PROG DATA SCI (44870)</td>\n",
       "      <td>-0.717101719</td>\n",
       "      <td>-1.351934088</td>\n",
       "      <td>-1.206729017</td>\n",
       "      <td>-0.470360434</td>\n",
       "      <td>-2.081351382</td>\n",
       "      <td>0.264135272</td>\n",
       "      <td>0</td>\n",
       "      <td>-1.432371827</td>\n",
       "      <td>NaN</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "       Student       ID  SIS User ID SIS Login ID  \\\n",
       "0          NaN      NaN          NaN          NaN   \n",
       "1          NaN      NaN          NaN          NaN   \n",
       "2  Chris Davis  23232.0      23251.0      daviscj   \n",
       "3  Chris Davis  23232.0      23251.0      daviscj   \n",
       "4  Chris Davis  23232.0      23251.0      daviscj   \n",
       "\n",
       "                                      Section            1a            1b  \\\n",
       "0                                         NaN      Out of 3      Out of 3   \n",
       "1                                         NaN           NaN           NaN   \n",
       "2  MATH 10 LEC A: INTRO PROG DATA SCI (44870)  -0.717101719   0.842970667   \n",
       "3  MATH 10 LEC A: INTRO PROG DATA SCI (44870)   1.223291168  -1.351934088   \n",
       "4  MATH 10 LEC A: INTRO PROG DATA SCI (44870)  -0.717101719  -1.351934088   \n",
       "\n",
       "             1c            1d            1e           1f            2  \\\n",
       "0      Out of 3      Out of 3      Out of 3     Out of 3     Out of 4   \n",
       "1           NaN           NaN           NaN          NaN          NaN   \n",
       "2   0.887970408   0.972078231   0.654139006  0.264135272  1.072380529   \n",
       "3   0.887970408   0.972078231   0.654139006  0.264135272            0   \n",
       "4  -1.206729017  -0.470360434  -2.081351382  0.264135272            0   \n",
       "\n",
       "              3  Column that is randomly blank.  Version  \n",
       "0      Out of 8                              NaN     NaN  \n",
       "1           NaN                              NaN     NaN  \n",
       "2   0.887667048                              NaN       a  \n",
       "3   0.887667048                              NaN     NaN  \n",
       "4  -1.432371827                              NaN       a  "
      ]
     },
     "execution_count": 3,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df.head()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "Student                             object\n",
       "ID                                 float64\n",
       "SIS User ID                        float64\n",
       "SIS Login ID                        object\n",
       "Section                             object\n",
       "1a                                  object\n",
       "1b                                  object\n",
       "1c                                  object\n",
       "1d                                  object\n",
       "1e                                  object\n",
       "1f                                  object\n",
       "2                                   object\n",
       "3                                   object\n",
       "Column that is randomly blank.     float64\n",
       "Version                             object\n",
       "dtype: object"
      ]
     },
     "execution_count": 4,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df.dtypes"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "We want to convert most of those columns to numeric values."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {
    "cell_id": "76069d3f-99ea-4e68-a8eb-3e7f6f4c7b1d",
    "deepnote_cell_type": "code",
    "deepnote_to_be_reexecuted": false,
    "execution_millis": 50,
    "execution_start": 1646673564245,
    "source_hash": "bb4a0207",
    "tags": []
   },
   "outputs": [
    {
     "ename": "ValueError",
     "evalue": "Unable to parse string \"Out of 3\" at position 0",
     "output_type": "error",
     "traceback": [
      "\u001b[0;31m---------------------------------------------------------------------------\u001b[0m",
      "\u001b[0;31mValueError\u001b[0m                                Traceback (most recent call last)",
      "File \u001b[0;32m~/miniconda3/envs/torch/lib/python3.8/site-packages/pandas/_libs/lib.pyx:2315\u001b[0m, in \u001b[0;36mpandas._libs.lib.maybe_convert_numeric\u001b[0;34m()\u001b[0m\n",
      "\u001b[0;31mValueError\u001b[0m: Unable to parse string \"Out of 3\"",
      "\nDuring handling of the above exception, another exception occurred:\n",
      "\u001b[0;31mValueError\u001b[0m                                Traceback (most recent call last)",
      "Input \u001b[0;32mIn [5]\u001b[0m, in \u001b[0;36m<module>\u001b[0;34m\u001b[0m\n\u001b[0;32m----> 1\u001b[0m \u001b[43mpd\u001b[49m\u001b[38;5;241;43m.\u001b[39;49m\u001b[43mto_numeric\u001b[49m\u001b[43m(\u001b[49m\u001b[43mdf\u001b[49m\u001b[43m[\u001b[49m\u001b[38;5;124;43m\"\u001b[39;49m\u001b[38;5;124;43m1a\u001b[39;49m\u001b[38;5;124;43m\"\u001b[39;49m\u001b[43m]\u001b[49m\u001b[43m)\u001b[49m\n",
      "File \u001b[0;32m~/miniconda3/envs/torch/lib/python3.8/site-packages/pandas/core/tools/numeric.py:184\u001b[0m, in \u001b[0;36mto_numeric\u001b[0;34m(arg, errors, downcast)\u001b[0m\n\u001b[1;32m    182\u001b[0m coerce_numeric \u001b[38;5;241m=\u001b[39m errors \u001b[38;5;129;01mnot\u001b[39;00m \u001b[38;5;129;01min\u001b[39;00m (\u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mignore\u001b[39m\u001b[38;5;124m\"\u001b[39m, \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mraise\u001b[39m\u001b[38;5;124m\"\u001b[39m)\n\u001b[1;32m    183\u001b[0m \u001b[38;5;28;01mtry\u001b[39;00m:\n\u001b[0;32m--> 184\u001b[0m     values, _ \u001b[38;5;241m=\u001b[39m \u001b[43mlib\u001b[49m\u001b[38;5;241;43m.\u001b[39;49m\u001b[43mmaybe_convert_numeric\u001b[49m\u001b[43m(\u001b[49m\n\u001b[1;32m    185\u001b[0m \u001b[43m        \u001b[49m\u001b[43mvalues\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[38;5;28;43mset\u001b[39;49m\u001b[43m(\u001b[49m\u001b[43m)\u001b[49m\u001b[43m,\u001b[49m\u001b[43m \u001b[49m\u001b[43mcoerce_numeric\u001b[49m\u001b[38;5;241;43m=\u001b[39;49m\u001b[43mcoerce_numeric\u001b[49m\n\u001b[1;32m    186\u001b[0m \u001b[43m    \u001b[49m\u001b[43m)\u001b[49m\n\u001b[1;32m    187\u001b[0m \u001b[38;5;28;01mexcept\u001b[39;00m (\u001b[38;5;167;01mValueError\u001b[39;00m, \u001b[38;5;167;01mTypeError\u001b[39;00m):\n\u001b[1;32m    188\u001b[0m     \u001b[38;5;28;01mif\u001b[39;00m errors \u001b[38;5;241m==\u001b[39m \u001b[38;5;124m\"\u001b[39m\u001b[38;5;124mraise\u001b[39m\u001b[38;5;124m\"\u001b[39m:\n",
      "File \u001b[0;32m~/miniconda3/envs/torch/lib/python3.8/site-packages/pandas/_libs/lib.pyx:2357\u001b[0m, in \u001b[0;36mpandas._libs.lib.maybe_convert_numeric\u001b[0;34m()\u001b[0m\n",
      "\u001b[0;31mValueError\u001b[0m: Unable to parse string \"Out of 3\" at position 0"
     ]
    }
   ],
   "source": [
    "pd.to_numeric(df[\"1a\"])"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "We can fix that error by using the `errors` keyword argument."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "0          NaN\n",
       "1          NaN\n",
       "2    -0.717102\n",
       "3     1.223291\n",
       "4    -0.717102\n",
       "5    -0.717102\n",
       "6    -0.717102\n",
       "7    -0.717102\n",
       "8     1.223291\n",
       "9    -0.717102\n",
       "10   -0.717102\n",
       "11   -0.717102\n",
       "12   -1.687298\n",
       "13   -0.717102\n",
       "14    1.223291\n",
       "15    1.223291\n",
       "16   -1.687298\n",
       "17    1.223291\n",
       "18   -0.717102\n",
       "19   -0.717102\n",
       "20   -0.717102\n",
       "21   -0.717102\n",
       "22   -0.717102\n",
       "23    1.223291\n",
       "24    1.223291\n",
       "25    1.223291\n",
       "26    1.223291\n",
       "27   -0.717102\n",
       "28    1.223291\n",
       "29    1.223291\n",
       "30   -0.717102\n",
       "31   -0.717102\n",
       "32    1.223291\n",
       "33   -0.717102\n",
       "34   -0.717102\n",
       "35    1.223291\n",
       "36   -0.717102\n",
       "37   -0.717102\n",
       "38    1.223291\n",
       "39   -0.717102\n",
       "40    1.223291\n",
       "41   -0.717102\n",
       "42   -0.717102\n",
       "43    1.223291\n",
       "44    1.223291\n",
       "45   -0.717102\n",
       "46    1.223291\n",
       "47   -0.717102\n",
       "Name: 1a, dtype: float64"
      ]
     },
     "execution_count": 6,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "pd.to_numeric(df[\"1a\"], errors=\"coerce\")"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "If we want to do the same thing to all the columns from \"1a\" to \"3\", we can use `apply` and a `lambda` function."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 7,
   "metadata": {
    "cell_id": "006db592-cefd-4d55-8c0b-405e0c60cab7",
    "deepnote_cell_type": "code",
    "deepnote_to_be_reexecuted": false,
    "execution_millis": 37,
    "execution_start": 1646673564294,
    "source_hash": "64346799",
    "tags": []
   },
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>1a</th>\n",
       "      <th>1b</th>\n",
       "      <th>1c</th>\n",
       "      <th>1d</th>\n",
       "      <th>1e</th>\n",
       "      <th>1f</th>\n",
       "      <th>2</th>\n",
       "      <th>3</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>1.072381</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>1.223291</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>-1.206729</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>-2.081351</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>-1.432372</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>-0.968364</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>6</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>-1.206729</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>-1.432372</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>7</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>-0.620299</td>\n",
       "      <td>-0.159379</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>-1.072381</td>\n",
       "      <td>-0.968364</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>8</th>\n",
       "      <td>1.223291</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>1.072381</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>9</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>-0.620299</td>\n",
       "      <td>-1.206729</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>1.072381</td>\n",
       "      <td>0.423659</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>10</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>-1.912799</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>11</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>1.072381</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>12</th>\n",
       "      <td>-1.687298</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>-0.159379</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>-2.081351</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>-3.217142</td>\n",
       "      <td>-0.968364</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>13</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>-0.159379</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>-1.169521</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>-1.072381</td>\n",
       "      <td>-1.432372</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>14</th>\n",
       "      <td>1.223291</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>15</th>\n",
       "      <td>1.223291</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>-1.206729</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>-3.785939</td>\n",
       "      <td>-1.072381</td>\n",
       "      <td>-0.504356</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>16</th>\n",
       "      <td>-1.687298</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>-1.206729</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>-2.081351</td>\n",
       "      <td>-3.785939</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>-1.896380</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>17</th>\n",
       "      <td>1.223291</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>1.072381</td>\n",
       "      <td>0.423659</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>18</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>-0.159379</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>-1.169521</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>1.072381</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>19</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>-0.159379</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>-0.040349</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>20</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>21</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>1.072381</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>22</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>1.072381</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>23</th>\n",
       "      <td>1.223291</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>-0.159379</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>-0.257691</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>-0.504356</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>24</th>\n",
       "      <td>1.223291</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>1.072381</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>25</th>\n",
       "      <td>1.223291</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>-1.206729</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>-0.504356</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>26</th>\n",
       "      <td>1.223291</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>27</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>-1.206729</td>\n",
       "      <td>-1.912799</td>\n",
       "      <td>-1.169521</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>-1.072381</td>\n",
       "      <td>-1.432372</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>28</th>\n",
       "      <td>1.223291</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>29</th>\n",
       "      <td>1.223291</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>-1.206729</td>\n",
       "      <td>-1.912799</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>1.072381</td>\n",
       "      <td>-0.040349</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>30</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>-1.206729</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>-1.169521</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>31</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>-0.159379</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>-1.072381</td>\n",
       "      <td>-0.968364</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>32</th>\n",
       "      <td>1.223291</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>1.072381</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>33</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>1.072381</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>34</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>-0.159379</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>-0.257691</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>-1.072381</td>\n",
       "      <td>-0.968364</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>35</th>\n",
       "      <td>1.223291</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>-2.254079</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>-0.040349</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>36</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>-1.206729</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>-1.169521</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>-3.217142</td>\n",
       "      <td>-0.040349</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>37</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>-1.206729</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>38</th>\n",
       "      <td>1.223291</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>-1.206729</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>-1.169521</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>-0.504356</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>39</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>-2.254079</td>\n",
       "      <td>-3.355238</td>\n",
       "      <td>-2.081351</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>-1.072381</td>\n",
       "      <td>-1.896380</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>40</th>\n",
       "      <td>1.223291</td>\n",
       "      <td>-0.620299</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>-1.169521</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>-1.072381</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>41</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>1.072381</td>\n",
       "      <td>-0.040349</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>42</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>43</th>\n",
       "      <td>1.223291</td>\n",
       "      <td>-0.620299</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>-1.169521</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>-0.040349</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>44</th>\n",
       "      <td>1.223291</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>1.072381</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>45</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>-0.620299</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>-3.785939</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>-0.040349</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>46</th>\n",
       "      <td>1.223291</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>-0.159379</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>-2.081351</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>-2.824395</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>47</th>\n",
       "      <td>-0.717102</td>\n",
       "      <td>0.111336</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.887667</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "          1a        1b        1c        1d        1e        1f         2  \\\n",
       "0        NaN       NaN       NaN       NaN       NaN       NaN       NaN   \n",
       "1        NaN       NaN       NaN       NaN       NaN       NaN       NaN   \n",
       "2  -0.717102  0.842971  0.887970  0.972078  0.654139  0.264135  1.072381   \n",
       "3   1.223291 -1.351934  0.887970  0.972078  0.654139  0.264135  0.000000   \n",
       "4  -0.717102 -1.351934 -1.206729 -0.470360 -2.081351  0.264135  0.000000   \n",
       "5  -0.717102 -1.351934  0.887970 -0.470360  0.654139  0.264135  0.000000   \n",
       "6  -0.717102 -1.351934 -1.206729 -0.470360  0.654139  0.264135  0.000000   \n",
       "7  -0.717102 -0.620299 -0.159379 -0.470360  0.654139  0.264135 -1.072381   \n",
       "8   1.223291  0.842971  0.887970  0.972078  0.654139  0.264135  1.072381   \n",
       "9  -0.717102 -0.620299 -1.206729  0.972078  0.654139  0.264135  1.072381   \n",
       "10 -0.717102 -1.351934  0.887970 -1.912799  0.654139  0.264135  0.000000   \n",
       "11 -0.717102  0.842971  0.887970  0.972078  0.654139  0.264135  1.072381   \n",
       "12 -1.687298 -1.351934 -0.159379 -0.470360 -2.081351  0.264135 -3.217142   \n",
       "13 -0.717102  0.842971 -0.159379 -0.470360 -1.169521  0.264135 -1.072381   \n",
       "14  1.223291  0.842971  0.887970  0.972078  0.654139  0.264135  0.000000   \n",
       "15  1.223291  0.842971 -1.206729 -0.470360  0.654139 -3.785939 -1.072381   \n",
       "16 -1.687298 -1.351934 -1.206729 -0.470360 -2.081351 -3.785939  0.000000   \n",
       "17  1.223291  0.842971  0.887970  0.972078  0.654139  0.264135  1.072381   \n",
       "18 -0.717102 -1.351934 -0.159379 -0.470360 -1.169521  0.264135  1.072381   \n",
       "19 -0.717102 -1.351934 -0.159379 -0.470360  0.654139  0.264135  0.000000   \n",
       "20 -0.717102  0.842971  0.887970  0.972078  0.654139  0.264135  0.000000   \n",
       "21 -0.717102  0.842971  0.887970  0.972078  0.654139  0.264135  1.072381   \n",
       "22 -0.717102  0.842971  0.887970 -0.470360  0.654139  0.264135  1.072381   \n",
       "23  1.223291 -1.351934 -0.159379 -0.470360 -0.257691  0.264135  0.000000   \n",
       "24  1.223291  0.842971  0.887970  0.972078  0.654139  0.264135  1.072381   \n",
       "25  1.223291  0.842971 -1.206729 -0.470360  0.654139  0.264135  0.000000   \n",
       "26  1.223291  0.842971  0.887970  0.972078  0.654139  0.264135  0.000000   \n",
       "27 -0.717102  0.842971 -1.206729 -1.912799 -1.169521  0.264135 -1.072381   \n",
       "28  1.223291  0.842971  0.887970  0.972078  0.654139  0.264135  0.000000   \n",
       "29  1.223291  0.842971 -1.206729 -1.912799  0.654139  0.264135  1.072381   \n",
       "30 -0.717102  0.842971 -1.206729  0.972078 -1.169521  0.264135  0.000000   \n",
       "31 -0.717102  0.842971 -0.159379 -0.470360  0.654139  0.264135 -1.072381   \n",
       "32  1.223291  0.842971  0.887970  0.972078  0.654139  0.264135  1.072381   \n",
       "33 -0.717102  0.842971  0.887970  0.972078  0.654139  0.264135  1.072381   \n",
       "34 -0.717102  0.842971 -0.159379 -0.470360 -0.257691  0.264135 -1.072381   \n",
       "35  1.223291  0.842971 -2.254079 -0.470360  0.654139  0.264135  0.000000   \n",
       "36 -0.717102 -1.351934 -1.206729 -0.470360 -1.169521  0.264135 -3.217142   \n",
       "37 -0.717102 -1.351934 -1.206729 -0.470360  0.654139  0.264135  0.000000   \n",
       "38  1.223291  0.842971 -1.206729 -0.470360 -1.169521  0.264135  0.000000   \n",
       "39 -0.717102 -1.351934 -2.254079 -3.355238 -2.081351  0.264135 -1.072381   \n",
       "40  1.223291 -0.620299  0.887970 -0.470360 -1.169521  0.264135 -1.072381   \n",
       "41 -0.717102  0.842971  0.887970  0.972078  0.654139  0.264135  1.072381   \n",
       "42 -0.717102  0.842971  0.887970  0.972078  0.654139  0.264135  0.000000   \n",
       "43  1.223291 -0.620299  0.887970  0.972078 -1.169521  0.264135  0.000000   \n",
       "44  1.223291  0.842971  0.887970  0.972078  0.654139  0.264135  1.072381   \n",
       "45 -0.717102 -0.620299  0.887970  0.972078  0.654139 -3.785939  0.000000   \n",
       "46  1.223291 -1.351934 -0.159379 -0.470360 -2.081351  0.264135  0.000000   \n",
       "47 -0.717102  0.111336  0.887970 -0.470360  0.654139  0.264135  0.000000   \n",
       "\n",
       "           3  \n",
       "0        NaN  \n",
       "1        NaN  \n",
       "2   0.887667  \n",
       "3   0.887667  \n",
       "4  -1.432372  \n",
       "5  -0.968364  \n",
       "6  -1.432372  \n",
       "7  -0.968364  \n",
       "8   0.887667  \n",
       "9   0.423659  \n",
       "10  0.887667  \n",
       "11  0.887667  \n",
       "12 -0.968364  \n",
       "13 -1.432372  \n",
       "14  0.887667  \n",
       "15 -0.504356  \n",
       "16 -1.896380  \n",
       "17  0.423659  \n",
       "18  0.887667  \n",
       "19 -0.040349  \n",
       "20  0.887667  \n",
       "21  0.887667  \n",
       "22  0.887667  \n",
       "23 -0.504356  \n",
       "24  0.887667  \n",
       "25 -0.504356  \n",
       "26  0.887667  \n",
       "27 -1.432372  \n",
       "28  0.887667  \n",
       "29 -0.040349  \n",
       "30  0.887667  \n",
       "31 -0.968364  \n",
       "32  0.887667  \n",
       "33  0.887667  \n",
       "34 -0.968364  \n",
       "35 -0.040349  \n",
       "36 -0.040349  \n",
       "37  0.887667  \n",
       "38 -0.504356  \n",
       "39 -1.896380  \n",
       "40  0.887667  \n",
       "41 -0.040349  \n",
       "42  0.887667  \n",
       "43 -0.040349  \n",
       "44  0.887667  \n",
       "45 -0.040349  \n",
       "46 -2.824395  \n",
       "47  0.887667  "
      ]
     },
     "execution_count": 7,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df.loc[:,\"1a\":\"3\"].apply(lambda col: pd.to_numeric(col, errors=\"coerce\"), axis=0)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "For this particular dataset, a much easier strategy is just to specify during the import that we want to skip the top two rows (after the header row)."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 9,
   "metadata": {
    "cell_id": "ba3ce33b-332a-4016-b1b8-be4c51bc3727",
    "deepnote_cell_type": "code",
    "deepnote_to_be_reexecuted": false,
    "execution_millis": 10,
    "execution_start": 1646673564333,
    "source_hash": "dec346e2",
    "tags": []
   },
   "outputs": [],
   "source": [
    "df = pd.read_csv(\"../data/Midterm_scaled.csv\", skiprows=[1,2])"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 10,
   "metadata": {
    "cell_id": "eff67d44-e50f-4dc4-8b76-d6c0fade82aa",
    "deepnote_cell_type": "code",
    "deepnote_to_be_reexecuted": false,
    "execution_millis": 40,
    "execution_start": 1646673564354,
    "source_hash": "c085b6ba",
    "tags": []
   },
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Student</th>\n",
       "      <th>ID</th>\n",
       "      <th>SIS User ID</th>\n",
       "      <th>SIS Login ID</th>\n",
       "      <th>Section</th>\n",
       "      <th>1a</th>\n",
       "      <th>1b</th>\n",
       "      <th>1c</th>\n",
       "      <th>1d</th>\n",
       "      <th>1e</th>\n",
       "      <th>1f</th>\n",
       "      <th>2</th>\n",
       "      <th>3</th>\n",
       "      <th>Column that is randomly blank.</th>\n",
       "      <th>Version</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>Chris Davis</td>\n",
       "      <td>23232</td>\n",
       "      <td>23251</td>\n",
       "      <td>daviscj</td>\n",
       "      <td>MATH 10 LEC A: INTRO PROG DATA SCI (44870)</td>\n",
       "      <td>-0.717102</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>1.072381</td>\n",
       "      <td>0.887667</td>\n",
       "      <td>NaN</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>Chris Davis</td>\n",
       "      <td>23232</td>\n",
       "      <td>23251</td>\n",
       "      <td>daviscj</td>\n",
       "      <td>MATH 10 LEC A: INTRO PROG DATA SCI (44870)</td>\n",
       "      <td>1.223291</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.887667</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>Chris Davis</td>\n",
       "      <td>23232</td>\n",
       "      <td>23251</td>\n",
       "      <td>daviscj</td>\n",
       "      <td>MATH 10 LEC A: INTRO PROG DATA SCI (44870)</td>\n",
       "      <td>-0.717102</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>-1.206729</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>-2.081351</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>-1.432372</td>\n",
       "      <td>NaN</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>Chris Davis</td>\n",
       "      <td>23232</td>\n",
       "      <td>23251</td>\n",
       "      <td>daviscj</td>\n",
       "      <td>MATH 10 LEC A: INTRO PROG DATA SCI (44870)</td>\n",
       "      <td>-0.717102</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>-0.968364</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>Chris Davis</td>\n",
       "      <td>23232</td>\n",
       "      <td>23251</td>\n",
       "      <td>daviscj</td>\n",
       "      <td>MATH 10 LEC A: INTRO PROG DATA SCI (44870)</td>\n",
       "      <td>-0.717102</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>-1.206729</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>-1.432372</td>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "       Student     ID  SIS User ID SIS Login ID  \\\n",
       "0  Chris Davis  23232        23251      daviscj   \n",
       "1  Chris Davis  23232        23251      daviscj   \n",
       "2  Chris Davis  23232        23251      daviscj   \n",
       "3  Chris Davis  23232        23251      daviscj   \n",
       "4  Chris Davis  23232        23251      daviscj   \n",
       "\n",
       "                                      Section        1a        1b        1c  \\\n",
       "0  MATH 10 LEC A: INTRO PROG DATA SCI (44870) -0.717102  0.842971  0.887970   \n",
       "1  MATH 10 LEC A: INTRO PROG DATA SCI (44870)  1.223291 -1.351934  0.887970   \n",
       "2  MATH 10 LEC A: INTRO PROG DATA SCI (44870) -0.717102 -1.351934 -1.206729   \n",
       "3  MATH 10 LEC A: INTRO PROG DATA SCI (44870) -0.717102 -1.351934  0.887970   \n",
       "4  MATH 10 LEC A: INTRO PROG DATA SCI (44870) -0.717102 -1.351934 -1.206729   \n",
       "\n",
       "         1d        1e        1f         2         3  \\\n",
       "0  0.972078  0.654139  0.264135  1.072381  0.887667   \n",
       "1  0.972078  0.654139  0.264135  0.000000  0.887667   \n",
       "2 -0.470360 -2.081351  0.264135  0.000000 -1.432372   \n",
       "3 -0.470360  0.654139  0.264135  0.000000 -0.968364   \n",
       "4 -0.470360  0.654139  0.264135  0.000000 -1.432372   \n",
       "\n",
       "   Column that is randomly blank.  Version  \n",
       "0                              NaN       a  \n",
       "1                              NaN     NaN  \n",
       "2                              NaN       a  \n",
       "3                              NaN     NaN  \n",
       "4                              NaN     NaN  "
      ]
     },
     "execution_count": 10,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df.head()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "The original dataset only specifies who had version \"a\", not version \"b\".  Let's fill in version \"b\" in place of the `NaN` values."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 11,
   "metadata": {
    "cell_id": "fff5a8eb-2bcc-4aa3-a213-794d1063e298",
    "deepnote_cell_type": "code",
    "deepnote_to_be_reexecuted": false,
    "execution_millis": 3,
    "execution_start": 1646673564495,
    "source_hash": "5d4ebd94",
    "tags": []
   },
   "outputs": [],
   "source": [
    "df[\"Version\"] = df[\"Version\"].fillna(\"b\")"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Here are some examples using `df.groupby`.  There are more examples below in the Worksheet portion."
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "This shows all possible combinations of (scaled) scores on problems \"1a\" and \"1b\".  For example, this shows that 3 students scored -0.717101719 on 1a and -0.62029917 on 1b."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 15,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "The value of x is (-1.687298162, -1.351934088)\n",
      "(2, 15)\n",
      "\n",
      "The value of x is (-0.717101719, -1.351934088)\n",
      "(9, 15)\n",
      "\n",
      "The value of x is (-0.717101719, -0.62029917)\n",
      "(3, 15)\n",
      "\n",
      "The value of x is (-0.717101719, 0.111335748)\n",
      "(1, 15)\n",
      "\n",
      "The value of x is (-0.717101719, 0.842970667)\n",
      "(13, 15)\n",
      "\n",
      "The value of x is (1.223291168, -1.351934088)\n",
      "(3, 15)\n",
      "\n",
      "The value of x is (1.223291168, -0.62029917)\n",
      "(2, 15)\n",
      "\n",
      "The value of x is (1.223291168, 0.842970667)\n",
      "(13, 15)\n",
      "\n"
     ]
    }
   ],
   "source": [
    "for x,y in df.groupby([\"1a\",\"1b\"]):\n",
    "    print(f\"The value of x is {x}\")\n",
    "    print(y.shape)\n",
    "    print(\"\")"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "For our question of whether one version was easier than the other version, we are interested in grouping by \"Version\". "
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 17,
   "metadata": {
    "cell_id": "f39c15ad-f4cf-4bf4-83e7-2c9b48208045",
    "deepnote_cell_type": "code",
    "deepnote_to_be_reexecuted": false,
    "execution_millis": 13,
    "execution_start": 1646673564499,
    "source_hash": "4f3b753a",
    "tags": []
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "The value of x is a\n",
      "(21, 15)\n",
      "The value of x is b\n",
      "(25, 15)\n"
     ]
    }
   ],
   "source": [
    "for x,y in df.groupby(\"Version\"):\n",
    "    print(f\"The value of x is {x}\")\n",
    "    print(y.shape)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "In this code, `y` is a DataFrame.  Notice for example how in the first displayed DataFrame, the exams are all Version a."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 19,
   "metadata": {
    "cell_id": "75512172-322a-4975-89b9-96abe52cbfa0",
    "deepnote_cell_type": "code",
    "deepnote_to_be_reexecuted": false,
    "execution_millis": 40,
    "execution_start": 1646673564504,
    "source_hash": "a25be741",
    "tags": []
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "The value of x is a\n"
     ]
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Student</th>\n",
       "      <th>ID</th>\n",
       "      <th>SIS User ID</th>\n",
       "      <th>SIS Login ID</th>\n",
       "      <th>Section</th>\n",
       "      <th>1a</th>\n",
       "      <th>1b</th>\n",
       "      <th>1c</th>\n",
       "      <th>1d</th>\n",
       "      <th>1e</th>\n",
       "      <th>1f</th>\n",
       "      <th>2</th>\n",
       "      <th>3</th>\n",
       "      <th>Column that is randomly blank.</th>\n",
       "      <th>Version</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>0</th>\n",
       "      <td>Chris Davis</td>\n",
       "      <td>23232</td>\n",
       "      <td>23251</td>\n",
       "      <td>daviscj</td>\n",
       "      <td>MATH 10 LEC A: INTRO PROG DATA SCI (44870)</td>\n",
       "      <td>-0.717102</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>1.072381</td>\n",
       "      <td>0.887667</td>\n",
       "      <td>NaN</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>Chris Davis</td>\n",
       "      <td>23232</td>\n",
       "      <td>23251</td>\n",
       "      <td>daviscj</td>\n",
       "      <td>MATH 10 LEC A: INTRO PROG DATA SCI (44870)</td>\n",
       "      <td>-0.717102</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>-1.206729</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>-2.081351</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>-1.432372</td>\n",
       "      <td>NaN</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>5</th>\n",
       "      <td>Chris Davis</td>\n",
       "      <td>23232</td>\n",
       "      <td>23251</td>\n",
       "      <td>daviscj</td>\n",
       "      <td>MATH 10 LEC A: INTRO PROG DATA SCI (44870)</td>\n",
       "      <td>-0.717102</td>\n",
       "      <td>-0.620299</td>\n",
       "      <td>-0.159379</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>-1.072381</td>\n",
       "      <td>-0.968364</td>\n",
       "      <td>NaN</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>11</th>\n",
       "      <td>Chris Davis</td>\n",
       "      <td>23232</td>\n",
       "      <td>23251</td>\n",
       "      <td>daviscj</td>\n",
       "      <td>MATH 10 LEC A: INTRO PROG DATA SCI (44870)</td>\n",
       "      <td>-0.717102</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>-0.159379</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>-1.169521</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>-1.072381</td>\n",
       "      <td>-1.432372</td>\n",
       "      <td>NaN</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>14</th>\n",
       "      <td>Chris Davis</td>\n",
       "      <td>23232</td>\n",
       "      <td>23251</td>\n",
       "      <td>daviscj</td>\n",
       "      <td>MATH 10 LEC A: INTRO PROG DATA SCI (44870)</td>\n",
       "      <td>-1.687298</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>-1.206729</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>-2.081351</td>\n",
       "      <td>-3.785939</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>-1.896380</td>\n",
       "      <td>NaN</td>\n",
       "      <td>a</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "        Student     ID  SIS User ID SIS Login ID  \\\n",
       "0   Chris Davis  23232        23251      daviscj   \n",
       "2   Chris Davis  23232        23251      daviscj   \n",
       "5   Chris Davis  23232        23251      daviscj   \n",
       "11  Chris Davis  23232        23251      daviscj   \n",
       "14  Chris Davis  23232        23251      daviscj   \n",
       "\n",
       "                                       Section        1a        1b        1c  \\\n",
       "0   MATH 10 LEC A: INTRO PROG DATA SCI (44870) -0.717102  0.842971  0.887970   \n",
       "2   MATH 10 LEC A: INTRO PROG DATA SCI (44870) -0.717102 -1.351934 -1.206729   \n",
       "5   MATH 10 LEC A: INTRO PROG DATA SCI (44870) -0.717102 -0.620299 -0.159379   \n",
       "11  MATH 10 LEC A: INTRO PROG DATA SCI (44870) -0.717102  0.842971 -0.159379   \n",
       "14  MATH 10 LEC A: INTRO PROG DATA SCI (44870) -1.687298 -1.351934 -1.206729   \n",
       "\n",
       "          1d        1e        1f         2         3  \\\n",
       "0   0.972078  0.654139  0.264135  1.072381  0.887667   \n",
       "2  -0.470360 -2.081351  0.264135  0.000000 -1.432372   \n",
       "5  -0.470360  0.654139  0.264135 -1.072381 -0.968364   \n",
       "11 -0.470360 -1.169521  0.264135 -1.072381 -1.432372   \n",
       "14 -0.470360 -2.081351 -3.785939  0.000000 -1.896380   \n",
       "\n",
       "    Column that is randomly blank.  Version  \n",
       "0                               NaN       a  \n",
       "2                               NaN       a  \n",
       "5                               NaN       a  \n",
       "11                              NaN       a  \n",
       "14                              NaN       a  "
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "The value of x is b\n"
     ]
    },
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>Student</th>\n",
       "      <th>ID</th>\n",
       "      <th>SIS User ID</th>\n",
       "      <th>SIS Login ID</th>\n",
       "      <th>Section</th>\n",
       "      <th>1a</th>\n",
       "      <th>1b</th>\n",
       "      <th>1c</th>\n",
       "      <th>1d</th>\n",
       "      <th>1e</th>\n",
       "      <th>1f</th>\n",
       "      <th>2</th>\n",
       "      <th>3</th>\n",
       "      <th>Column that is randomly blank.</th>\n",
       "      <th>Version</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>1</th>\n",
       "      <td>Chris Davis</td>\n",
       "      <td>23232</td>\n",
       "      <td>23251</td>\n",
       "      <td>daviscj</td>\n",
       "      <td>MATH 10 LEC A: INTRO PROG DATA SCI (44870)</td>\n",
       "      <td>1.223291</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>0.887667</td>\n",
       "      <td>NaN</td>\n",
       "      <td>b</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>Chris Davis</td>\n",
       "      <td>23232</td>\n",
       "      <td>23251</td>\n",
       "      <td>daviscj</td>\n",
       "      <td>MATH 10 LEC A: INTRO PROG DATA SCI (44870)</td>\n",
       "      <td>-0.717102</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>-0.968364</td>\n",
       "      <td>NaN</td>\n",
       "      <td>b</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>4</th>\n",
       "      <td>Chris Davis</td>\n",
       "      <td>23232</td>\n",
       "      <td>23251</td>\n",
       "      <td>daviscj</td>\n",
       "      <td>MATH 10 LEC A: INTRO PROG DATA SCI (44870)</td>\n",
       "      <td>-0.717102</td>\n",
       "      <td>-1.351934</td>\n",
       "      <td>-1.206729</td>\n",
       "      <td>-0.470360</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>0.000000</td>\n",
       "      <td>-1.432372</td>\n",
       "      <td>NaN</td>\n",
       "      <td>b</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>6</th>\n",
       "      <td>Chris Davis</td>\n",
       "      <td>23232</td>\n",
       "      <td>23251</td>\n",
       "      <td>daviscj</td>\n",
       "      <td>MATH 10 LEC A: INTRO PROG DATA SCI (44870)</td>\n",
       "      <td>1.223291</td>\n",
       "      <td>0.842971</td>\n",
       "      <td>0.887970</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>1.072381</td>\n",
       "      <td>0.887667</td>\n",
       "      <td>NaN</td>\n",
       "      <td>b</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>7</th>\n",
       "      <td>Chris Davis</td>\n",
       "      <td>23232</td>\n",
       "      <td>23251</td>\n",
       "      <td>daviscj</td>\n",
       "      <td>MATH 10 LEC A: INTRO PROG DATA SCI (44870)</td>\n",
       "      <td>-0.717102</td>\n",
       "      <td>-0.620299</td>\n",
       "      <td>-1.206729</td>\n",
       "      <td>0.972078</td>\n",
       "      <td>0.654139</td>\n",
       "      <td>0.264135</td>\n",
       "      <td>1.072381</td>\n",
       "      <td>0.423659</td>\n",
       "      <td>NaN</td>\n",
       "      <td>b</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "       Student     ID  SIS User ID SIS Login ID  \\\n",
       "1  Chris Davis  23232        23251      daviscj   \n",
       "3  Chris Davis  23232        23251      daviscj   \n",
       "4  Chris Davis  23232        23251      daviscj   \n",
       "6  Chris Davis  23232        23251      daviscj   \n",
       "7  Chris Davis  23232        23251      daviscj   \n",
       "\n",
       "                                      Section        1a        1b        1c  \\\n",
       "1  MATH 10 LEC A: INTRO PROG DATA SCI (44870)  1.223291 -1.351934  0.887970   \n",
       "3  MATH 10 LEC A: INTRO PROG DATA SCI (44870) -0.717102 -1.351934  0.887970   \n",
       "4  MATH 10 LEC A: INTRO PROG DATA SCI (44870) -0.717102 -1.351934 -1.206729   \n",
       "6  MATH 10 LEC A: INTRO PROG DATA SCI (44870)  1.223291  0.842971  0.887970   \n",
       "7  MATH 10 LEC A: INTRO PROG DATA SCI (44870) -0.717102 -0.620299 -1.206729   \n",
       "\n",
       "         1d        1e        1f         2         3  \\\n",
       "1  0.972078  0.654139  0.264135  0.000000  0.887667   \n",
       "3 -0.470360  0.654139  0.264135  0.000000 -0.968364   \n",
       "4 -0.470360  0.654139  0.264135  0.000000 -1.432372   \n",
       "6  0.972078  0.654139  0.264135  1.072381  0.887667   \n",
       "7  0.972078  0.654139  0.264135  1.072381  0.423659   \n",
       "\n",
       "   Column that is randomly blank.  Version  \n",
       "1                              NaN       b  \n",
       "3                              NaN       b  \n",
       "4                              NaN       b  \n",
       "6                              NaN       b  \n",
       "7                              NaN       b  "
      ]
     },
     "metadata": {},
     "output_type": "display_data"
    }
   ],
   "source": [
    "for x,y in df.groupby(\"Version\"):\n",
    "    print(f\"The value of x is {x}\")\n",
    "    display(y.head())"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Instead of iterating over the different possibilities, we can also perform what is called an aggregation operation, such as taking the `mean`."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 20,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th></th>\n",
       "      <th>ID</th>\n",
       "      <th>SIS User ID</th>\n",
       "      <th>1a</th>\n",
       "      <th>1b</th>\n",
       "      <th>1c</th>\n",
       "      <th>1d</th>\n",
       "      <th>1e</th>\n",
       "      <th>1f</th>\n",
       "      <th>2</th>\n",
       "      <th>3</th>\n",
       "      <th>Column that is randomly blank.</th>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>Version</th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "      <th></th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>a</th>\n",
       "      <td>23232.0</td>\n",
       "      <td>23251.0</td>\n",
       "      <td>-0.024104</td>\n",
       "      <td>0.355214</td>\n",
       "      <td>-0.109506</td>\n",
       "      <td>-0.126923</td>\n",
       "      <td>-0.084009</td>\n",
       "      <td>0.071275</td>\n",
       "      <td>0.153197</td>\n",
       "      <td>-0.018253</td>\n",
       "      <td>NaN</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>b</th>\n",
       "      <td>23232.0</td>\n",
       "      <td>23251.0</td>\n",
       "      <td>0.020248</td>\n",
       "      <td>-0.298380</td>\n",
       "      <td>0.091985</td>\n",
       "      <td>0.106615</td>\n",
       "      <td>0.070568</td>\n",
       "      <td>-0.059871</td>\n",
       "      <td>-0.128686</td>\n",
       "      <td>0.015332</td>\n",
       "      <td>NaN</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "              ID  SIS User ID        1a        1b        1c        1d  \\\n",
       "Version                                                                 \n",
       "a        23232.0      23251.0 -0.024104  0.355214 -0.109506 -0.126923   \n",
       "b        23232.0      23251.0  0.020248 -0.298380  0.091985  0.106615   \n",
       "\n",
       "               1e        1f         2         3  \\\n",
       "Version                                           \n",
       "a       -0.084009  0.071275  0.153197 -0.018253   \n",
       "b        0.070568 -0.059871 -0.128686  0.015332   \n",
       "\n",
       "         Column that is randomly blank.   \n",
       "Version                                   \n",
       "a                                    NaN  \n",
       "b                                    NaN  "
      ]
     },
     "execution_count": 20,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df.groupby(\"Version\").mean()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "It's a little easier to read if we take the transpose."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 21,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th>Version</th>\n",
       "      <th>a</th>\n",
       "      <th>b</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>ID</th>\n",
       "      <td>23232.000000</td>\n",
       "      <td>23232.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>SIS User ID</th>\n",
       "      <td>23251.000000</td>\n",
       "      <td>23251.000000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1a</th>\n",
       "      <td>-0.024104</td>\n",
       "      <td>0.020248</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1b</th>\n",
       "      <td>0.355214</td>\n",
       "      <td>-0.298380</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1c</th>\n",
       "      <td>-0.109506</td>\n",
       "      <td>0.091985</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1d</th>\n",
       "      <td>-0.126923</td>\n",
       "      <td>0.106615</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1e</th>\n",
       "      <td>-0.084009</td>\n",
       "      <td>0.070568</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1f</th>\n",
       "      <td>0.071275</td>\n",
       "      <td>-0.059871</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>0.153197</td>\n",
       "      <td>-0.128686</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>-0.018253</td>\n",
       "      <td>0.015332</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>Column that is randomly blank.</th>\n",
       "      <td>NaN</td>\n",
       "      <td>NaN</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "Version                                     a             b\n",
       "ID                               23232.000000  23232.000000\n",
       "SIS User ID                      23251.000000  23251.000000\n",
       "1a                                  -0.024104      0.020248\n",
       "1b                                   0.355214     -0.298380\n",
       "1c                                  -0.109506      0.091985\n",
       "1d                                  -0.126923      0.106615\n",
       "1e                                  -0.084009      0.070568\n",
       "1f                                   0.071275     -0.059871\n",
       "2                                    0.153197     -0.128686\n",
       "3                                   -0.018253      0.015332\n",
       "Column that is randomly blank.            NaN           NaN"
      ]
     },
     "execution_count": 21,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df.groupby(\"Version\").mean().T"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "We can also apply formatting to these strings, by saying we only want three decimal places."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 22,
   "metadata": {
    "cell_id": "70989629-1fe1-4cd2-ac04-af1c2904880f",
    "deepnote_cell_type": "code",
    "deepnote_to_be_reexecuted": false,
    "execution_millis": 4,
    "execution_start": 1646673564555,
    "source_hash": "7e49bc2",
    "tags": []
   },
   "outputs": [
    {
     "data": {
      "text/html": [
       "<div>\n",
       "<style scoped>\n",
       "    .dataframe tbody tr th:only-of-type {\n",
       "        vertical-align: middle;\n",
       "    }\n",
       "\n",
       "    .dataframe tbody tr th {\n",
       "        vertical-align: top;\n",
       "    }\n",
       "\n",
       "    .dataframe thead th {\n",
       "        text-align: right;\n",
       "    }\n",
       "</style>\n",
       "<table border=\"1\" class=\"dataframe\">\n",
       "  <thead>\n",
       "    <tr style=\"text-align: right;\">\n",
       "      <th>Version</th>\n",
       "      <th>a</th>\n",
       "      <th>b</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th>ID</th>\n",
       "      <td>23232.000</td>\n",
       "      <td>23232.000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>SIS User ID</th>\n",
       "      <td>23251.000</td>\n",
       "      <td>23251.000</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1a</th>\n",
       "      <td>-0.024</td>\n",
       "      <td>0.020</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1b</th>\n",
       "      <td>0.355</td>\n",
       "      <td>-0.298</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1c</th>\n",
       "      <td>-0.110</td>\n",
       "      <td>0.092</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1d</th>\n",
       "      <td>-0.127</td>\n",
       "      <td>0.107</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1e</th>\n",
       "      <td>-0.084</td>\n",
       "      <td>0.071</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>1f</th>\n",
       "      <td>0.071</td>\n",
       "      <td>-0.060</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>2</th>\n",
       "      <td>0.153</td>\n",
       "      <td>-0.129</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>3</th>\n",
       "      <td>-0.018</td>\n",
       "      <td>0.015</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th>Column that is randomly blank.</th>\n",
       "      <td>nan</td>\n",
       "      <td>nan</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n",
       "</div>"
      ],
      "text/plain": [
       "Version                                  a          b\n",
       "ID                               23232.000  23232.000\n",
       "SIS User ID                      23251.000  23251.000\n",
       "1a                                  -0.024      0.020\n",
       "1b                                   0.355     -0.298\n",
       "1c                                  -0.110      0.092\n",
       "1d                                  -0.127      0.107\n",
       "1e                                  -0.084      0.071\n",
       "1f                                   0.071     -0.060\n",
       "2                                    0.153     -0.129\n",
       "3                                   -0.018      0.015\n",
       "Column that is randomly blank.         nan        nan"
      ]
     },
     "execution_count": 22,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df.groupby(\"Version\").mean().T.applymap(lambda x: f\"{x:.3f}\")"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "Notice how the 1b value is significantly higher in the \"a\" column than in the \"b\" column.  This is the reason that the \"b\" version of the exam was curved one point more than the \"a\" version."
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "cell_id": "4d07e3ca-2c94-4d1d-8c11-2382edd100d2",
    "deepnote_cell_type": "markdown",
    "tags": []
   },
   "source": [
    "## Worksheet\n",
    "\n",
    "(This worksheet contains some repetition from the portion above.)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 23,
   "metadata": {
    "cell_id": "ed82ba1a-4834-4b57-9d4e-1e8de8eafeb2",
    "deepnote_cell_type": "code",
    "deepnote_to_be_reexecuted": false,
    "execution_millis": 147,
    "execution_start": 1646673564601,
    "source_hash": "c13fed2b",
    "tags": []
   },
   "outputs": [],
   "source": [
    "df = sns.load_dataset(\"taxis\")\n",
    "df.dropna(inplace=True)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "cell_id": "cb70799a-ebd6-43b4-af4f-eb17a16dafc7",
    "deepnote_cell_type": "markdown",
    "tags": []
   },
   "source": [
    "## Practice with pandas groupby\n",
    "\n",
    "We haven't covered pandas groupby in Math 10 before today. This is a possible \"extra topic\" for the course project.\n",
    "\n",
    "Here is an example using `groupby`.  We also use f-strings."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 24,
   "metadata": {
    "cell_id": "33fe5fc3-8e15-474e-8370-ee42638f2fbb",
    "deepnote_cell_type": "code",
    "deepnote_to_be_reexecuted": false,
    "execution_millis": 12,
    "execution_start": 1646673564772,
    "source_hash": "848e885f",
    "tags": []
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "a is Allerton/Pelham Gardens\n",
      "The type of b is <class 'pandas.core.frame.DataFrame'>\n",
      "The shape of b is (2, 14)\n"
     ]
    }
   ],
   "source": [
    "for a,b in df.groupby(\"pickup_zone\"):\n",
    "    print(f\"a is {a}\")\n",
    "    print(f\"The type of b is {type(b)}\")\n",
    "    print(f\"The shape of b is {b.shape}\")\n",
    "    break"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "cell_id": "c12fe168-9097-4e03-bdc4-3a674b5390e8",
    "deepnote_cell_type": "markdown",
    "tags": []
   },
   "source": [
    "If we instead wanted to get the first 5 values, we could do something like the following.  For example, this indicates that 65 rides began in the pickup zone \"Astoria\"."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 25,
   "metadata": {
    "cell_id": "a3daf81e-4c94-4231-8133-89b8982c676c",
    "deepnote_cell_type": "code",
    "deepnote_to_be_reexecuted": false,
    "execution_millis": 11,
    "execution_start": 1646673564773,
    "source_hash": "65003594",
    "tags": []
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "a is Allerton/Pelham Gardens\n",
      "The type of b is <class 'pandas.core.frame.DataFrame'>\n",
      "The shape of b is (2, 14)\n",
      "\n",
      "a is Alphabet City\n",
      "The type of b is <class 'pandas.core.frame.DataFrame'>\n",
      "The shape of b is (9, 14)\n",
      "\n",
      "a is Astoria\n",
      "The type of b is <class 'pandas.core.frame.DataFrame'>\n",
      "The shape of b is (65, 14)\n",
      "\n",
      "a is Auburndale\n",
      "The type of b is <class 'pandas.core.frame.DataFrame'>\n",
      "The shape of b is (1, 14)\n",
      "\n",
      "a is Battery Park\n",
      "The type of b is <class 'pandas.core.frame.DataFrame'>\n",
      "The shape of b is (1, 14)\n",
      "\n"
     ]
    }
   ],
   "source": [
    "counter = 0\n",
    "\n",
    "for a,b in df.groupby(\"pickup_zone\"):\n",
    "    print(f\"a is {a}\")\n",
    "    print(f\"The type of b is {type(b)}\")\n",
    "    print(f\"The shape of b is {b.shape}\")\n",
    "    print(\"\")\n",
    "    counter += 1\n",
    "\n",
    "    if counter >= 5:\n",
    "        break\n"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "cell_id": "5b3adf1c-a957-41a5-9f2b-f34a8d8dc416",
    "deepnote_cell_type": "markdown",
    "tags": []
   },
   "source": [
    "You can also group by multiple categories.  For example, the following indicates that only 4 rides in the dataset began in Bronx and finished in Brooklyn."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 26,
   "metadata": {
    "cell_id": "8aa3c0b8-6d78-4770-b536-72b3ed7e4fa8",
    "deepnote_cell_type": "code",
    "deepnote_to_be_reexecuted": false,
    "execution_millis": 17,
    "execution_start": 1646673564774,
    "source_hash": "5f3c2c2a",
    "tags": []
   },
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "a is ('Bronx', 'Bronx')\n",
      "The type of b is <class 'pandas.core.frame.DataFrame'>\n",
      "The shape of b is (66, 14)\n",
      "\n",
      "a is ('Bronx', 'Brooklyn')\n",
      "The type of b is <class 'pandas.core.frame.DataFrame'>\n",
      "The shape of b is (4, 14)\n",
      "\n",
      "a is ('Bronx', 'Manhattan')\n",
      "The type of b is <class 'pandas.core.frame.DataFrame'>\n",
      "The shape of b is (25, 14)\n",
      "\n",
      "a is ('Bronx', 'Queens')\n",
      "The type of b is <class 'pandas.core.frame.DataFrame'>\n",
      "The shape of b is (4, 14)\n",
      "\n",
      "a is ('Brooklyn', 'Bronx')\n",
      "The type of b is <class 'pandas.core.frame.DataFrame'>\n",
      "The shape of b is (5, 14)\n",
      "\n"
     ]
    }
   ],
   "source": [
    "counter = 0\n",
    "\n",
    "for a,b in df.groupby([\"pickup_borough\",\"dropoff_borough\"]):\n",
    "    print(f\"a is {a}\")\n",
    "    print(f\"The type of b is {type(b)}\")\n",
    "    print(f\"The shape of b is {b.shape}\")\n",
    "    print(\"\")\n",
    "    counter += 1\n",
    "\n",
    "    if counter >= 5:\n",
    "        break"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "cell_id": "a29fa746-705f-450f-b536-95d25bd0f95b",
    "deepnote_cell_type": "markdown",
    "tags": []
   },
   "source": [
    "Sample exercises:\n",
    "\n",
    "1.  For each pickup borough, using f-strings, print the average tip for rides that begin in that borough. \n",
    "\n",
    "2.  Try producing a sub-DataFrame, `df_sub`, which contains only the \"distance\", \"fare\", \"tip\", and \"pickup_zone\" columns, and which contains only rows where the \"tip\" amount is greater than zero.  Then execute `df_sub.groupby(\"pickup_zone\").mean()`.  What information is this providing?\n",
    "\n",
    "3.  Do the same thing as in the previous exercise, but instead find what the maximum was in each category, instead of the average."
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "cell_id": "8d68a4b7-63a8-482d-b5c6-2e3fc674b377",
    "deepnote_cell_type": "markdown",
    "tags": []
   },
   "source": [
    "## Practice with pandas styler\n",
    "\n",
    "We haven't covered pandas styler in Math 10.  This is a possible \"extra topic\" for the course project.\n",
    "\n",
    "Based on the [pandas documentation](https://pandas.pydata.org/pandas-docs/stable/user_guide/style.html#Styler-Functions).\n",
    "\n",
    "As an example, we will color the cells blue for which the \"pickup_zone\" or \"dropoff_zone\" contains the word \"Midtown\"."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 28,
   "metadata": {
    "cell_id": "5fae2fd5-0014-4ebb-b53f-78921ce09964",
    "deepnote_cell_type": "code",
    "deepnote_to_be_reexecuted": false,
    "execution_millis": 5,
    "execution_start": 1646673564786,
    "source_hash": "5388c2f6",
    "tags": []
   },
   "outputs": [],
   "source": [
    "def make_blue(x):\n",
    "    if \"Midtown\" in x:\n",
    "        return 'color:white;background-color:darkblue'\n",
    "    else:\n",
    "        return None"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "cell_id": "d4ce90c8-5cab-46f6-ab65-4cc08da767d7",
    "deepnote_cell_type": "markdown",
    "tags": []
   },
   "source": [
    "You will have to scroll right to see the blue cells.  We only display the first 20 rows."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 30,
   "metadata": {
    "cell_id": "7a8b451d-142f-4676-a5c2-cf5bcffa07e2",
    "deepnote_cell_type": "code",
    "deepnote_to_be_reexecuted": false,
    "execution_millis": 2211,
    "execution_start": 1646673564792,
    "source_hash": "13b6aa31",
    "tags": []
   },
   "outputs": [
    {
     "data": {
      "text/html": [
       "<style type=\"text/css\">\n",
       "#T_5d763_row4_col10, #T_5d763_row5_col11, #T_5d763_row7_col11, #T_5d763_row11_col11, #T_5d763_row16_col10, #T_5d763_row17_col11 {\n",
       "  color: white;\n",
       "  background-color: darkblue;\n",
       "}\n",
       "</style>\n",
       "<table id=\"T_5d763\">\n",
       "  <thead>\n",
       "    <tr>\n",
       "      <th class=\"blank level0\" >&nbsp;</th>\n",
       "      <th id=\"T_5d763_level0_col0\" class=\"col_heading level0 col0\" >pickup</th>\n",
       "      <th id=\"T_5d763_level0_col1\" class=\"col_heading level0 col1\" >dropoff</th>\n",
       "      <th id=\"T_5d763_level0_col2\" class=\"col_heading level0 col2\" >passengers</th>\n",
       "      <th id=\"T_5d763_level0_col3\" class=\"col_heading level0 col3\" >distance</th>\n",
       "      <th id=\"T_5d763_level0_col4\" class=\"col_heading level0 col4\" >fare</th>\n",
       "      <th id=\"T_5d763_level0_col5\" class=\"col_heading level0 col5\" >tip</th>\n",
       "      <th id=\"T_5d763_level0_col6\" class=\"col_heading level0 col6\" >tolls</th>\n",
       "      <th id=\"T_5d763_level0_col7\" class=\"col_heading level0 col7\" >total</th>\n",
       "      <th id=\"T_5d763_level0_col8\" class=\"col_heading level0 col8\" >color</th>\n",
       "      <th id=\"T_5d763_level0_col9\" class=\"col_heading level0 col9\" >payment</th>\n",
       "      <th id=\"T_5d763_level0_col10\" class=\"col_heading level0 col10\" >pickup_zone</th>\n",
       "      <th id=\"T_5d763_level0_col11\" class=\"col_heading level0 col11\" >dropoff_zone</th>\n",
       "      <th id=\"T_5d763_level0_col12\" class=\"col_heading level0 col12\" >pickup_borough</th>\n",
       "      <th id=\"T_5d763_level0_col13\" class=\"col_heading level0 col13\" >dropoff_borough</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th id=\"T_5d763_level0_row0\" class=\"row_heading level0 row0\" >0</th>\n",
       "      <td id=\"T_5d763_row0_col0\" class=\"data row0 col0\" >2019-03-23 20:21:09</td>\n",
       "      <td id=\"T_5d763_row0_col1\" class=\"data row0 col1\" >2019-03-23 20:27:24</td>\n",
       "      <td id=\"T_5d763_row0_col2\" class=\"data row0 col2\" >1</td>\n",
       "      <td id=\"T_5d763_row0_col3\" class=\"data row0 col3\" >1.600000</td>\n",
       "      <td id=\"T_5d763_row0_col4\" class=\"data row0 col4\" >7.000000</td>\n",
       "      <td id=\"T_5d763_row0_col5\" class=\"data row0 col5\" >2.150000</td>\n",
       "      <td id=\"T_5d763_row0_col6\" class=\"data row0 col6\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row0_col7\" class=\"data row0 col7\" >12.950000</td>\n",
       "      <td id=\"T_5d763_row0_col8\" class=\"data row0 col8\" >yellow</td>\n",
       "      <td id=\"T_5d763_row0_col9\" class=\"data row0 col9\" >credit card</td>\n",
       "      <td id=\"T_5d763_row0_col10\" class=\"data row0 col10\" >Lenox Hill West</td>\n",
       "      <td id=\"T_5d763_row0_col11\" class=\"data row0 col11\" >UN/Turtle Bay South</td>\n",
       "      <td id=\"T_5d763_row0_col12\" class=\"data row0 col12\" >Manhattan</td>\n",
       "      <td id=\"T_5d763_row0_col13\" class=\"data row0 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5d763_level0_row1\" class=\"row_heading level0 row1\" >1</th>\n",
       "      <td id=\"T_5d763_row1_col0\" class=\"data row1 col0\" >2019-03-04 16:11:55</td>\n",
       "      <td id=\"T_5d763_row1_col1\" class=\"data row1 col1\" >2019-03-04 16:19:00</td>\n",
       "      <td id=\"T_5d763_row1_col2\" class=\"data row1 col2\" >1</td>\n",
       "      <td id=\"T_5d763_row1_col3\" class=\"data row1 col3\" >0.790000</td>\n",
       "      <td id=\"T_5d763_row1_col4\" class=\"data row1 col4\" >5.000000</td>\n",
       "      <td id=\"T_5d763_row1_col5\" class=\"data row1 col5\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row1_col6\" class=\"data row1 col6\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row1_col7\" class=\"data row1 col7\" >9.300000</td>\n",
       "      <td id=\"T_5d763_row1_col8\" class=\"data row1 col8\" >yellow</td>\n",
       "      <td id=\"T_5d763_row1_col9\" class=\"data row1 col9\" >cash</td>\n",
       "      <td id=\"T_5d763_row1_col10\" class=\"data row1 col10\" >Upper West Side South</td>\n",
       "      <td id=\"T_5d763_row1_col11\" class=\"data row1 col11\" >Upper West Side South</td>\n",
       "      <td id=\"T_5d763_row1_col12\" class=\"data row1 col12\" >Manhattan</td>\n",
       "      <td id=\"T_5d763_row1_col13\" class=\"data row1 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5d763_level0_row2\" class=\"row_heading level0 row2\" >2</th>\n",
       "      <td id=\"T_5d763_row2_col0\" class=\"data row2 col0\" >2019-03-27 17:53:01</td>\n",
       "      <td id=\"T_5d763_row2_col1\" class=\"data row2 col1\" >2019-03-27 18:00:25</td>\n",
       "      <td id=\"T_5d763_row2_col2\" class=\"data row2 col2\" >1</td>\n",
       "      <td id=\"T_5d763_row2_col3\" class=\"data row2 col3\" >1.370000</td>\n",
       "      <td id=\"T_5d763_row2_col4\" class=\"data row2 col4\" >7.500000</td>\n",
       "      <td id=\"T_5d763_row2_col5\" class=\"data row2 col5\" >2.360000</td>\n",
       "      <td id=\"T_5d763_row2_col6\" class=\"data row2 col6\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row2_col7\" class=\"data row2 col7\" >14.160000</td>\n",
       "      <td id=\"T_5d763_row2_col8\" class=\"data row2 col8\" >yellow</td>\n",
       "      <td id=\"T_5d763_row2_col9\" class=\"data row2 col9\" >credit card</td>\n",
       "      <td id=\"T_5d763_row2_col10\" class=\"data row2 col10\" >Alphabet City</td>\n",
       "      <td id=\"T_5d763_row2_col11\" class=\"data row2 col11\" >West Village</td>\n",
       "      <td id=\"T_5d763_row2_col12\" class=\"data row2 col12\" >Manhattan</td>\n",
       "      <td id=\"T_5d763_row2_col13\" class=\"data row2 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5d763_level0_row3\" class=\"row_heading level0 row3\" >3</th>\n",
       "      <td id=\"T_5d763_row3_col0\" class=\"data row3 col0\" >2019-03-10 01:23:59</td>\n",
       "      <td id=\"T_5d763_row3_col1\" class=\"data row3 col1\" >2019-03-10 01:49:51</td>\n",
       "      <td id=\"T_5d763_row3_col2\" class=\"data row3 col2\" >1</td>\n",
       "      <td id=\"T_5d763_row3_col3\" class=\"data row3 col3\" >7.700000</td>\n",
       "      <td id=\"T_5d763_row3_col4\" class=\"data row3 col4\" >27.000000</td>\n",
       "      <td id=\"T_5d763_row3_col5\" class=\"data row3 col5\" >6.150000</td>\n",
       "      <td id=\"T_5d763_row3_col6\" class=\"data row3 col6\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row3_col7\" class=\"data row3 col7\" >36.950000</td>\n",
       "      <td id=\"T_5d763_row3_col8\" class=\"data row3 col8\" >yellow</td>\n",
       "      <td id=\"T_5d763_row3_col9\" class=\"data row3 col9\" >credit card</td>\n",
       "      <td id=\"T_5d763_row3_col10\" class=\"data row3 col10\" >Hudson Sq</td>\n",
       "      <td id=\"T_5d763_row3_col11\" class=\"data row3 col11\" >Yorkville West</td>\n",
       "      <td id=\"T_5d763_row3_col12\" class=\"data row3 col12\" >Manhattan</td>\n",
       "      <td id=\"T_5d763_row3_col13\" class=\"data row3 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5d763_level0_row4\" class=\"row_heading level0 row4\" >4</th>\n",
       "      <td id=\"T_5d763_row4_col0\" class=\"data row4 col0\" >2019-03-30 13:27:42</td>\n",
       "      <td id=\"T_5d763_row4_col1\" class=\"data row4 col1\" >2019-03-30 13:37:14</td>\n",
       "      <td id=\"T_5d763_row4_col2\" class=\"data row4 col2\" >3</td>\n",
       "      <td id=\"T_5d763_row4_col3\" class=\"data row4 col3\" >2.160000</td>\n",
       "      <td id=\"T_5d763_row4_col4\" class=\"data row4 col4\" >9.000000</td>\n",
       "      <td id=\"T_5d763_row4_col5\" class=\"data row4 col5\" >1.100000</td>\n",
       "      <td id=\"T_5d763_row4_col6\" class=\"data row4 col6\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row4_col7\" class=\"data row4 col7\" >13.400000</td>\n",
       "      <td id=\"T_5d763_row4_col8\" class=\"data row4 col8\" >yellow</td>\n",
       "      <td id=\"T_5d763_row4_col9\" class=\"data row4 col9\" >credit card</td>\n",
       "      <td id=\"T_5d763_row4_col10\" class=\"data row4 col10\" >Midtown East</td>\n",
       "      <td id=\"T_5d763_row4_col11\" class=\"data row4 col11\" >Yorkville West</td>\n",
       "      <td id=\"T_5d763_row4_col12\" class=\"data row4 col12\" >Manhattan</td>\n",
       "      <td id=\"T_5d763_row4_col13\" class=\"data row4 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5d763_level0_row5\" class=\"row_heading level0 row5\" >5</th>\n",
       "      <td id=\"T_5d763_row5_col0\" class=\"data row5 col0\" >2019-03-11 10:37:23</td>\n",
       "      <td id=\"T_5d763_row5_col1\" class=\"data row5 col1\" >2019-03-11 10:47:31</td>\n",
       "      <td id=\"T_5d763_row5_col2\" class=\"data row5 col2\" >1</td>\n",
       "      <td id=\"T_5d763_row5_col3\" class=\"data row5 col3\" >0.490000</td>\n",
       "      <td id=\"T_5d763_row5_col4\" class=\"data row5 col4\" >7.500000</td>\n",
       "      <td id=\"T_5d763_row5_col5\" class=\"data row5 col5\" >2.160000</td>\n",
       "      <td id=\"T_5d763_row5_col6\" class=\"data row5 col6\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row5_col7\" class=\"data row5 col7\" >12.960000</td>\n",
       "      <td id=\"T_5d763_row5_col8\" class=\"data row5 col8\" >yellow</td>\n",
       "      <td id=\"T_5d763_row5_col9\" class=\"data row5 col9\" >credit card</td>\n",
       "      <td id=\"T_5d763_row5_col10\" class=\"data row5 col10\" >Times Sq/Theatre District</td>\n",
       "      <td id=\"T_5d763_row5_col11\" class=\"data row5 col11\" >Midtown East</td>\n",
       "      <td id=\"T_5d763_row5_col12\" class=\"data row5 col12\" >Manhattan</td>\n",
       "      <td id=\"T_5d763_row5_col13\" class=\"data row5 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5d763_level0_row6\" class=\"row_heading level0 row6\" >6</th>\n",
       "      <td id=\"T_5d763_row6_col0\" class=\"data row6 col0\" >2019-03-26 21:07:31</td>\n",
       "      <td id=\"T_5d763_row6_col1\" class=\"data row6 col1\" >2019-03-26 21:17:29</td>\n",
       "      <td id=\"T_5d763_row6_col2\" class=\"data row6 col2\" >1</td>\n",
       "      <td id=\"T_5d763_row6_col3\" class=\"data row6 col3\" >3.650000</td>\n",
       "      <td id=\"T_5d763_row6_col4\" class=\"data row6 col4\" >13.000000</td>\n",
       "      <td id=\"T_5d763_row6_col5\" class=\"data row6 col5\" >2.000000</td>\n",
       "      <td id=\"T_5d763_row6_col6\" class=\"data row6 col6\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row6_col7\" class=\"data row6 col7\" >18.800000</td>\n",
       "      <td id=\"T_5d763_row6_col8\" class=\"data row6 col8\" >yellow</td>\n",
       "      <td id=\"T_5d763_row6_col9\" class=\"data row6 col9\" >credit card</td>\n",
       "      <td id=\"T_5d763_row6_col10\" class=\"data row6 col10\" >Battery Park City</td>\n",
       "      <td id=\"T_5d763_row6_col11\" class=\"data row6 col11\" >Two Bridges/Seward Park</td>\n",
       "      <td id=\"T_5d763_row6_col12\" class=\"data row6 col12\" >Manhattan</td>\n",
       "      <td id=\"T_5d763_row6_col13\" class=\"data row6 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5d763_level0_row7\" class=\"row_heading level0 row7\" >8</th>\n",
       "      <td id=\"T_5d763_row7_col0\" class=\"data row7 col0\" >2019-03-23 11:48:50</td>\n",
       "      <td id=\"T_5d763_row7_col1\" class=\"data row7 col1\" >2019-03-23 12:06:14</td>\n",
       "      <td id=\"T_5d763_row7_col2\" class=\"data row7 col2\" >1</td>\n",
       "      <td id=\"T_5d763_row7_col3\" class=\"data row7 col3\" >3.630000</td>\n",
       "      <td id=\"T_5d763_row7_col4\" class=\"data row7 col4\" >15.000000</td>\n",
       "      <td id=\"T_5d763_row7_col5\" class=\"data row7 col5\" >1.000000</td>\n",
       "      <td id=\"T_5d763_row7_col6\" class=\"data row7 col6\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row7_col7\" class=\"data row7 col7\" >19.300000</td>\n",
       "      <td id=\"T_5d763_row7_col8\" class=\"data row7 col8\" >yellow</td>\n",
       "      <td id=\"T_5d763_row7_col9\" class=\"data row7 col9\" >credit card</td>\n",
       "      <td id=\"T_5d763_row7_col10\" class=\"data row7 col10\" >East Harlem South</td>\n",
       "      <td id=\"T_5d763_row7_col11\" class=\"data row7 col11\" >Midtown Center</td>\n",
       "      <td id=\"T_5d763_row7_col12\" class=\"data row7 col12\" >Manhattan</td>\n",
       "      <td id=\"T_5d763_row7_col13\" class=\"data row7 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5d763_level0_row8\" class=\"row_heading level0 row8\" >9</th>\n",
       "      <td id=\"T_5d763_row8_col0\" class=\"data row8 col0\" >2019-03-08 16:18:37</td>\n",
       "      <td id=\"T_5d763_row8_col1\" class=\"data row8 col1\" >2019-03-08 16:26:57</td>\n",
       "      <td id=\"T_5d763_row8_col2\" class=\"data row8 col2\" >1</td>\n",
       "      <td id=\"T_5d763_row8_col3\" class=\"data row8 col3\" >1.520000</td>\n",
       "      <td id=\"T_5d763_row8_col4\" class=\"data row8 col4\" >8.000000</td>\n",
       "      <td id=\"T_5d763_row8_col5\" class=\"data row8 col5\" >1.000000</td>\n",
       "      <td id=\"T_5d763_row8_col6\" class=\"data row8 col6\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row8_col7\" class=\"data row8 col7\" >13.300000</td>\n",
       "      <td id=\"T_5d763_row8_col8\" class=\"data row8 col8\" >yellow</td>\n",
       "      <td id=\"T_5d763_row8_col9\" class=\"data row8 col9\" >credit card</td>\n",
       "      <td id=\"T_5d763_row8_col10\" class=\"data row8 col10\" >Lincoln Square East</td>\n",
       "      <td id=\"T_5d763_row8_col11\" class=\"data row8 col11\" >Central Park</td>\n",
       "      <td id=\"T_5d763_row8_col12\" class=\"data row8 col12\" >Manhattan</td>\n",
       "      <td id=\"T_5d763_row8_col13\" class=\"data row8 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5d763_level0_row9\" class=\"row_heading level0 row9\" >10</th>\n",
       "      <td id=\"T_5d763_row9_col0\" class=\"data row9 col0\" >2019-03-16 10:02:25</td>\n",
       "      <td id=\"T_5d763_row9_col1\" class=\"data row9 col1\" >2019-03-16 10:22:29</td>\n",
       "      <td id=\"T_5d763_row9_col2\" class=\"data row9 col2\" >1</td>\n",
       "      <td id=\"T_5d763_row9_col3\" class=\"data row9 col3\" >3.900000</td>\n",
       "      <td id=\"T_5d763_row9_col4\" class=\"data row9 col4\" >17.000000</td>\n",
       "      <td id=\"T_5d763_row9_col5\" class=\"data row9 col5\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row9_col6\" class=\"data row9 col6\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row9_col7\" class=\"data row9 col7\" >17.800000</td>\n",
       "      <td id=\"T_5d763_row9_col8\" class=\"data row9 col8\" >yellow</td>\n",
       "      <td id=\"T_5d763_row9_col9\" class=\"data row9 col9\" >cash</td>\n",
       "      <td id=\"T_5d763_row9_col10\" class=\"data row9 col10\" >LaGuardia Airport</td>\n",
       "      <td id=\"T_5d763_row9_col11\" class=\"data row9 col11\" >Astoria</td>\n",
       "      <td id=\"T_5d763_row9_col12\" class=\"data row9 col12\" >Queens</td>\n",
       "      <td id=\"T_5d763_row9_col13\" class=\"data row9 col13\" >Queens</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5d763_level0_row10\" class=\"row_heading level0 row10\" >11</th>\n",
       "      <td id=\"T_5d763_row10_col0\" class=\"data row10 col0\" >2019-03-20 19:39:42</td>\n",
       "      <td id=\"T_5d763_row10_col1\" class=\"data row10 col1\" >2019-03-20 19:45:36</td>\n",
       "      <td id=\"T_5d763_row10_col2\" class=\"data row10 col2\" >1</td>\n",
       "      <td id=\"T_5d763_row10_col3\" class=\"data row10 col3\" >1.530000</td>\n",
       "      <td id=\"T_5d763_row10_col4\" class=\"data row10 col4\" >6.500000</td>\n",
       "      <td id=\"T_5d763_row10_col5\" class=\"data row10 col5\" >2.160000</td>\n",
       "      <td id=\"T_5d763_row10_col6\" class=\"data row10 col6\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row10_col7\" class=\"data row10 col7\" >12.960000</td>\n",
       "      <td id=\"T_5d763_row10_col8\" class=\"data row10 col8\" >yellow</td>\n",
       "      <td id=\"T_5d763_row10_col9\" class=\"data row10 col9\" >credit card</td>\n",
       "      <td id=\"T_5d763_row10_col10\" class=\"data row10 col10\" >Upper West Side South</td>\n",
       "      <td id=\"T_5d763_row10_col11\" class=\"data row10 col11\" >Manhattan Valley</td>\n",
       "      <td id=\"T_5d763_row10_col12\" class=\"data row10 col12\" >Manhattan</td>\n",
       "      <td id=\"T_5d763_row10_col13\" class=\"data row10 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5d763_level0_row11\" class=\"row_heading level0 row11\" >12</th>\n",
       "      <td id=\"T_5d763_row11_col0\" class=\"data row11 col0\" >2019-03-18 21:27:14</td>\n",
       "      <td id=\"T_5d763_row11_col1\" class=\"data row11 col1\" >2019-03-18 21:34:16</td>\n",
       "      <td id=\"T_5d763_row11_col2\" class=\"data row11 col2\" >1</td>\n",
       "      <td id=\"T_5d763_row11_col3\" class=\"data row11 col3\" >1.050000</td>\n",
       "      <td id=\"T_5d763_row11_col4\" class=\"data row11 col4\" >6.500000</td>\n",
       "      <td id=\"T_5d763_row11_col5\" class=\"data row11 col5\" >1.000000</td>\n",
       "      <td id=\"T_5d763_row11_col6\" class=\"data row11 col6\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row11_col7\" class=\"data row11 col7\" >11.300000</td>\n",
       "      <td id=\"T_5d763_row11_col8\" class=\"data row11 col8\" >yellow</td>\n",
       "      <td id=\"T_5d763_row11_col9\" class=\"data row11 col9\" >credit card</td>\n",
       "      <td id=\"T_5d763_row11_col10\" class=\"data row11 col10\" >Murray Hill</td>\n",
       "      <td id=\"T_5d763_row11_col11\" class=\"data row11 col11\" >Midtown Center</td>\n",
       "      <td id=\"T_5d763_row11_col12\" class=\"data row11 col12\" >Manhattan</td>\n",
       "      <td id=\"T_5d763_row11_col13\" class=\"data row11 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5d763_level0_row12\" class=\"row_heading level0 row12\" >13</th>\n",
       "      <td id=\"T_5d763_row12_col0\" class=\"data row12 col0\" >2019-03-19 07:55:25</td>\n",
       "      <td id=\"T_5d763_row12_col1\" class=\"data row12 col1\" >2019-03-19 08:09:17</td>\n",
       "      <td id=\"T_5d763_row12_col2\" class=\"data row12 col2\" >1</td>\n",
       "      <td id=\"T_5d763_row12_col3\" class=\"data row12 col3\" >1.750000</td>\n",
       "      <td id=\"T_5d763_row12_col4\" class=\"data row12 col4\" >10.500000</td>\n",
       "      <td id=\"T_5d763_row12_col5\" class=\"data row12 col5\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row12_col6\" class=\"data row12 col6\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row12_col7\" class=\"data row12 col7\" >13.800000</td>\n",
       "      <td id=\"T_5d763_row12_col8\" class=\"data row12 col8\" >yellow</td>\n",
       "      <td id=\"T_5d763_row12_col9\" class=\"data row12 col9\" >cash</td>\n",
       "      <td id=\"T_5d763_row12_col10\" class=\"data row12 col10\" >Lincoln Square West</td>\n",
       "      <td id=\"T_5d763_row12_col11\" class=\"data row12 col11\" >Times Sq/Theatre District</td>\n",
       "      <td id=\"T_5d763_row12_col12\" class=\"data row12 col12\" >Manhattan</td>\n",
       "      <td id=\"T_5d763_row12_col13\" class=\"data row12 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5d763_level0_row13\" class=\"row_heading level0 row13\" >14</th>\n",
       "      <td id=\"T_5d763_row13_col0\" class=\"data row13 col0\" >2019-03-27 12:13:34</td>\n",
       "      <td id=\"T_5d763_row13_col1\" class=\"data row13 col1\" >2019-03-27 12:25:48</td>\n",
       "      <td id=\"T_5d763_row13_col2\" class=\"data row13 col2\" >0</td>\n",
       "      <td id=\"T_5d763_row13_col3\" class=\"data row13 col3\" >2.900000</td>\n",
       "      <td id=\"T_5d763_row13_col4\" class=\"data row13 col4\" >11.500000</td>\n",
       "      <td id=\"T_5d763_row13_col5\" class=\"data row13 col5\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row13_col6\" class=\"data row13 col6\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row13_col7\" class=\"data row13 col7\" >14.800000</td>\n",
       "      <td id=\"T_5d763_row13_col8\" class=\"data row13 col8\" >yellow</td>\n",
       "      <td id=\"T_5d763_row13_col9\" class=\"data row13 col9\" >cash</td>\n",
       "      <td id=\"T_5d763_row13_col10\" class=\"data row13 col10\" >Financial District North</td>\n",
       "      <td id=\"T_5d763_row13_col11\" class=\"data row13 col11\" >Two Bridges/Seward Park</td>\n",
       "      <td id=\"T_5d763_row13_col12\" class=\"data row13 col12\" >Manhattan</td>\n",
       "      <td id=\"T_5d763_row13_col13\" class=\"data row13 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5d763_level0_row14\" class=\"row_heading level0 row14\" >15</th>\n",
       "      <td id=\"T_5d763_row14_col0\" class=\"data row14 col0\" >2019-03-16 17:53:34</td>\n",
       "      <td id=\"T_5d763_row14_col1\" class=\"data row14 col1\" >2019-03-16 18:13:57</td>\n",
       "      <td id=\"T_5d763_row14_col2\" class=\"data row14 col2\" >3</td>\n",
       "      <td id=\"T_5d763_row14_col3\" class=\"data row14 col3\" >2.090000</td>\n",
       "      <td id=\"T_5d763_row14_col4\" class=\"data row14 col4\" >13.500000</td>\n",
       "      <td id=\"T_5d763_row14_col5\" class=\"data row14 col5\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row14_col6\" class=\"data row14 col6\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row14_col7\" class=\"data row14 col7\" >16.800000</td>\n",
       "      <td id=\"T_5d763_row14_col8\" class=\"data row14 col8\" >yellow</td>\n",
       "      <td id=\"T_5d763_row14_col9\" class=\"data row14 col9\" >cash</td>\n",
       "      <td id=\"T_5d763_row14_col10\" class=\"data row14 col10\" >Upper West Side North</td>\n",
       "      <td id=\"T_5d763_row14_col11\" class=\"data row14 col11\" >Clinton East</td>\n",
       "      <td id=\"T_5d763_row14_col12\" class=\"data row14 col12\" >Manhattan</td>\n",
       "      <td id=\"T_5d763_row14_col13\" class=\"data row14 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5d763_level0_row15\" class=\"row_heading level0 row15\" >16</th>\n",
       "      <td id=\"T_5d763_row15_col0\" class=\"data row15 col0\" >2019-03-15 12:36:05</td>\n",
       "      <td id=\"T_5d763_row15_col1\" class=\"data row15 col1\" >2019-03-15 12:54:28</td>\n",
       "      <td id=\"T_5d763_row15_col2\" class=\"data row15 col2\" >1</td>\n",
       "      <td id=\"T_5d763_row15_col3\" class=\"data row15 col3\" >2.120000</td>\n",
       "      <td id=\"T_5d763_row15_col4\" class=\"data row15 col4\" >13.000000</td>\n",
       "      <td id=\"T_5d763_row15_col5\" class=\"data row15 col5\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row15_col6\" class=\"data row15 col6\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row15_col7\" class=\"data row15 col7\" >16.300000</td>\n",
       "      <td id=\"T_5d763_row15_col8\" class=\"data row15 col8\" >yellow</td>\n",
       "      <td id=\"T_5d763_row15_col9\" class=\"data row15 col9\" >cash</td>\n",
       "      <td id=\"T_5d763_row15_col10\" class=\"data row15 col10\" >East Chelsea</td>\n",
       "      <td id=\"T_5d763_row15_col11\" class=\"data row15 col11\" >Meatpacking/West Village West</td>\n",
       "      <td id=\"T_5d763_row15_col12\" class=\"data row15 col12\" >Manhattan</td>\n",
       "      <td id=\"T_5d763_row15_col13\" class=\"data row15 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5d763_level0_row16\" class=\"row_heading level0 row16\" >17</th>\n",
       "      <td id=\"T_5d763_row16_col0\" class=\"data row16 col0\" >2019-03-23 20:50:49</td>\n",
       "      <td id=\"T_5d763_row16_col1\" class=\"data row16 col1\" >2019-03-23 21:02:07</td>\n",
       "      <td id=\"T_5d763_row16_col2\" class=\"data row16 col2\" >1</td>\n",
       "      <td id=\"T_5d763_row16_col3\" class=\"data row16 col3\" >2.600000</td>\n",
       "      <td id=\"T_5d763_row16_col4\" class=\"data row16 col4\" >10.500000</td>\n",
       "      <td id=\"T_5d763_row16_col5\" class=\"data row16 col5\" >2.000000</td>\n",
       "      <td id=\"T_5d763_row16_col6\" class=\"data row16 col6\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row16_col7\" class=\"data row16 col7\" >16.300000</td>\n",
       "      <td id=\"T_5d763_row16_col8\" class=\"data row16 col8\" >yellow</td>\n",
       "      <td id=\"T_5d763_row16_col9\" class=\"data row16 col9\" >credit card</td>\n",
       "      <td id=\"T_5d763_row16_col10\" class=\"data row16 col10\" >Midtown Center</td>\n",
       "      <td id=\"T_5d763_row16_col11\" class=\"data row16 col11\" >East Harlem South</td>\n",
       "      <td id=\"T_5d763_row16_col12\" class=\"data row16 col12\" >Manhattan</td>\n",
       "      <td id=\"T_5d763_row16_col13\" class=\"data row16 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5d763_level0_row17\" class=\"row_heading level0 row17\" >18</th>\n",
       "      <td id=\"T_5d763_row17_col0\" class=\"data row17 col0\" >2019-03-27 06:28:36</td>\n",
       "      <td id=\"T_5d763_row17_col1\" class=\"data row17 col1\" >2019-03-27 06:38:10</td>\n",
       "      <td id=\"T_5d763_row17_col2\" class=\"data row17 col2\" >1</td>\n",
       "      <td id=\"T_5d763_row17_col3\" class=\"data row17 col3\" >2.180000</td>\n",
       "      <td id=\"T_5d763_row17_col4\" class=\"data row17 col4\" >9.500000</td>\n",
       "      <td id=\"T_5d763_row17_col5\" class=\"data row17 col5\" >1.920000</td>\n",
       "      <td id=\"T_5d763_row17_col6\" class=\"data row17 col6\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row17_col7\" class=\"data row17 col7\" >14.720000</td>\n",
       "      <td id=\"T_5d763_row17_col8\" class=\"data row17 col8\" >yellow</td>\n",
       "      <td id=\"T_5d763_row17_col9\" class=\"data row17 col9\" >credit card</td>\n",
       "      <td id=\"T_5d763_row17_col10\" class=\"data row17 col10\" >Gramercy</td>\n",
       "      <td id=\"T_5d763_row17_col11\" class=\"data row17 col11\" >Midtown Center</td>\n",
       "      <td id=\"T_5d763_row17_col12\" class=\"data row17 col12\" >Manhattan</td>\n",
       "      <td id=\"T_5d763_row17_col13\" class=\"data row17 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5d763_level0_row18\" class=\"row_heading level0 row18\" >19</th>\n",
       "      <td id=\"T_5d763_row18_col0\" class=\"data row18 col0\" >2019-03-25 22:04:25</td>\n",
       "      <td id=\"T_5d763_row18_col1\" class=\"data row18 col1\" >2019-03-25 22:11:30</td>\n",
       "      <td id=\"T_5d763_row18_col2\" class=\"data row18 col2\" >6</td>\n",
       "      <td id=\"T_5d763_row18_col3\" class=\"data row18 col3\" >1.080000</td>\n",
       "      <td id=\"T_5d763_row18_col4\" class=\"data row18 col4\" >6.500000</td>\n",
       "      <td id=\"T_5d763_row18_col5\" class=\"data row18 col5\" >1.080000</td>\n",
       "      <td id=\"T_5d763_row18_col6\" class=\"data row18 col6\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row18_col7\" class=\"data row18 col7\" >11.380000</td>\n",
       "      <td id=\"T_5d763_row18_col8\" class=\"data row18 col8\" >yellow</td>\n",
       "      <td id=\"T_5d763_row18_col9\" class=\"data row18 col9\" >credit card</td>\n",
       "      <td id=\"T_5d763_row18_col10\" class=\"data row18 col10\" >East Chelsea</td>\n",
       "      <td id=\"T_5d763_row18_col11\" class=\"data row18 col11\" >East Chelsea</td>\n",
       "      <td id=\"T_5d763_row18_col12\" class=\"data row18 col12\" >Manhattan</td>\n",
       "      <td id=\"T_5d763_row18_col13\" class=\"data row18 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_5d763_level0_row19\" class=\"row_heading level0 row19\" >20</th>\n",
       "      <td id=\"T_5d763_row19_col0\" class=\"data row19 col0\" >2019-03-21 03:37:34</td>\n",
       "      <td id=\"T_5d763_row19_col1\" class=\"data row19 col1\" >2019-03-21 03:44:13</td>\n",
       "      <td id=\"T_5d763_row19_col2\" class=\"data row19 col2\" >1</td>\n",
       "      <td id=\"T_5d763_row19_col3\" class=\"data row19 col3\" >1.070000</td>\n",
       "      <td id=\"T_5d763_row19_col4\" class=\"data row19 col4\" >6.500000</td>\n",
       "      <td id=\"T_5d763_row19_col5\" class=\"data row19 col5\" >1.540000</td>\n",
       "      <td id=\"T_5d763_row19_col6\" class=\"data row19 col6\" >0.000000</td>\n",
       "      <td id=\"T_5d763_row19_col7\" class=\"data row19 col7\" >11.840000</td>\n",
       "      <td id=\"T_5d763_row19_col8\" class=\"data row19 col8\" >yellow</td>\n",
       "      <td id=\"T_5d763_row19_col9\" class=\"data row19 col9\" >credit card</td>\n",
       "      <td id=\"T_5d763_row19_col10\" class=\"data row19 col10\" >Penn Station/Madison Sq West</td>\n",
       "      <td id=\"T_5d763_row19_col11\" class=\"data row19 col11\" >Kips Bay</td>\n",
       "      <td id=\"T_5d763_row19_col12\" class=\"data row19 col12\" >Manhattan</td>\n",
       "      <td id=\"T_5d763_row19_col13\" class=\"data row19 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n"
      ],
      "text/plain": [
       "<pandas.io.formats.style.Styler at 0x7fbd81b98f40>"
      ]
     },
     "execution_count": 30,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df[:20].style.applymap(make_blue,subset=[\"pickup_zone\",\"dropoff_zone\"])"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "cell_id": "bbbd7bf6-c70c-4fd7-8180-a0184f7c470f",
    "deepnote_cell_type": "markdown",
    "tags": []
   },
   "source": [
    "Here is a similar example, but where we color every cell in the row a random color.  Notice the use of f-strings."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 31,
   "metadata": {
    "cell_id": "de9657ba-adca-42e6-90f7-453017dd2092",
    "deepnote_cell_type": "code",
    "deepnote_to_be_reexecuted": false,
    "execution_millis": 59,
    "execution_start": 1646673567522,
    "source_hash": "11e01a88",
    "tags": []
   },
   "outputs": [],
   "source": [
    "rng = np.random.default_rng()\n",
    "color_list = [\"red\",\"purple\",\"orange\",\"wheat\",\"black\",\"blue\"]\n",
    "prop_list = [f'color:white;background-color:{c}' for c in color_list]\n",
    "\n",
    "def find_midtown(row):\n",
    "    if (\"Midtown\" in row[\"dropoff_zone\"]) or (\"Midtown\" in row[\"pickup_zone\"]):\n",
    "        return rng.choice(prop_list, size=len(row))\n",
    "    else:\n",
    "        return [None]*len(row)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 32,
   "metadata": {
    "cell_id": "ef246260-5ba8-488f-8926-a03acb86dfba",
    "deepnote_cell_type": "code",
    "deepnote_to_be_reexecuted": false,
    "execution_millis": 2269,
    "execution_start": 1646673567527,
    "output_cleared": true,
    "source_hash": "870b551a",
    "tags": []
   },
   "outputs": [
    {
     "data": {
      "text/html": [
       "<style type=\"text/css\">\n",
       "#T_d1bd9_row4_col0, #T_d1bd9_row4_col8, #T_d1bd9_row4_col12, #T_d1bd9_row5_col12, #T_d1bd9_row7_col5, #T_d1bd9_row7_col8, #T_d1bd9_row7_col9, #T_d1bd9_row11_col4, #T_d1bd9_row11_col5, #T_d1bd9_row11_col11, #T_d1bd9_row11_col12, #T_d1bd9_row11_col13, #T_d1bd9_row16_col4, #T_d1bd9_row16_col7, #T_d1bd9_row16_col8, #T_d1bd9_row16_col10, #T_d1bd9_row16_col12, #T_d1bd9_row17_col11, #T_d1bd9_row17_col13 {\n",
       "  color: white;\n",
       "  background-color: orange;\n",
       "}\n",
       "#T_d1bd9_row4_col1, #T_d1bd9_row4_col4, #T_d1bd9_row4_col11, #T_d1bd9_row5_col5, #T_d1bd9_row7_col2, #T_d1bd9_row7_col4, #T_d1bd9_row7_col6, #T_d1bd9_row7_col12, #T_d1bd9_row11_col7, #T_d1bd9_row17_col9, #T_d1bd9_row17_col10 {\n",
       "  color: white;\n",
       "  background-color: blue;\n",
       "}\n",
       "#T_d1bd9_row4_col2, #T_d1bd9_row4_col5, #T_d1bd9_row4_col6, #T_d1bd9_row4_col7, #T_d1bd9_row5_col2, #T_d1bd9_row5_col3, #T_d1bd9_row5_col11, #T_d1bd9_row7_col11, #T_d1bd9_row11_col2, #T_d1bd9_row11_col6, #T_d1bd9_row16_col3, #T_d1bd9_row17_col0, #T_d1bd9_row17_col2, #T_d1bd9_row17_col12 {\n",
       "  color: white;\n",
       "  background-color: black;\n",
       "}\n",
       "#T_d1bd9_row4_col3, #T_d1bd9_row5_col4, #T_d1bd9_row5_col6, #T_d1bd9_row5_col8, #T_d1bd9_row5_col10, #T_d1bd9_row7_col3, #T_d1bd9_row7_col13, #T_d1bd9_row11_col9, #T_d1bd9_row16_col1, #T_d1bd9_row16_col5, #T_d1bd9_row16_col6, #T_d1bd9_row16_col9, #T_d1bd9_row16_col13, #T_d1bd9_row17_col4, #T_d1bd9_row17_col5 {\n",
       "  color: white;\n",
       "  background-color: purple;\n",
       "}\n",
       "#T_d1bd9_row4_col9, #T_d1bd9_row4_col13, #T_d1bd9_row5_col0, #T_d1bd9_row5_col9, #T_d1bd9_row5_col13, #T_d1bd9_row7_col0, #T_d1bd9_row7_col1, #T_d1bd9_row7_col7, #T_d1bd9_row11_col1, #T_d1bd9_row11_col3, #T_d1bd9_row17_col1, #T_d1bd9_row17_col3 {\n",
       "  color: white;\n",
       "  background-color: wheat;\n",
       "}\n",
       "#T_d1bd9_row4_col10, #T_d1bd9_row5_col1, #T_d1bd9_row5_col7, #T_d1bd9_row7_col10, #T_d1bd9_row11_col0, #T_d1bd9_row11_col8, #T_d1bd9_row11_col10, #T_d1bd9_row16_col0, #T_d1bd9_row16_col2, #T_d1bd9_row16_col11, #T_d1bd9_row17_col6, #T_d1bd9_row17_col7, #T_d1bd9_row17_col8 {\n",
       "  color: white;\n",
       "  background-color: red;\n",
       "}\n",
       "</style>\n",
       "<table id=\"T_d1bd9\">\n",
       "  <thead>\n",
       "    <tr>\n",
       "      <th class=\"blank level0\" >&nbsp;</th>\n",
       "      <th id=\"T_d1bd9_level0_col0\" class=\"col_heading level0 col0\" >pickup</th>\n",
       "      <th id=\"T_d1bd9_level0_col1\" class=\"col_heading level0 col1\" >dropoff</th>\n",
       "      <th id=\"T_d1bd9_level0_col2\" class=\"col_heading level0 col2\" >passengers</th>\n",
       "      <th id=\"T_d1bd9_level0_col3\" class=\"col_heading level0 col3\" >distance</th>\n",
       "      <th id=\"T_d1bd9_level0_col4\" class=\"col_heading level0 col4\" >fare</th>\n",
       "      <th id=\"T_d1bd9_level0_col5\" class=\"col_heading level0 col5\" >tip</th>\n",
       "      <th id=\"T_d1bd9_level0_col6\" class=\"col_heading level0 col6\" >tolls</th>\n",
       "      <th id=\"T_d1bd9_level0_col7\" class=\"col_heading level0 col7\" >total</th>\n",
       "      <th id=\"T_d1bd9_level0_col8\" class=\"col_heading level0 col8\" >color</th>\n",
       "      <th id=\"T_d1bd9_level0_col9\" class=\"col_heading level0 col9\" >payment</th>\n",
       "      <th id=\"T_d1bd9_level0_col10\" class=\"col_heading level0 col10\" >pickup_zone</th>\n",
       "      <th id=\"T_d1bd9_level0_col11\" class=\"col_heading level0 col11\" >dropoff_zone</th>\n",
       "      <th id=\"T_d1bd9_level0_col12\" class=\"col_heading level0 col12\" >pickup_borough</th>\n",
       "      <th id=\"T_d1bd9_level0_col13\" class=\"col_heading level0 col13\" >dropoff_borough</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <th id=\"T_d1bd9_level0_row0\" class=\"row_heading level0 row0\" >0</th>\n",
       "      <td id=\"T_d1bd9_row0_col0\" class=\"data row0 col0\" >2019-03-23 20:21:09</td>\n",
       "      <td id=\"T_d1bd9_row0_col1\" class=\"data row0 col1\" >2019-03-23 20:27:24</td>\n",
       "      <td id=\"T_d1bd9_row0_col2\" class=\"data row0 col2\" >1</td>\n",
       "      <td id=\"T_d1bd9_row0_col3\" class=\"data row0 col3\" >1.600000</td>\n",
       "      <td id=\"T_d1bd9_row0_col4\" class=\"data row0 col4\" >7.000000</td>\n",
       "      <td id=\"T_d1bd9_row0_col5\" class=\"data row0 col5\" >2.150000</td>\n",
       "      <td id=\"T_d1bd9_row0_col6\" class=\"data row0 col6\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row0_col7\" class=\"data row0 col7\" >12.950000</td>\n",
       "      <td id=\"T_d1bd9_row0_col8\" class=\"data row0 col8\" >yellow</td>\n",
       "      <td id=\"T_d1bd9_row0_col9\" class=\"data row0 col9\" >credit card</td>\n",
       "      <td id=\"T_d1bd9_row0_col10\" class=\"data row0 col10\" >Lenox Hill West</td>\n",
       "      <td id=\"T_d1bd9_row0_col11\" class=\"data row0 col11\" >UN/Turtle Bay South</td>\n",
       "      <td id=\"T_d1bd9_row0_col12\" class=\"data row0 col12\" >Manhattan</td>\n",
       "      <td id=\"T_d1bd9_row0_col13\" class=\"data row0 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_d1bd9_level0_row1\" class=\"row_heading level0 row1\" >1</th>\n",
       "      <td id=\"T_d1bd9_row1_col0\" class=\"data row1 col0\" >2019-03-04 16:11:55</td>\n",
       "      <td id=\"T_d1bd9_row1_col1\" class=\"data row1 col1\" >2019-03-04 16:19:00</td>\n",
       "      <td id=\"T_d1bd9_row1_col2\" class=\"data row1 col2\" >1</td>\n",
       "      <td id=\"T_d1bd9_row1_col3\" class=\"data row1 col3\" >0.790000</td>\n",
       "      <td id=\"T_d1bd9_row1_col4\" class=\"data row1 col4\" >5.000000</td>\n",
       "      <td id=\"T_d1bd9_row1_col5\" class=\"data row1 col5\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row1_col6\" class=\"data row1 col6\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row1_col7\" class=\"data row1 col7\" >9.300000</td>\n",
       "      <td id=\"T_d1bd9_row1_col8\" class=\"data row1 col8\" >yellow</td>\n",
       "      <td id=\"T_d1bd9_row1_col9\" class=\"data row1 col9\" >cash</td>\n",
       "      <td id=\"T_d1bd9_row1_col10\" class=\"data row1 col10\" >Upper West Side South</td>\n",
       "      <td id=\"T_d1bd9_row1_col11\" class=\"data row1 col11\" >Upper West Side South</td>\n",
       "      <td id=\"T_d1bd9_row1_col12\" class=\"data row1 col12\" >Manhattan</td>\n",
       "      <td id=\"T_d1bd9_row1_col13\" class=\"data row1 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_d1bd9_level0_row2\" class=\"row_heading level0 row2\" >2</th>\n",
       "      <td id=\"T_d1bd9_row2_col0\" class=\"data row2 col0\" >2019-03-27 17:53:01</td>\n",
       "      <td id=\"T_d1bd9_row2_col1\" class=\"data row2 col1\" >2019-03-27 18:00:25</td>\n",
       "      <td id=\"T_d1bd9_row2_col2\" class=\"data row2 col2\" >1</td>\n",
       "      <td id=\"T_d1bd9_row2_col3\" class=\"data row2 col3\" >1.370000</td>\n",
       "      <td id=\"T_d1bd9_row2_col4\" class=\"data row2 col4\" >7.500000</td>\n",
       "      <td id=\"T_d1bd9_row2_col5\" class=\"data row2 col5\" >2.360000</td>\n",
       "      <td id=\"T_d1bd9_row2_col6\" class=\"data row2 col6\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row2_col7\" class=\"data row2 col7\" >14.160000</td>\n",
       "      <td id=\"T_d1bd9_row2_col8\" class=\"data row2 col8\" >yellow</td>\n",
       "      <td id=\"T_d1bd9_row2_col9\" class=\"data row2 col9\" >credit card</td>\n",
       "      <td id=\"T_d1bd9_row2_col10\" class=\"data row2 col10\" >Alphabet City</td>\n",
       "      <td id=\"T_d1bd9_row2_col11\" class=\"data row2 col11\" >West Village</td>\n",
       "      <td id=\"T_d1bd9_row2_col12\" class=\"data row2 col12\" >Manhattan</td>\n",
       "      <td id=\"T_d1bd9_row2_col13\" class=\"data row2 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_d1bd9_level0_row3\" class=\"row_heading level0 row3\" >3</th>\n",
       "      <td id=\"T_d1bd9_row3_col0\" class=\"data row3 col0\" >2019-03-10 01:23:59</td>\n",
       "      <td id=\"T_d1bd9_row3_col1\" class=\"data row3 col1\" >2019-03-10 01:49:51</td>\n",
       "      <td id=\"T_d1bd9_row3_col2\" class=\"data row3 col2\" >1</td>\n",
       "      <td id=\"T_d1bd9_row3_col3\" class=\"data row3 col3\" >7.700000</td>\n",
       "      <td id=\"T_d1bd9_row3_col4\" class=\"data row3 col4\" >27.000000</td>\n",
       "      <td id=\"T_d1bd9_row3_col5\" class=\"data row3 col5\" >6.150000</td>\n",
       "      <td id=\"T_d1bd9_row3_col6\" class=\"data row3 col6\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row3_col7\" class=\"data row3 col7\" >36.950000</td>\n",
       "      <td id=\"T_d1bd9_row3_col8\" class=\"data row3 col8\" >yellow</td>\n",
       "      <td id=\"T_d1bd9_row3_col9\" class=\"data row3 col9\" >credit card</td>\n",
       "      <td id=\"T_d1bd9_row3_col10\" class=\"data row3 col10\" >Hudson Sq</td>\n",
       "      <td id=\"T_d1bd9_row3_col11\" class=\"data row3 col11\" >Yorkville West</td>\n",
       "      <td id=\"T_d1bd9_row3_col12\" class=\"data row3 col12\" >Manhattan</td>\n",
       "      <td id=\"T_d1bd9_row3_col13\" class=\"data row3 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_d1bd9_level0_row4\" class=\"row_heading level0 row4\" >4</th>\n",
       "      <td id=\"T_d1bd9_row4_col0\" class=\"data row4 col0\" >2019-03-30 13:27:42</td>\n",
       "      <td id=\"T_d1bd9_row4_col1\" class=\"data row4 col1\" >2019-03-30 13:37:14</td>\n",
       "      <td id=\"T_d1bd9_row4_col2\" class=\"data row4 col2\" >3</td>\n",
       "      <td id=\"T_d1bd9_row4_col3\" class=\"data row4 col3\" >2.160000</td>\n",
       "      <td id=\"T_d1bd9_row4_col4\" class=\"data row4 col4\" >9.000000</td>\n",
       "      <td id=\"T_d1bd9_row4_col5\" class=\"data row4 col5\" >1.100000</td>\n",
       "      <td id=\"T_d1bd9_row4_col6\" class=\"data row4 col6\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row4_col7\" class=\"data row4 col7\" >13.400000</td>\n",
       "      <td id=\"T_d1bd9_row4_col8\" class=\"data row4 col8\" >yellow</td>\n",
       "      <td id=\"T_d1bd9_row4_col9\" class=\"data row4 col9\" >credit card</td>\n",
       "      <td id=\"T_d1bd9_row4_col10\" class=\"data row4 col10\" >Midtown East</td>\n",
       "      <td id=\"T_d1bd9_row4_col11\" class=\"data row4 col11\" >Yorkville West</td>\n",
       "      <td id=\"T_d1bd9_row4_col12\" class=\"data row4 col12\" >Manhattan</td>\n",
       "      <td id=\"T_d1bd9_row4_col13\" class=\"data row4 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_d1bd9_level0_row5\" class=\"row_heading level0 row5\" >5</th>\n",
       "      <td id=\"T_d1bd9_row5_col0\" class=\"data row5 col0\" >2019-03-11 10:37:23</td>\n",
       "      <td id=\"T_d1bd9_row5_col1\" class=\"data row5 col1\" >2019-03-11 10:47:31</td>\n",
       "      <td id=\"T_d1bd9_row5_col2\" class=\"data row5 col2\" >1</td>\n",
       "      <td id=\"T_d1bd9_row5_col3\" class=\"data row5 col3\" >0.490000</td>\n",
       "      <td id=\"T_d1bd9_row5_col4\" class=\"data row5 col4\" >7.500000</td>\n",
       "      <td id=\"T_d1bd9_row5_col5\" class=\"data row5 col5\" >2.160000</td>\n",
       "      <td id=\"T_d1bd9_row5_col6\" class=\"data row5 col6\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row5_col7\" class=\"data row5 col7\" >12.960000</td>\n",
       "      <td id=\"T_d1bd9_row5_col8\" class=\"data row5 col8\" >yellow</td>\n",
       "      <td id=\"T_d1bd9_row5_col9\" class=\"data row5 col9\" >credit card</td>\n",
       "      <td id=\"T_d1bd9_row5_col10\" class=\"data row5 col10\" >Times Sq/Theatre District</td>\n",
       "      <td id=\"T_d1bd9_row5_col11\" class=\"data row5 col11\" >Midtown East</td>\n",
       "      <td id=\"T_d1bd9_row5_col12\" class=\"data row5 col12\" >Manhattan</td>\n",
       "      <td id=\"T_d1bd9_row5_col13\" class=\"data row5 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_d1bd9_level0_row6\" class=\"row_heading level0 row6\" >6</th>\n",
       "      <td id=\"T_d1bd9_row6_col0\" class=\"data row6 col0\" >2019-03-26 21:07:31</td>\n",
       "      <td id=\"T_d1bd9_row6_col1\" class=\"data row6 col1\" >2019-03-26 21:17:29</td>\n",
       "      <td id=\"T_d1bd9_row6_col2\" class=\"data row6 col2\" >1</td>\n",
       "      <td id=\"T_d1bd9_row6_col3\" class=\"data row6 col3\" >3.650000</td>\n",
       "      <td id=\"T_d1bd9_row6_col4\" class=\"data row6 col4\" >13.000000</td>\n",
       "      <td id=\"T_d1bd9_row6_col5\" class=\"data row6 col5\" >2.000000</td>\n",
       "      <td id=\"T_d1bd9_row6_col6\" class=\"data row6 col6\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row6_col7\" class=\"data row6 col7\" >18.800000</td>\n",
       "      <td id=\"T_d1bd9_row6_col8\" class=\"data row6 col8\" >yellow</td>\n",
       "      <td id=\"T_d1bd9_row6_col9\" class=\"data row6 col9\" >credit card</td>\n",
       "      <td id=\"T_d1bd9_row6_col10\" class=\"data row6 col10\" >Battery Park City</td>\n",
       "      <td id=\"T_d1bd9_row6_col11\" class=\"data row6 col11\" >Two Bridges/Seward Park</td>\n",
       "      <td id=\"T_d1bd9_row6_col12\" class=\"data row6 col12\" >Manhattan</td>\n",
       "      <td id=\"T_d1bd9_row6_col13\" class=\"data row6 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_d1bd9_level0_row7\" class=\"row_heading level0 row7\" >8</th>\n",
       "      <td id=\"T_d1bd9_row7_col0\" class=\"data row7 col0\" >2019-03-23 11:48:50</td>\n",
       "      <td id=\"T_d1bd9_row7_col1\" class=\"data row7 col1\" >2019-03-23 12:06:14</td>\n",
       "      <td id=\"T_d1bd9_row7_col2\" class=\"data row7 col2\" >1</td>\n",
       "      <td id=\"T_d1bd9_row7_col3\" class=\"data row7 col3\" >3.630000</td>\n",
       "      <td id=\"T_d1bd9_row7_col4\" class=\"data row7 col4\" >15.000000</td>\n",
       "      <td id=\"T_d1bd9_row7_col5\" class=\"data row7 col5\" >1.000000</td>\n",
       "      <td id=\"T_d1bd9_row7_col6\" class=\"data row7 col6\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row7_col7\" class=\"data row7 col7\" >19.300000</td>\n",
       "      <td id=\"T_d1bd9_row7_col8\" class=\"data row7 col8\" >yellow</td>\n",
       "      <td id=\"T_d1bd9_row7_col9\" class=\"data row7 col9\" >credit card</td>\n",
       "      <td id=\"T_d1bd9_row7_col10\" class=\"data row7 col10\" >East Harlem South</td>\n",
       "      <td id=\"T_d1bd9_row7_col11\" class=\"data row7 col11\" >Midtown Center</td>\n",
       "      <td id=\"T_d1bd9_row7_col12\" class=\"data row7 col12\" >Manhattan</td>\n",
       "      <td id=\"T_d1bd9_row7_col13\" class=\"data row7 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_d1bd9_level0_row8\" class=\"row_heading level0 row8\" >9</th>\n",
       "      <td id=\"T_d1bd9_row8_col0\" class=\"data row8 col0\" >2019-03-08 16:18:37</td>\n",
       "      <td id=\"T_d1bd9_row8_col1\" class=\"data row8 col1\" >2019-03-08 16:26:57</td>\n",
       "      <td id=\"T_d1bd9_row8_col2\" class=\"data row8 col2\" >1</td>\n",
       "      <td id=\"T_d1bd9_row8_col3\" class=\"data row8 col3\" >1.520000</td>\n",
       "      <td id=\"T_d1bd9_row8_col4\" class=\"data row8 col4\" >8.000000</td>\n",
       "      <td id=\"T_d1bd9_row8_col5\" class=\"data row8 col5\" >1.000000</td>\n",
       "      <td id=\"T_d1bd9_row8_col6\" class=\"data row8 col6\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row8_col7\" class=\"data row8 col7\" >13.300000</td>\n",
       "      <td id=\"T_d1bd9_row8_col8\" class=\"data row8 col8\" >yellow</td>\n",
       "      <td id=\"T_d1bd9_row8_col9\" class=\"data row8 col9\" >credit card</td>\n",
       "      <td id=\"T_d1bd9_row8_col10\" class=\"data row8 col10\" >Lincoln Square East</td>\n",
       "      <td id=\"T_d1bd9_row8_col11\" class=\"data row8 col11\" >Central Park</td>\n",
       "      <td id=\"T_d1bd9_row8_col12\" class=\"data row8 col12\" >Manhattan</td>\n",
       "      <td id=\"T_d1bd9_row8_col13\" class=\"data row8 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_d1bd9_level0_row9\" class=\"row_heading level0 row9\" >10</th>\n",
       "      <td id=\"T_d1bd9_row9_col0\" class=\"data row9 col0\" >2019-03-16 10:02:25</td>\n",
       "      <td id=\"T_d1bd9_row9_col1\" class=\"data row9 col1\" >2019-03-16 10:22:29</td>\n",
       "      <td id=\"T_d1bd9_row9_col2\" class=\"data row9 col2\" >1</td>\n",
       "      <td id=\"T_d1bd9_row9_col3\" class=\"data row9 col3\" >3.900000</td>\n",
       "      <td id=\"T_d1bd9_row9_col4\" class=\"data row9 col4\" >17.000000</td>\n",
       "      <td id=\"T_d1bd9_row9_col5\" class=\"data row9 col5\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row9_col6\" class=\"data row9 col6\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row9_col7\" class=\"data row9 col7\" >17.800000</td>\n",
       "      <td id=\"T_d1bd9_row9_col8\" class=\"data row9 col8\" >yellow</td>\n",
       "      <td id=\"T_d1bd9_row9_col9\" class=\"data row9 col9\" >cash</td>\n",
       "      <td id=\"T_d1bd9_row9_col10\" class=\"data row9 col10\" >LaGuardia Airport</td>\n",
       "      <td id=\"T_d1bd9_row9_col11\" class=\"data row9 col11\" >Astoria</td>\n",
       "      <td id=\"T_d1bd9_row9_col12\" class=\"data row9 col12\" >Queens</td>\n",
       "      <td id=\"T_d1bd9_row9_col13\" class=\"data row9 col13\" >Queens</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_d1bd9_level0_row10\" class=\"row_heading level0 row10\" >11</th>\n",
       "      <td id=\"T_d1bd9_row10_col0\" class=\"data row10 col0\" >2019-03-20 19:39:42</td>\n",
       "      <td id=\"T_d1bd9_row10_col1\" class=\"data row10 col1\" >2019-03-20 19:45:36</td>\n",
       "      <td id=\"T_d1bd9_row10_col2\" class=\"data row10 col2\" >1</td>\n",
       "      <td id=\"T_d1bd9_row10_col3\" class=\"data row10 col3\" >1.530000</td>\n",
       "      <td id=\"T_d1bd9_row10_col4\" class=\"data row10 col4\" >6.500000</td>\n",
       "      <td id=\"T_d1bd9_row10_col5\" class=\"data row10 col5\" >2.160000</td>\n",
       "      <td id=\"T_d1bd9_row10_col6\" class=\"data row10 col6\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row10_col7\" class=\"data row10 col7\" >12.960000</td>\n",
       "      <td id=\"T_d1bd9_row10_col8\" class=\"data row10 col8\" >yellow</td>\n",
       "      <td id=\"T_d1bd9_row10_col9\" class=\"data row10 col9\" >credit card</td>\n",
       "      <td id=\"T_d1bd9_row10_col10\" class=\"data row10 col10\" >Upper West Side South</td>\n",
       "      <td id=\"T_d1bd9_row10_col11\" class=\"data row10 col11\" >Manhattan Valley</td>\n",
       "      <td id=\"T_d1bd9_row10_col12\" class=\"data row10 col12\" >Manhattan</td>\n",
       "      <td id=\"T_d1bd9_row10_col13\" class=\"data row10 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_d1bd9_level0_row11\" class=\"row_heading level0 row11\" >12</th>\n",
       "      <td id=\"T_d1bd9_row11_col0\" class=\"data row11 col0\" >2019-03-18 21:27:14</td>\n",
       "      <td id=\"T_d1bd9_row11_col1\" class=\"data row11 col1\" >2019-03-18 21:34:16</td>\n",
       "      <td id=\"T_d1bd9_row11_col2\" class=\"data row11 col2\" >1</td>\n",
       "      <td id=\"T_d1bd9_row11_col3\" class=\"data row11 col3\" >1.050000</td>\n",
       "      <td id=\"T_d1bd9_row11_col4\" class=\"data row11 col4\" >6.500000</td>\n",
       "      <td id=\"T_d1bd9_row11_col5\" class=\"data row11 col5\" >1.000000</td>\n",
       "      <td id=\"T_d1bd9_row11_col6\" class=\"data row11 col6\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row11_col7\" class=\"data row11 col7\" >11.300000</td>\n",
       "      <td id=\"T_d1bd9_row11_col8\" class=\"data row11 col8\" >yellow</td>\n",
       "      <td id=\"T_d1bd9_row11_col9\" class=\"data row11 col9\" >credit card</td>\n",
       "      <td id=\"T_d1bd9_row11_col10\" class=\"data row11 col10\" >Murray Hill</td>\n",
       "      <td id=\"T_d1bd9_row11_col11\" class=\"data row11 col11\" >Midtown Center</td>\n",
       "      <td id=\"T_d1bd9_row11_col12\" class=\"data row11 col12\" >Manhattan</td>\n",
       "      <td id=\"T_d1bd9_row11_col13\" class=\"data row11 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_d1bd9_level0_row12\" class=\"row_heading level0 row12\" >13</th>\n",
       "      <td id=\"T_d1bd9_row12_col0\" class=\"data row12 col0\" >2019-03-19 07:55:25</td>\n",
       "      <td id=\"T_d1bd9_row12_col1\" class=\"data row12 col1\" >2019-03-19 08:09:17</td>\n",
       "      <td id=\"T_d1bd9_row12_col2\" class=\"data row12 col2\" >1</td>\n",
       "      <td id=\"T_d1bd9_row12_col3\" class=\"data row12 col3\" >1.750000</td>\n",
       "      <td id=\"T_d1bd9_row12_col4\" class=\"data row12 col4\" >10.500000</td>\n",
       "      <td id=\"T_d1bd9_row12_col5\" class=\"data row12 col5\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row12_col6\" class=\"data row12 col6\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row12_col7\" class=\"data row12 col7\" >13.800000</td>\n",
       "      <td id=\"T_d1bd9_row12_col8\" class=\"data row12 col8\" >yellow</td>\n",
       "      <td id=\"T_d1bd9_row12_col9\" class=\"data row12 col9\" >cash</td>\n",
       "      <td id=\"T_d1bd9_row12_col10\" class=\"data row12 col10\" >Lincoln Square West</td>\n",
       "      <td id=\"T_d1bd9_row12_col11\" class=\"data row12 col11\" >Times Sq/Theatre District</td>\n",
       "      <td id=\"T_d1bd9_row12_col12\" class=\"data row12 col12\" >Manhattan</td>\n",
       "      <td id=\"T_d1bd9_row12_col13\" class=\"data row12 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_d1bd9_level0_row13\" class=\"row_heading level0 row13\" >14</th>\n",
       "      <td id=\"T_d1bd9_row13_col0\" class=\"data row13 col0\" >2019-03-27 12:13:34</td>\n",
       "      <td id=\"T_d1bd9_row13_col1\" class=\"data row13 col1\" >2019-03-27 12:25:48</td>\n",
       "      <td id=\"T_d1bd9_row13_col2\" class=\"data row13 col2\" >0</td>\n",
       "      <td id=\"T_d1bd9_row13_col3\" class=\"data row13 col3\" >2.900000</td>\n",
       "      <td id=\"T_d1bd9_row13_col4\" class=\"data row13 col4\" >11.500000</td>\n",
       "      <td id=\"T_d1bd9_row13_col5\" class=\"data row13 col5\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row13_col6\" class=\"data row13 col6\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row13_col7\" class=\"data row13 col7\" >14.800000</td>\n",
       "      <td id=\"T_d1bd9_row13_col8\" class=\"data row13 col8\" >yellow</td>\n",
       "      <td id=\"T_d1bd9_row13_col9\" class=\"data row13 col9\" >cash</td>\n",
       "      <td id=\"T_d1bd9_row13_col10\" class=\"data row13 col10\" >Financial District North</td>\n",
       "      <td id=\"T_d1bd9_row13_col11\" class=\"data row13 col11\" >Two Bridges/Seward Park</td>\n",
       "      <td id=\"T_d1bd9_row13_col12\" class=\"data row13 col12\" >Manhattan</td>\n",
       "      <td id=\"T_d1bd9_row13_col13\" class=\"data row13 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_d1bd9_level0_row14\" class=\"row_heading level0 row14\" >15</th>\n",
       "      <td id=\"T_d1bd9_row14_col0\" class=\"data row14 col0\" >2019-03-16 17:53:34</td>\n",
       "      <td id=\"T_d1bd9_row14_col1\" class=\"data row14 col1\" >2019-03-16 18:13:57</td>\n",
       "      <td id=\"T_d1bd9_row14_col2\" class=\"data row14 col2\" >3</td>\n",
       "      <td id=\"T_d1bd9_row14_col3\" class=\"data row14 col3\" >2.090000</td>\n",
       "      <td id=\"T_d1bd9_row14_col4\" class=\"data row14 col4\" >13.500000</td>\n",
       "      <td id=\"T_d1bd9_row14_col5\" class=\"data row14 col5\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row14_col6\" class=\"data row14 col6\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row14_col7\" class=\"data row14 col7\" >16.800000</td>\n",
       "      <td id=\"T_d1bd9_row14_col8\" class=\"data row14 col8\" >yellow</td>\n",
       "      <td id=\"T_d1bd9_row14_col9\" class=\"data row14 col9\" >cash</td>\n",
       "      <td id=\"T_d1bd9_row14_col10\" class=\"data row14 col10\" >Upper West Side North</td>\n",
       "      <td id=\"T_d1bd9_row14_col11\" class=\"data row14 col11\" >Clinton East</td>\n",
       "      <td id=\"T_d1bd9_row14_col12\" class=\"data row14 col12\" >Manhattan</td>\n",
       "      <td id=\"T_d1bd9_row14_col13\" class=\"data row14 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_d1bd9_level0_row15\" class=\"row_heading level0 row15\" >16</th>\n",
       "      <td id=\"T_d1bd9_row15_col0\" class=\"data row15 col0\" >2019-03-15 12:36:05</td>\n",
       "      <td id=\"T_d1bd9_row15_col1\" class=\"data row15 col1\" >2019-03-15 12:54:28</td>\n",
       "      <td id=\"T_d1bd9_row15_col2\" class=\"data row15 col2\" >1</td>\n",
       "      <td id=\"T_d1bd9_row15_col3\" class=\"data row15 col3\" >2.120000</td>\n",
       "      <td id=\"T_d1bd9_row15_col4\" class=\"data row15 col4\" >13.000000</td>\n",
       "      <td id=\"T_d1bd9_row15_col5\" class=\"data row15 col5\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row15_col6\" class=\"data row15 col6\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row15_col7\" class=\"data row15 col7\" >16.300000</td>\n",
       "      <td id=\"T_d1bd9_row15_col8\" class=\"data row15 col8\" >yellow</td>\n",
       "      <td id=\"T_d1bd9_row15_col9\" class=\"data row15 col9\" >cash</td>\n",
       "      <td id=\"T_d1bd9_row15_col10\" class=\"data row15 col10\" >East Chelsea</td>\n",
       "      <td id=\"T_d1bd9_row15_col11\" class=\"data row15 col11\" >Meatpacking/West Village West</td>\n",
       "      <td id=\"T_d1bd9_row15_col12\" class=\"data row15 col12\" >Manhattan</td>\n",
       "      <td id=\"T_d1bd9_row15_col13\" class=\"data row15 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_d1bd9_level0_row16\" class=\"row_heading level0 row16\" >17</th>\n",
       "      <td id=\"T_d1bd9_row16_col0\" class=\"data row16 col0\" >2019-03-23 20:50:49</td>\n",
       "      <td id=\"T_d1bd9_row16_col1\" class=\"data row16 col1\" >2019-03-23 21:02:07</td>\n",
       "      <td id=\"T_d1bd9_row16_col2\" class=\"data row16 col2\" >1</td>\n",
       "      <td id=\"T_d1bd9_row16_col3\" class=\"data row16 col3\" >2.600000</td>\n",
       "      <td id=\"T_d1bd9_row16_col4\" class=\"data row16 col4\" >10.500000</td>\n",
       "      <td id=\"T_d1bd9_row16_col5\" class=\"data row16 col5\" >2.000000</td>\n",
       "      <td id=\"T_d1bd9_row16_col6\" class=\"data row16 col6\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row16_col7\" class=\"data row16 col7\" >16.300000</td>\n",
       "      <td id=\"T_d1bd9_row16_col8\" class=\"data row16 col8\" >yellow</td>\n",
       "      <td id=\"T_d1bd9_row16_col9\" class=\"data row16 col9\" >credit card</td>\n",
       "      <td id=\"T_d1bd9_row16_col10\" class=\"data row16 col10\" >Midtown Center</td>\n",
       "      <td id=\"T_d1bd9_row16_col11\" class=\"data row16 col11\" >East Harlem South</td>\n",
       "      <td id=\"T_d1bd9_row16_col12\" class=\"data row16 col12\" >Manhattan</td>\n",
       "      <td id=\"T_d1bd9_row16_col13\" class=\"data row16 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_d1bd9_level0_row17\" class=\"row_heading level0 row17\" >18</th>\n",
       "      <td id=\"T_d1bd9_row17_col0\" class=\"data row17 col0\" >2019-03-27 06:28:36</td>\n",
       "      <td id=\"T_d1bd9_row17_col1\" class=\"data row17 col1\" >2019-03-27 06:38:10</td>\n",
       "      <td id=\"T_d1bd9_row17_col2\" class=\"data row17 col2\" >1</td>\n",
       "      <td id=\"T_d1bd9_row17_col3\" class=\"data row17 col3\" >2.180000</td>\n",
       "      <td id=\"T_d1bd9_row17_col4\" class=\"data row17 col4\" >9.500000</td>\n",
       "      <td id=\"T_d1bd9_row17_col5\" class=\"data row17 col5\" >1.920000</td>\n",
       "      <td id=\"T_d1bd9_row17_col6\" class=\"data row17 col6\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row17_col7\" class=\"data row17 col7\" >14.720000</td>\n",
       "      <td id=\"T_d1bd9_row17_col8\" class=\"data row17 col8\" >yellow</td>\n",
       "      <td id=\"T_d1bd9_row17_col9\" class=\"data row17 col9\" >credit card</td>\n",
       "      <td id=\"T_d1bd9_row17_col10\" class=\"data row17 col10\" >Gramercy</td>\n",
       "      <td id=\"T_d1bd9_row17_col11\" class=\"data row17 col11\" >Midtown Center</td>\n",
       "      <td id=\"T_d1bd9_row17_col12\" class=\"data row17 col12\" >Manhattan</td>\n",
       "      <td id=\"T_d1bd9_row17_col13\" class=\"data row17 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_d1bd9_level0_row18\" class=\"row_heading level0 row18\" >19</th>\n",
       "      <td id=\"T_d1bd9_row18_col0\" class=\"data row18 col0\" >2019-03-25 22:04:25</td>\n",
       "      <td id=\"T_d1bd9_row18_col1\" class=\"data row18 col1\" >2019-03-25 22:11:30</td>\n",
       "      <td id=\"T_d1bd9_row18_col2\" class=\"data row18 col2\" >6</td>\n",
       "      <td id=\"T_d1bd9_row18_col3\" class=\"data row18 col3\" >1.080000</td>\n",
       "      <td id=\"T_d1bd9_row18_col4\" class=\"data row18 col4\" >6.500000</td>\n",
       "      <td id=\"T_d1bd9_row18_col5\" class=\"data row18 col5\" >1.080000</td>\n",
       "      <td id=\"T_d1bd9_row18_col6\" class=\"data row18 col6\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row18_col7\" class=\"data row18 col7\" >11.380000</td>\n",
       "      <td id=\"T_d1bd9_row18_col8\" class=\"data row18 col8\" >yellow</td>\n",
       "      <td id=\"T_d1bd9_row18_col9\" class=\"data row18 col9\" >credit card</td>\n",
       "      <td id=\"T_d1bd9_row18_col10\" class=\"data row18 col10\" >East Chelsea</td>\n",
       "      <td id=\"T_d1bd9_row18_col11\" class=\"data row18 col11\" >East Chelsea</td>\n",
       "      <td id=\"T_d1bd9_row18_col12\" class=\"data row18 col12\" >Manhattan</td>\n",
       "      <td id=\"T_d1bd9_row18_col13\" class=\"data row18 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <th id=\"T_d1bd9_level0_row19\" class=\"row_heading level0 row19\" >20</th>\n",
       "      <td id=\"T_d1bd9_row19_col0\" class=\"data row19 col0\" >2019-03-21 03:37:34</td>\n",
       "      <td id=\"T_d1bd9_row19_col1\" class=\"data row19 col1\" >2019-03-21 03:44:13</td>\n",
       "      <td id=\"T_d1bd9_row19_col2\" class=\"data row19 col2\" >1</td>\n",
       "      <td id=\"T_d1bd9_row19_col3\" class=\"data row19 col3\" >1.070000</td>\n",
       "      <td id=\"T_d1bd9_row19_col4\" class=\"data row19 col4\" >6.500000</td>\n",
       "      <td id=\"T_d1bd9_row19_col5\" class=\"data row19 col5\" >1.540000</td>\n",
       "      <td id=\"T_d1bd9_row19_col6\" class=\"data row19 col6\" >0.000000</td>\n",
       "      <td id=\"T_d1bd9_row19_col7\" class=\"data row19 col7\" >11.840000</td>\n",
       "      <td id=\"T_d1bd9_row19_col8\" class=\"data row19 col8\" >yellow</td>\n",
       "      <td id=\"T_d1bd9_row19_col9\" class=\"data row19 col9\" >credit card</td>\n",
       "      <td id=\"T_d1bd9_row19_col10\" class=\"data row19 col10\" >Penn Station/Madison Sq West</td>\n",
       "      <td id=\"T_d1bd9_row19_col11\" class=\"data row19 col11\" >Kips Bay</td>\n",
       "      <td id=\"T_d1bd9_row19_col12\" class=\"data row19 col12\" >Manhattan</td>\n",
       "      <td id=\"T_d1bd9_row19_col13\" class=\"data row19 col13\" >Manhattan</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n"
      ],
      "text/plain": [
       "<pandas.io.formats.style.Styler at 0x7fbd634f6a60>"
      ]
     },
     "execution_count": 32,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "df[:20].style.apply(find_midtown,axis=1)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {
    "cell_id": "d69bd3f9-803d-474a-89d4-f85fc332c977",
    "deepnote_cell_type": "markdown",
    "tags": []
   },
   "source": [
    "pandas styler sample exercises:\n",
    "\n",
    "1.  Try changing the text color to red on all rides where the fare was at least 10 dollars.\n",
    "\n",
    "2.  For all cells where the pickup time is between 11pm and midnight, try giving those cells a black background with white text.\n",
    "\n",
    "3.  For how many rides was the tip amount greater than 40% of the fare?  Try coloring the entire row for those rides in red."
   ]
  }
 ],
 "metadata": {
  "deepnote": {
   "is_reactive": false
  },
  "deepnote_execution_queue": [],
  "deepnote_notebook_id": "12e1f49e-fe81-4953-ab05-c27d9551969f",
  "kernelspec": {
   "display_name": "Python 3 (ipykernel)",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.8.12"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 4
}