collages#
à télécharger
pour réaliser ce TP localement sur votre ordi, commencez par télécharger le zip
import pandas as pd
simple critère#
on a trois fichiers à recoller
df1 = pd.read_csv('data/collages1.csv')
df1
| name | age | height | sex | |
|---|---|---|---|---|
| 0 | alice | 10 | 125 | female |
| 1 | bob | 12 | 135 | male |
| 2 | eve | 13 | 140 | female |
df2 = pd.read_csv('data/collages2.csv')
df2
| name | grade | |
|---|---|---|
| 0 | bob | 12 |
| 1 | alice | 14 |
| 2 | eve | 16 |
df3 = pd.read_csv('data/collages3.csv')
df3
| name | age | grade | height | sex | |
|---|---|---|---|---|---|
| 0 | daniel | 18 | 10 | 180 | male |
| 1 | chloe | 20 | 20 | 173 | female |
comment vous feriez pour recoller les morceaux ? il s’agit d’obtenir une dataframe de 5 élèves et 4 caractéristiques
on peut envisager deux versions de l’exercice, selon qu’on choisit ou non d’indexer selon le prénom
sans index#
# à vous
avec index#
dans un premier temps, pour chacune des trois tables, adoptez la colonne name comme index;
puis recollez les morceaux comme dans le premier exercice
# à vous
multiples critères#
même idée, mais on n’a plus unicité des prénoms
m1 = pd.read_csv("data/multi1.csv")
m1
| prenom | nom | age | height | sex | |
|---|---|---|---|---|---|
| 0 | alice | Dupont | 10 | 125 | female |
| 1 | bob | Doe | 12 | 135 | male |
| 2 | alice | Durand | 13 | 140 | female |
m2 = pd.read_csv("data/multi2.csv")
m2
| first_name | last_name | grade | |
|---|---|---|---|
| 0 | bob | Doe | 12 |
| 1 | alice | Dupont | 14 |
| 2 | alice | Durand | 16 |
m3 = pd.read_csv("data/multi3.csv")
m3
| first | last | age | grade | height | sex | |
|---|---|---|---|---|---|---|
| 0 | daniel | Doe | 18 | 10 | 180 | male |
| 1 | chloe | Martin | 20 | 20 | 173 | female |
# à vous - c'est vous qui décidez comment gérer les index
# juste, à la fin on voudrait un index "raisonnable"