Entrées/Sorties
Echantillons/Données
Dans votre jeu de données, maplearn distingue :
- les échantillons, pour lesquels vous disposez d'une
connaissance totale
- les autres données, sur lesquelles vous recherchez à
obtenir une information (prédiction)
Formats
maplearn peut utiliser des données :
- Tabulaires : fichiers au format csv, xls et xlsx
- Images : fichiers au format Tiff
- Vectorielles : fichiers de forme (shapefile)
Attributs
Les attributs correspondent classiquement aux colonnes de vos données
tabulaires et vectorielles (ou aux bandes si il s'agit d'images). En
machine learning, on distingue les features (ou variables
prédictives) des labels (ou variable à prédire).
maplearn permet de préciser :
- label_id : nom de la colonne correspondant aux labels,
sous forme de code numérique
- label_id : nom de la colonne correspondant aux labels,
sous forme de texte
- features : liste des features (séparée par des ";") à
utiliser pour la prédiction. Toutes les colonnes restantes seront utilisées
si vous n'indiquez rien
Sortie
Lors de son exécution, maplearn générera un rapport standardisé
décrivant les taches réalisées et les statistiques obtenues. Ce rapport sera
disponible dans le dossier que vous aurez indiqué.