La reconnaissance des schémas nécessite un « apprentissage » du système pour fournir des résultats précis. L'apprentissage est la phase la plus critique pour déterminer les performances du système en fonction des données qui lui sont fournies. Pour le processus d'apprentissage, l'ensemble de données complet se divise en deux ensembles. Le premier ensemble est l'ensemble d'entraînement utilisé pour créer et entraîner le modèle. Le deuxième ensemble, l'ensemble de test, est utilisé pour tester le modèle et vérifier qu'il produit la sortie correcte. En général, l'ensemble d'apprentissage comprend 80 % des données et l'ensemble de test les 20 % restants.