FormRecognizer-SuperPointOCR est une solution avancée conçue pour optimiser et évaluer le traitement de formulaires à travers diverses techniques OCR (Reconnaissance Optique de Caractères). Ce projet intègre des technologies de pointe telles que Superpoint pour la détection de caractéristiques et supporte plusieurs moteurs OCR pour permettre des benchmarks comparatifs et des analyses de performance.
- Python 3.9+
- [Optionnel] Environnement virtuel tel que Conda ou venv
- Clonez le dépôt :
git clone [URL_DU_REPO]
- Installez les dépendances :
pip install -r requirements.txt
Le script principal run.py peut être utilisé pour effectuer des opérations de prétraitement et d'inférence. Les commandes disponibles sont les suivantes :
Pour lancer le prétraitement :
python run.py -preprocess <chemin_vers_donnees> [--force]
Pour réaliser une inférence sur un fichier ou plusieurs formulaires à partir d'un fichier Excel :
- Sur un fichier :
python run.py -inference_file <chemin_vers_fichier> [-nb_ocr <nombre>] [-benchmark]
- A partir d'un fichier Excel :
python run.py -inference_excel [-nb_files <nombre>] [-nb_ocr <nombre>] [-ocr <google|trocr>] [-benchmark]