Yellow Traduction est une application web permettant de traduire grâce au deep learning des documents PDF volumineux. Il est conçu pour les fichiers trop lourds ou trop longs pour être traduits par les solutions en ligne classique.
L'objectif est de rendre la traduction de documents aussi simple et rapide que possible, tout en maintenant une haute qualité de traduction.
- Conversion rapide de documentation technique pour des projets internationaux
- Professionnels et entreprises ayant besoin de traduire rapidement des documents
- Étudiants ayant besoin de traduire rapidement des documents
- Développeurs intéressés par des solutions d'automatisation de traduction
- Interface Streamlit intuitive
- Upload de documents PDF
- Sélection de la langue de destination
- Traduction automatique de documents
- Préservation du formatage
- ToDo :
Support de multiples langues
- Scripts de traitement par lot
- Traduction multithread pour optimiser les performances(*)
- ToDo :
Support des gros volumes de documents
*Le multithread est désactivé pour Streamlit Cloud et est uniquement disponible en local.
Le fichier streamlit_app.py implémente l’interface Streamlit décrite ci-dessus.
- L'utilisateur charge un document PDF par l'interface Streamlit ou via script
- Le document est analysé et préparé pour la traduction
- Le moteur de traduction traite le contenu
- Extraction du texte du PDF
- Traduction des éléments textuels
- Reconstruction du document avec les éléments traduits
- Le document traduit est retourné à l'utilisateur
Yellow Traduction/
├── .github/
├── dashboard/
│ ├── Dockerfile
│ ├── requirements.txt
│ └── streamlit_app.py
├── docs/
│ └── images/Capture.png
├── scripts/
│ ├── Traduction_PDF_multicore.ipynb
│ └── Traduction_PDF.ipynb
├── CHANGELOG.md
├── LICENSE.md
├── CODE_OF_CONDUCT.md
├── CONTRIBUTING.md
├── SECURITY.md
└── ACKNOWLEDGEMENTS.md
Le projet est prévu pour être déployé :
- Via Docker pour une containerisation simple et reproductible
$ docker build -t streamlit-dashboard .
$ docker run -p 8501:8501 streamlit-dashboard- Directement sur serveur en exécutant l'application Streamlit
$ streamlit run streamlit_app.py - Python ≥ 3.13.5
- Dépendances listées dans
requirements.txt
- 🔬 Statut : expérimental
- 🧭 Roadmap : à définir
- Voir LICENSE.md
- Voir CONTRIBUTING.md
- Code de conduite disponible dans CODE_OF_CONDUCT.md
Gauthier RAMMAULT
