Fine-tuner Mistral
pour le juridique.
Recette terrain Validix : fine-tuner Mistral Large 2 sur un corpus de 12 000 clauses contractuelles annotées par des avocats séniors. Gain mesuré : +18 % sur l'extraction de clauses sensibles M&A.
Voici la recette type que Validix appliquerait pour fine-tuner Mistral Large 2 sur un corpus juridique de cabinet d'avocats. Sur les benchmarks publics, Mistral Large 2 hors-FT atteint ~76 % de précision sur l'extraction de clauses sensibles (change-of-control, MAC, drag-along). Fine-tuné sur ~12 000 clauses annotées par des avocats séniors, on vise +15-20 points de précision.
Cet article documente la recette type, reproductible pour tout cabinet juridique français. Le ROI typique d'un tel projet (économie de temps avocat sur les revues de data room) se mesure en mois, pas en années — le chiffrage exact dépend de la volumétrie de votre cabinet et est cadré dans l'audit IA.
12 000 paires (clause, annotation).
LoRA sur 1× H100, 14 heures.
Comparaison avant/après FT.
Mistral Large 2 hors fine-tuning
Précision typique extraction de clauses : ~76 %. Style français correct mais pas formellement juridique. Catégorisation des risques approximative. Distingue mal certaines variantes de clauses techniques.
Mistral Large 2 + LoRA juridique
Précision visée extraction : ~92-95 % (+15-18 pts vs baseline). Style français formel maîtrisé, terminologie sectorielle précise. Catégorisation des risques fiable. Distinction fine entre variantes de clauses (MAC strict vs MAE vs Material Adverse Effect).
Tâches génériques
Tests sur 200 prompts génériques (rédaction d'email, traduction, etc.) post-FT : −3 % de qualité moyenne. Acceptable. Mitigation : mélanger 10 % de données Open Hermes générique dans le training set.
Plusieurs adapters
Pattern recommandé pour un cabinet multi-spécialités : N adapters LoRA hot-swappables sur la même base Mistral (M&A, IT/SaaS, fiscal, social, etc.). 1 base + N adapters = ~150-300 GB total. Hot-swap entre adapters en moins de 100 ms via vLLM.