Nouveau correcteur orthographique français! ~ New French speller!
[English follows]
Que vous soyez originaire du Maroc, du Congo, de Belgique, du Canada, de Suisse, de France ou de tout autre pays francophone, si vous aimez la langue française et si vous utilisez votre ordinateur pour écrire en français, ce qui suit va vous intéresser (et vous impressionner).
Le 12 avril 2005, Microsoft a mis à la disposition de ses utilisateurs une nouvelle version de son correcteur orthographique et de son thésaurus. Cette version gratuite prend en compte l’ensemble de la réforme de l’orthographe de 1990 et offre un lexique entièrement mis à jour. Elle fournit une interface-utilisateur séparée (téléchargeable ici) qui est nécessaire pour changer les paramètres du correcteur (reconnaître uniquement l’orthographe traditionnelle, reconnaitre uniquement l’orthographe rectifiée ou accepter les deux (valeur par défaut)). Toutes ces mises à jour sont à présent disponibles et peuvent être téléchargées depuis les articles de la base de connaissances ci-dessous ou à partir du site d’Office update.
Mise à jour pour le vérificateur d'orthographe Project 2003 français (KB892262)
Note: Il est important de télécharger la nouvelle interface-utilisateur pour pouvoir modifier les paramètres du correcteur et du thésaurus. Cette boite de dialogue peut être téléchargée ici: Paramètres de vérificateur d'orthographe et de dictionnaire des synonymes français. Vous trouverez également le lien dans les articles de la Base de connaissances mentionnés ci-dessus.
============================================================
Whether you are from Morocco, The Congo , Belgium, Canada, Switzerland, France, or any other French-speaking country around the world, if you love French language and if you use your computer to write in French, you are going to be very interested in (and impressed with) our new release.
On April 12 Microsoft released to the web a new version of the speller and thesaurus for Office 2003. This free version fully covers the 1990 spelling reform with an extensive update of the lexicon. It provides a separate user interface, (downloadable separately here) that is required to choose between the different settings (old spelling, new spelling, or a combination of the two (default value)). All these updates are now live and available for download from the KB articles linked below or via the Office update site:
Update for Office 2003 French Spelling Checker and Thesaurus (KB892258)
Update for Office 2003 Proofing Tools: French Spelling Checker and Thesaurus (KB892258)
Update for Project 2003 French Spelling Checker (KB892262)
Update for Visio 2003 French Spelling Checker and Thesaurus (KB892293)
Note: It is important to download the new user interface for Speller and Thesaurus Settings; it is an extra Add-in found here: French Spelling Checker and Thesaurus Settings. You also find its link in the KB articles mentioned above.
Comments
- Anonymous
April 13, 2005
Bonjour, s'agit-il d'une reprise des travaux effectués en France sous l'égide la société MENDEZ pour l'élaboration d'un dictionnaire de Français sous la direction d'Héloïse NEFS ?
Meilleures salutations - Anonymous
April 14, 2005
La liste des mots de ce dictionnaire produit pour l'encyclopédie Encarta a été réutilisée pour le nouveau correcteur orthographique, effectivement, mais la couverture est beaucoup plus grande (un correcteur orthographique contient beaucoup plus de mots qu'un dictionnaire monolingue comme celui d'Encarta).
Bien à vous,
Thierry Fontenelle [MSFT] - Anonymous
April 21, 2005
Bonjour ;
Félicitation. Mais comme je n'ai pas encore office 2003, je n'ai pas pu tester votre nouveau correcteur. Est-ce que vous pouvez avoir l'obligeance de lui soumettre, pour moi, la phrase ci-après que j'ai recopiée du site français du groupe word : "L'option par défaut est d'accepter les deux orthographes, ce qui
respecte l'esprit de la réforme et la recommandation de l'Académie française voulant qu'aucune de ces formes ne peut être tenue pour fautive." Est ce qu'on ne devait pas plutôt dire : "... ne puisse être tenu..." ?
PS : l'adresse du site en question est :
http://groups.google.com/groups?num=25&hl=fr&lr=&group=microsoft.public.fr.word&start=150
Bon courage. - Anonymous
April 21, 2005
Bonjour,
Vous avez raison de le souligner, "peut" devrait être corrigé en "puisse". C'est le correcteur grammatical qui est responsable de ce manquement. Hors contexte, la graphie "peut" est valide en français, le correcteur orthographique n'y voit donc pas d'erreur.
NB: Word utilise des couleurs pour distinguer les erreurs grammaticales (soulignées en vert) des erreurs d'orthographe (soulignées en rouge).
Exemple d'erreur corrigée par le correcteur grammatical: je mange des pomme.
Exemple d'erreur corrigée par le correcteur orthographique: je mange des pommmes.
Bien à vous, - Anonymous
April 22, 2005
The comment has been removed - Anonymous
May 03, 2005
Does this update fit with the czech version of MS Office which is delivered without French Spelling Checker?
If not what to do to add the French Spelling Checker to the Office?
Thank you. - Anonymous
May 04, 2005
HI,
This update can be downloaded to any computer with MS Office 2003 that has already a French Spelling Checker; this is applicable not only to French versions of Office but to what is call companion languages, like English, German, Spanish, Arabic, etc. I don't think the Czech version of Office ships with French as companion language. The alternative is to buy the Proofing Tools Kit, install French speller in the PTK, and then download the update. See more information on where to get the Proofing Tools Kit here:
http://www.microsoft.com/PRODUCTS/info/product.aspx?view=22&pcid=071b9ced-ed82-47ef-b5fa-a42ecbdec9b7&type=ovr
Once you do that, don't forget to download as well the new addin for the user interface, which enables switching between spelling reform options: http://www.microsoft.com/downloads/details.aspx?FamilyId=7C3B16CF-45F3-4C24-9D55-A73BEED4E08C&displaylang=fr
Thanks
Avelino Lopez [MSFT] - Anonymous
August 05, 2005
The comment has been removed - Anonymous
August 08, 2005
Bonjour et merci pour votre question,
Le calcul des suggestions se fait traditionnellement selon des algorithmes qui mesurent la distance d’édition, c’est-à-dire le nombre de manipulations que l’utilisateur a fait subir au mot qu’il voulait utiliser pour produire la forme fautive. Par manipulation, on entend l’une des opérations suivantes :
Suppression d’un caractère : infomation <- information
Ajout d’un caractère : stuppide <- stupide
Permutation : dasn <- dans
Remplacement : étandu <- étendu
L’intelligence linguistique d’un correcteur orthographique étant limitée, il est dès lors compréhensible que plusieurs suggestions soient offertes lorsque plusieurs mots valables sont identifiés. Ainsi, si l’input est riet, le correcteur proposera aussi bien rite (permutation) que rient (suppression d’une lettre), puisque ces deux mots se trouvent quasiment à la même distance de la forme fautive.
A cet algorithme, qui est valable pour toutes les langues, on ajoute généralement des informations spécifiques à la langue traitée par le correcteur, informations basées sur des typologies d’erreur (analyse des erreurs les plus fréquentes). Ainsi, pour le français, on accordera une priorité (pondération) plus importante à une transition telle que ph->f, alors que cela signifie qu’un utilisateur a remplacé deux lettres données par une troisième (selon l’algorithme, cela représente une distance d’édition assez grande, mais comme il s’agit d’une faute fréquente, on veut lui donner une plus grande priorité ; cela permettra de « faire monter » plus en haut dans le classement des corrections probables des mots contenant « ph » alors que l’utilisateur avait écrit « f » (téléfone -> téléphone). On peut imaginer de telles transitions pour des formes erronées comme historic où « ic » en fin de mot devra être remplacé par « ique » (historique).
Il va de soi que le correcteur n’a pas pour prétention de remplacer l’être humain et de corriger automatiquement les textes sans intervention humaine. Ces outils représentent une aide, considérée par beaucoup d’utilisateurs comme très précieuse, mais nous savons tous que la modélisation de la langue est trop difficile pour que l’on puisse s’attendre à ce que ces outils soient infaillibles. Il n’est peut-être pas inutile de le rappeler car certains utilisateurs ont tendance à attendre le même degré de fiabilité que celui d’une calculette. Il reste beaucoup à faire au niveau de la formation en la matière.
Je vous conseillerais d’utiliser la dernière version du correcteur, qui est l’objet de ce blog (vous pouvez l’installer gratuitement). Vous y trouverez la nouvelle orthographe recommandée par l’Académie - http://www.orthographe-recommandee.info/ , mais aussi la féminisation des noms de métiers (que beaucoup attendaient, vu qu’elle est maintenant rentrée dans les mœurs) et beaucoup d’autres améliorations. Cela dit, si vous écrivez « rato » avec cette nouvelle version, les 5 suggestions qui vous sont proposées sont : rat, ratio, rata, rate et raté. La probabilité d’avoir voulu écrire l’une de ces 5 formes en en fait plus grande que celle d’avoir voulu écrire « rateau ». Si vous écrivez « ratau », comme vous le dites, il y aussi plus de chance que cous ayez voulu dire « râteau » et pas « rat ». Tout cela dépend donc de types d’erreurs très générales et valables pour toutes les langues (oublier une lettre, enfoncer la mauvaise touche sur le clavier et donc remplacer une lettre par une autre…), le tout combiné à des abstractions concernant les erreurs les plus fréquentes dans une langue donnée (ique->ic ; ph->f…). C’est le dosage de ces facteurs qui permet d’essayer de calculer quelle forme est la plus probable (et il y en a souvent plusieurs, puisque, comme on le voit ci-dessus, l’ajout d’une lettre à rato donne ratio, le retrait d’une lettre donne rat, le remplacement du « o » donne « rata », ou « rate »… et tous ces mots sont donc à la même distance d’édition).
J’espère que ceci vous sera utile,
Avec tous mes encouragements pour la rédaction de votre article,
Bien à vous,
Thierry Fontenelle [MSFT]
Microsoft Speech & Natural Language - Anonymous
September 13, 2005
Si l'on teste le correcteur orthographique au départ des dix règles de orthographe-recommandee.info, on remarque que le travail (remarquable) ne couvre pas les deux premières, ce qui est plutôt dommageable :
1 : Les numéraux composés sont systématiquement reliés par des traits d’union.
2 : Dans les noms composés (avec trait d’union) du type pèse-lettre (verbe + nom) ou sans-abri (préposition + nom), le second élément prend la marque du pluriel lorsque le mot est au pluriel.
Sinon félicitations à toute l'équipe et à la sympathie de Thierry Fontenelle (on s'est rencontrés chez Microsoft Belux avec M. Blampain). - Anonymous
September 14, 2005
Bonjour (et merci pour les encouragements, ça fait toujours plaisir ;-)
S’agissant de la première règle (numéraux devant être reliés par un trait d’union) : on écrivait avant « cent trois » et on peut écrire désormais « cent-trois ». La nouvelle orthographe est donc bel et bien acceptée par le nouveau correcteur (vous pouvez tester : quarante-cinq, un-million-cent, six-cent-deux, etc. sont acceptés avec leur trait d’union), donc cette règle est bien prise en compte. Là où vous avez probablement identifié un "problème" est que le correcteur ne souligne pas les anciennes formes si l’on sélectionne l’option « orthographe rectifiée »: cent trois, cent trente-deux, six cents… La raison est simple : il ne s’agit plus d’un problème d’orthographe, mais d’un problème grammatical très complexe. Si l’on soulignait ces formes et que l’on proposait systématiquement une forme avec trait d’union, on courrait le risque de proposer des formes aberrantes :
Par exemple :
Dix personnes se sont présentées le premier jour. Elles étaient plus de cent trois jours plus tard.
On ne veut bien sûr pas souligner « cent trois » et proposer « cent-trois », puisqu’on a affaire à des syntagmes différents et ce n’est plus un problème qui doit/peut être réglé par un correcteur orthographique. Dans bien des cas, même un correcteur grammatical aura de gros problèmes car plusieurs analyses sont théoriquement possibles et des connaissances sémantiques poussées sont nécessaires pour lever l’ambiguïté.
Pour la deuxième règle que vous citez (le second élément prend la marque du pluriel lorsque le mot est au pluriel), je confirme que le correcteur en tient compte. Si le paramétrage admet la nouvelle orthographe, « un pèse-lettre, des pèse-lettres » sont bien admis par le correcteur, de même que « un sans-abri, des sans-abris ». Si vous sélectionnez « Orthographe traditionnelle », vous verrez d’ailleurs que « sans-abris » avec « s » est souligné en rouge, alors qu’il est accepté avec les autres options reconnaissant l’orthographe rectifiée. Vous pouvez faire l’expérience avec tous ces mots composés (des porte-bonheurs, des cache-poussières… : soulignés avec l’option « orthographe traditionnelle », acceptés avec l’option « orthographe rectifiée »).
J’espère que ceci répond à vos questions. N'hésitez pas à nous recontacter si vous en avez d'autres, bien sûr. Les commentaires nous sont utiles pour améliorer nos outils.
Cordialement,
Thierry
Thierry Fontenelle, Microsoft Speech & Natural Language [MSFT] - Anonymous
October 06, 2005
Bonjour,
Le Service Pack 2 d'Office 2003 est à présent disponible; il intègre les nouveaux outils linguistiques pour le français: le nouveau correcteur grammatical, le nouveau correcteur orthographique décrit plus haut (avec intégration de l'orthographe recommandée), le nouveau dictionnaire de synonymes...
Ce Service Pack 2 pour Office 2003 peut être téléchargé à l'adresse suivante (version française):
http://www.microsoft.com/downloads/details.aspx?displaylang=fr&FamilyID=57E27A97-2DB6-4654-9DB6-EC7D5B4DD867
Microsoft Office 2003 Service Pack 2 is now available and includes the new French proofing tools: the new grammar checker, the new spell-checker (which supports the French spelling reform) and the new thesaurus.
SP2 can be downloaded from (English version):
http://www.microsoft.com/downloads/details.aspx?FamilyId=57E27A97-2DB6-4654-9DB6-EC7D5B4DD867&displaylang=en - Anonymous
September 02, 2011
En tout cas le niveau du correcteur orthographique est de très bon niveau, nous sommes des <a href="www.alafrench.com/-Francais-.html">traducteurs français - anglais</a> qui l'utilisons évidement avec beaucoup de plaisir.