Partager via


Cet article a fait l'objet d'une traduction automatique.

Microsoft Azure

Présentation de Machine Learning Studio

James McCaffrey

Téléchargez l'exemple de Code

Il n'y a pas unanimité sur exactement ce que le terme « machine learning » moyen (ML). Dans mon esprit, ML est un système qui utilise les données pour aider à faire des prédictions. Par exemple, vous pourriez vouloir prédire qui va gagner le Super Bowl, ou à quel groupe (cluster) de personnes, un nouveau client sera plus semblable.

ML systèmes d'écriture à partir de zéro en utilisant c# ou tout autre langage de programmation sont fascinant, mais il prend du temps, nécessite des connaissances spécialisées et il est souvent difficile. Le nouveau Studio de ML Azure de Microsoft (sorti en juillet 2014) rend la création ML systèmes beaucoup plus facile, plus rapide et plus efficace. Dans cet article, je vais vous guider un exemple complet que vous obtiendrez en cours d'exécution avec Studio de ML.

Le meilleur moyen de voir où va cet article est d'examiner la capture d'écran dans Figure 1. L'image montre une expérience Studio ML remplie. Le but de l'expérience consiste à prédire l'affiliation à un parti politique (démocrate ou républicain) d'un membre de l'US Chambre des représentants, basés sur le comportement de vote précédent.

expérience de Studio complet de ML bleu azur
Figure 1 expérience de Studio complet de ML bleu azur

En haut de l'image, remarquez que ML Studio s'exécute dans Internet Explorer, c'est une application Web. Plus spécifi­quement, ML Studio est le serveur frontal pour le service Microsoft Azure Machine Learning. D'ici, par souci de simplicité, j'utiliserai le terme « ML Studio » pour désigner les deux le client serveur frontal et mettre fin à l'azur de retour. Dans la barre d'adresse, vous pouvez voir que je suis en utilisant une URL interne « passau.cloupapp.net. » Au cours du développement, le Studio de ML projet était le nom de code « Passau », et vous pourriez rencontré ce terme dans la documentation. Au moment où vous lisez cet article, l'URL publique de ML Studio sera disponible au azure.microsoft.com.

À l'aide de ML Studio pour créer des systèmes de ML est à peu près analogue à l'aide de Visual Studio pour créer des programmes exécutables, mais vous ne devriez pas trop laisser emporter par cette notion. Pour utiliser Visual Studio, vous pouvez acheter l'outil ou utiliser une version d'essai gratuite. Avec ML Studio, vous êtes facturé pour l'utilisation du service, mais il y aura des façons de tester le système gratuitement. Les détails exacts sont certains de changer fréquemment — changement constant est l'un des inconvénients majeurs, à mon avis, de travailler avec des systèmes de nuage. Je souhaite installer un produit sur mon bureau et a aucun changement à être totalement ma décision. Dans le meilleur des mondes du cloud computing, vous devez être préparé pour un environnement de travail où le changement n'est plus totalement sous votre contrôle.

ML Studio possède trois zones de travail primaire. Sur la gauche vous pouvez voir les éléments avec des noms comme sauvé des ensembles de données, Data Input et Output et apprentissage automatique. Voici les catégories et si vous développez, vous consultez des éléments spécifiques qui peuvent les faire glisser vers l'aire de conception du centre. C'est un peu similaire à la boîte à outils Visual Studio , où vous pouvez faire glisser des contrôles de l'interface utilisateur sur une aire de conception. Toutefois, les modules ML Studio représentent généralement ce que vous pouvez considérer comme méthodes — c'est-à-dire préécrites code qui effectue une sorte de tâche de ML.

La zone centrale de ML Studio s'appelle l'expérience. Ceci est analogue à l'éditeur Visual Studio — l'endroit où vous faites la majeure partie de votre travail. Dans Figure 1, l'expérience est intitulée vote expérimenter. Un titre de l'expérience est à peu près analogue à un nom de Solution de Visual Studio . Les boîtes rectangulaires sont les modules qui ont été entraînés vers l'aire de conception. Par exemple, le module nommée « Le vote des données » est la source de données brutes, et le module nommée « régression binaire Classification modèle logistique"(l'étiquette est partiellement coupée) est l'algorithme de ML principal utilisé.

Mettre en place les lignes courbes input -­les flux entre les modules de sortie. Pour être honnête, ma première impression en tant que développeur n'était pas tout à fait positive : "Oh grand. Lignes courbes. Je n'aime pas de lignes courbes. Ce n'est pas véritable programmation. » Mais il ne m'a pas fallu longtemps pour s'adapter au style visuel ML Studio de création de systèmes, et maintenant je suis un croyant.

Le côté droit du ML Studio affiche les détails de ce qui­jamais actuellement sélectionné dans la zone de travail principale. Dans Figure 1, parce que le module de régression logistique binaire modèle de Classification est sélectionné (sa frontière est en caractères gras), les informations contenues dans la zone de droite, comme la "Tolérance optimisation," avec la valeur 1.0E-07, se réfère spécifiquement à ce module. Vous pouvez considérer les informations dans la zone de droite comme le paramètre valeurs (ou de façon équivalente, des valeurs d'argument, selon votre point de vue) de la méthode/module sélectionnée.

Vous pouvez exécuter une expérience en cliquant sur l'icône de course situé au bas de l'outil. C'est un peu équivalent à frapper la touche F5 dans Visual Studio pour exécuter un programme dans le débogueur. Que chaque module est terminé, ML Studio affiche une coche verte à l'intérieur du module. Vous pouvez aussi voir une icône sauvegarder mais, par défaut, ML Studio enregistre automatiquement votre expérience toutes les quelques secondes — travaillant dans le nuage peut être dangereux en raison de problèmes comme la suppression d'une connexion réseau.

Dans les sections qui suivent, je vais vous guidera à travers la création de l'expérience en Figure 1 vous serez en mesure de répliquer. Ce faisant vous donnera une base solide pour instruction ML Studio sur vos propres, ou pour explorer la documentation d'une libération anticipée. Cet article suppose que vous avez au moins au niveau du début de compétences en programmation (afin de comprendre la terminologie et les analogies ML Studio et Visual Studio), mais n'assume pas que vous savez quelque chose sur ML Studio ou apprentissage automatique.

Pour obtenir les résultats ?

Si vous débutez en Studio de ML, vous vous demandez probablement où trouver la sortie de l'expérience. Il s'avère que, une expérience typique de ML Studio a souvent plusieurs sorties. La sortie ligne de fond, pour ainsi dire, est montrée dans Figure 2. J'ai coupé la partie centrale pour rendre l'image un peu plus facile à observer.

résultats d'expérience Studio de ML bleu azur
Figure 2 résultats d'expérience Studio de ML bleu azur

Afin de voir ces résultats, j'ai cliqué sur le module d'expérimentation de modèle de Score plus à droite et sélectionné l'option de visualiser dans le menu contextuel. Cela ouvre une fenêtre distincte avec les résultats comme indiqué. Pour l'instant, regardez la partie inférieure de l'image qui ressemble à :

unknown-party  y  n  y  n . . y  n  democrat    0.0013
unknown-party  y  y  y  y . . n  n  republican  0.7028

Cette sortie indique qu'une fois le modèle de prédiction a été créé, lui ont présenté deux nouveaux éléments de données. Le premier, avec une partie inconnue, est données hypothétique représentant qui ont voté « oui » sur un projet de loi des handicapés des nourrissons (les colonnes ont en-têtes si vous regardez de près), « non » sur un projet de loi lié à un projet d'eau et ainsi de suite, par le biais de « non » un vote sur un projet de loi concernant l'Afrique du Sud. Le modèle créé par Studio ML prédit que le représentant hypothétique est un démocrate. Le deuxième élément de données est pour un hypothétique représentant qui ont voté « oui » sur les huit premiers de la Loi et « non » sur les deuxième huit projets de loi ; le modèle prédit que la personne est un républicain.

Mise en place des données

Maintenant que vous comprenez le but de l'expérience de la démo, vous êtes en meilleure position pour comprendre comment créer l'expérience. Il est assez sûr de dire que toutes les expériences de Studio ML commencent avec des données et une ou plusieurs questions se posent. Ici, les données de démo sont bien connu (à la communauté de ML, au moins) ensemble de données, souvent appelé l'ensemble de données comptes rendus du Congrès vote de référence (ou les données de vote UCI définies, car l'emplacement principal du fichier est sur un serveur géré par l'Université de Californie, Irvine). On trouvera les données brutes, un simple fichier texte nommé maison-voix-84.data, en faisant une recherche sur Internet.

Les quatre premières lignes des données brutes sont :

republican,n,y,n,y,y,y,n,n,n,y,?,y,y,y,n,y
republican,n,y,n,y,y,y,n,n,n,n,n,y,y,y,n,?
democrat,?,y,y,?,y,y,n,n,n,n,y,n,y,y,n,n
democrat,n,y,y,n,?,y,n,n,n,n,y,n,y,n,n,y
...

Il y a un total de 435 virgules lignes de données, un pour chacun des 435 membres de l'US Chambre des représentants en 1984. La première colonne/le champ est le parti et est démocrate ou républicain (il y avait aucun indépendants ou autres parties à l'époque). Les prochain 16 points sur chaque ligne représentent un vote oui (y), un vote négatif (n) ou un vote manquant (?).

ML Studio peut lire les données directement sur le Web, ou de stockage d'Azur, mais je préfère créer mon propre magasin de données. Pour ce faire, j'ai copié le fichier texte dans le bloc-notes sur ma machine locale et ensuite ajouté les en-têtes de colonnes selon la description du fichier sur le site Web de l'UCI, comme suit :

political-party,handicapped-infants, . . ,south-africa
republican,n,y,n,y,y,y,n,n,n,y,?,y,y,y,n,y
republican,n,y,n,y,y,y,n,n,n,n,n,y,y,y,n,?
democrat,?,y,y,?,y,y,n,n,n,n,y,n,y,y,n,n
...

Lorsqu'elle ML à partir de zéro, travailler avec des en-têtes de colonne peut être ennuyeux, donc les en-têtes sont souvent laissés des fichiers de données. Mais avec ML Studio, à l'aide d'en-têtes de colonne est effectivement plus facile qu'omettant leur, mais aussi de rendre les données plus facile à comprendre. J'ai renommé le fichier local VotingRawWithHeader.txt et sauvegardé sur mon ordinateur. Si vous souhaitez utiliser les mêmes en-têtes, comme je l'ai fait, vous pouvez obtenir le fichier de données, j'ai utilisé dans le téléchargement de code pour cet article sur msdn.microsoft.com/magazine/msdnmag0914.

Après avoir navigué sur le site du Studio de ML, j'ai cliqué sur la catégorie de jeux de données dans le volet gauche. Dans la zone de travail principale, ML Studio affiche une liste des ensembles de données intégrés, par exemple les données de classe deux Iris et les données du télescope. La plupart de ces ensembles de données, que vous voyez au départ est plus ou moins célèbre référence ensembles (plusieurs du référentiel de l'UCI) qui peuvent être utilisés pour explorer ML Studio. Dans le coin inférieur gauche du Studio de ML, je trouve la nouvelle icône et cliqué dessus.

De là, je pouvais choisir un nouveau Dataset ou une nouvelle expérience, donc j'ai cliqué sur le Dataset, puis sur l'icône du fichier Local. Cela a apporté vers le haut de la boîte de dialogue illustrée dans Figure 3. J'ai utilisé le bouton Parcourir pour cibler le fichier local, nommé l'ensemble de données « Données du vote, » type sélectionné « Fichier CSV générique avec un en-tête (.csv) » et tapé dans une brève description de l'ensemble de données.

création d'un nouveau Dataset
Figure 3 création d'un nouveau Dataset

J'ai cliqué sur la case OK et ML Studio téléchargé le fichier local dans Azure storage et sauvegardé. Retour à l'affichage des groupes de données ML Studio, j'ai fait une actualisation de la page et les données de vote étaient maintenant visibles ainsi que les ensembles de données de démonstration. Notez que dans la version préliminaire du Studio ML j'ai utilisé, il n'était pas possible de supprimer un groupe de données. Ainsi, lorsque que vous étudiez, je suggère fortement que vous créez un seul ensemble de données avec un nom générique comme données de mannequin. Ensuite, lorsque vous avez besoin d'un ensemble de données différent, utilisez l'option « C'est une nouvelle version d'un dataset existant » pour votre espace de travail de Studio ML ne devienne pas dépassé avec orphelins, factices des ensembles de données qui ne peuvent pas être supprimées.

L'expérience de la création

Pour créer l'expérience, j'ai cliqué sur la nouvelle icône dans le coin inférieur gauche du Studio de ML, puis sur l'option de l'expérience. Ensuite, dans le volet de gauche, j'ai cliqué sur la catégorie des ensembles de données enregistrées et ensuite navigué jusqu'à l'option de vote données j'ai juste créé et il glisser vers le volet de conception. En haut de l'aire de conception, je suis entré dans vote expérience comme titre. À ce stade, vous pouvez avec le bouton droit sur le nœud de sortie bas du module de vote données et sélectionnez l'option de visualiser pour vérifier que votre jeu de données est correct.

Beaucoup de développeurs, y compris moi, quand on travaille tout d'abord avec ML, sous-estime sérieusement combien d'efforts est impliqué dans la manipulation des données de la source avant d'appliquer des algorithmes de ML. Les tâches typiques incluent réorganiser les colonnes de données, suppression de colonnes non désirées, traitant des valeurs manquantes, codage des données non numériques et de répartir les données en ensembles de formation et de test. Du point de vue de développeur pour l'expérience de vote-données, ces tâches pourraient prendre la forme de code comme ceci :

 

string[][] rawData = LoadData("VotingRawWithHeader.txt");
rawData = ProcessMissing(rawData, '?', 'n');
rawData = SwapColumns(rawData, 0, 16);
double[][] data = Encode(rawData);
double[][] trainData;
double[][] testData;
MakeTrainTest(data, 0.80, out trainData, out testData);

Figure 4 montre un gros plan sur les premiers modules de Studio quatre ML qui effectuent ces tâches. Dans de nombreux scénarios de ML, l'approche la plus courante pour traiter avec des valeurs manquantes est de simplement supprimer toutes les lignes d'éléments de données qui contiennent un ou plusieurs des valeurs manquantes et ML Studio vous offre cette option. Cependant, avec droit de vote données, mon hypothèse était que vote manquant était vraiment implicite « non ». Donc, pour le module de laveur de valeurs manquantes, dans le volet de droite, j'ai précisé que toutes les valeurs manquantes ("?") devrait être remplacé par la valeur « n ».

traitement des données
La figure 4, traitement des données

Le module projet colonnes permet vous permet de spécifier les colonnes que vous souhaitez omettre. Dans ce cas, j'ai sélectionné l'option « Sélectionner toutes les colonnes ». ML Studio examine vos données et fait intelligemment quant à savoir si les valeurs de colonne sont données catégoriques de chaîne ou de données numériques. Le module Éditeur de métadonnées vous permet d'outrepasser les hypothèses de ML et vous permet également de spécifier la colonne étiquette, c'est-à-dire la variable à prédire. J'ai sélectionné la colonne « partis politiques » (là où avoir des en-têtes de colonnes est une grande aide) et spécifié que c'était la colonne étiquette. J'ai laissé les autres 16 colonnes comme colonnes de fonctionnalité (predictor).

Le module Split fait justement cela, diviser les données en un jeu d'apprentissage, utilisé pour créer un modèle de ML et un ensemble de test, utilisé pour estimer la précision du modèle. Ici, j'ai précisé 0,8 dans le volet Paramètres du module donc les données d'apprentissage serait de 80 pour cent des 435 Articles (348) et l'ensemble de test serait les 20 % restants (87 points). Le module de Split a également un paramètre booléen nommé « Stratifié diviser. » Lorsque vous travaillez avec Studio ML, vous croiserez certainement de paramètres dont vous ne comprenez pas le sens. L'icône point d'interrogation en bas à droite vous donne accès à l'aide de Studio de ML.

Le modèle de formation

Vous pouvez considérer un modèle ML sous forme de collection d'information — généralement des valeurs numériques appelées poids — qui sont utilisés pour générer les sorties et les prédictions. Un modèle de formation est le processus de trouver un ensemble de valeurs de poids, de sorte que lorsqu'ils les données d'entrée de l'ensemble de la formation (dans ce cas, 16 Oui et non), calculées sorties (démocrate ou républicain) correspondent de près les résultats connus dans les données d'apprentissage. Une fois que ces poids ont été déterminés, le modèle qui en résulte peut être présenté avec les données de test. La précision du modèle sur les données de test (le pourcentage de prédictions correctes) vous donne une estimation approximative de la façon dont le modèle va faire quand présenté avec de nouvelles données, où la sortie vraie n'est pas connue.

Pour la démo avec droit de vote, une approche basée sur le code de la formation peut ressembler à :

 

int numFeatures = 16;
LogisticModel lm = new LogisticModel(numFeatures);
int maxEpochs = 10000;
lm.Train(trainData, maxEpochs);

Figure 5 montre un gros plan de la formation de Studio ML équivalent -­des modules. Dans la démo, le module de Train Model accepte en entrée du module de régression logistique binaire modèle de Classification. Contrairement à d'autres connexions, ce n'est pas vraiment un flux de données ; elle spécifie en fait exactement quel genre de modèle ML doit être utilisé. Alternatives à logistique Classification binaire de régression comprennent des modules en moyenne Perceptron binaire, boosté arbre de décision binaire et Neural Network de classifieurs binaires.

le modèle de formation
La figure 5, le modèle de formation

Alors, comment savoir quel modèle utiliser ? Parce que la sortie de prédire a deux valeurs possibles, démocrate ou républicain, vous voulez un modèle binaire. Mais il y a des dizaines d'approches ML et probablement la partie la plus difficile d'utiliser ML Studio est d'avoir à la recherche des avantages et inconvénients des différents classificateurs de ML. Une analogie développeur avec Visual Studio est que Microsoft .NET Framework a des dizaines de structures de données, tels que Dictionary générique HashSet et file d'attente générique, et c'est à vous de savoir exactement ce que fait chaque structure de données. De la même manière, c'est à vous d'apprendre les classificateurs de ML.

Le module de régression logistique a certains paramètres que vous aurez probablement comprendre, y compris la tolérance de l'optimisation, L1 régularisation poids et taille de la mémoire pour L-BFGS. Encore une fois, c'est à vous d'apprendre comment ces paramètres. Heureusement, ML Studio a des valeurs bien choisis par défaut pour la plupart des paramètres de module. J'ai accepté toutes les valeurs de paramètre par défaut, sauf que j'ai utilisé zéro pour la « semence numéro aléatoire ».

Dans le module de modèle de Train, vous devez indiquer ML Studio quelle colonne de données formation est la colonne étiquette ; quelle colonne est la variable à prédire. Avec le module de Train modèle sélectionné, j'ai cliqué sur le bouton de sélection de colonne de lancement dans le volet Paramètres du module et a choisi l'option de choisir par nom dans le contrôle de liste déroulante et puis tapé parti politique. J'aurais avoir utiliser l'index de la colonne, 1, parce que le parti politique est dans la première colonne (Studio ML indices sont base 1 plutôt que 0-base que les développeurs ont l'habitude de). Notez qu'en spécifiant la colonne libellé pour le modèle de Train module est obligatoire même si vous le faites dans l'éditeur de métadonnées.

Évaluation du modèle

Après que le modèle de démonstration a été formé, les prochaines étapes sont pour nourrir les données d'apprentissage et les données de test au modèle, calculer les sorties calculées et calculer la précision des résultats calculés (contre les résultats connus). Dans le code, cela pourrait ressembler à :

 

lm.ComputeOutputs(trainData); // Score
double trainAccuracy = lm.Accuracy(trainData); // Evaluate
lm.ComputeOutputs(testData); // Score
double testAccuracy = lm.Accuracy(testData); // Evaluate

Figure 6 montre un gros plan de la notation pertinentes et d'évaluer les modules. Les deux modules de modèle de Score acceptent que deux flux d'entrée. La première entrée est le modèle formé (les informations nécessaires pour calculer les sorties), et la seconde entrée est un jeu d'apprentissage ou un ensemble de test (la saisie de données nécessaire). Les résultats de ces deux modules de notation sont envoyés au module modèle évaluer, qui calcule l'exactitude.

notation et évaluation du modèle
Figure 6 notation et évaluation du modèle

La figure 7 montre les résultats dans le module de modèle à évaluer. Avis en haut à droite, le second des deux objets Dataset a été sélectionné (il est mis en surbrillance), ce qui signifie que les résultats sont pour les données de test. La partie la plus importante du résultat est la valeur de précision de 0,989. Rappeler l'ensemble de test était de 20 pour cent des 435 objets de données originaux ou 87 points. Le modèle de régression logistique a correctement prédit le parti politique de 86 sur les éléments du 87 test. Il y a beaucoup d'autres informations dans les résultats du module modèle évaluer. Par exemple, le graphique est appelé un graphique de la caractéristique de fonctionnement de récepteur (ROC). Il trace le pourcentage de « vrais positifs » (corriger les prédictions) sur l'axe y vs. le pourcentage de « faux positifs » (prédictions erronées) sur l'axe des abscisses.

modèle précision sur des données de Test
Figure 7 modèle précision sur des données de Test

Plus qu'un simple outil

L'application Azure ML Studio, ainsi que de son moteur principal, le service Microsoft Azure Machine Learning (ML), est beaucoup plus que l'outil client décrit dans ce court article. Du point de vue du développeur, ML Studio simplifie considérablement la création des systèmes de prédiction. Mais il y a des propositions de valeur supplémentaire qui ne sont pas si évidentes.

Un sujet important non couvert dans cet article est la capacité d'Azure ML pour créer et publier un Web service en utilisant simplement glisser et déposer et quelques clics. ML bleu azur gère automatiquement le déploiement, le dimensionnement de la capacité, équilibrage de charge, -AutoScaling et surveillance de la santé. Une pré-version client estime qu'avec Azure ML, ils étaient en mesure de créer une solution d'entreprise (un système de détection de fraude) à une fraction du coût de l'utilisation de logiciels commerciaux analytique.

ML bleu azur prend en charge R, une science de données populaires, langage de programmation. Des centaines de modules libres R existants peuvent être directement copiés dans un système d'Azur ML.

ML Studio permet une collaboration facile. Une expérience peut être facilement partagée entre plusieurs personnes. J'ai utilisé cette fonctionnalité moi-même et c'est beaucoup plus efficace que mon approche de conversation e-mail normal, arrière-et-vient.

ML bleu azur offre plus que juste des avantages aux développeurs et données scientifiques. « Le déploiement avancé analytique est difficile, » a déclaré Joseph Sirosh, vice-président de Microsoft corporate, gestion de l'Information et l'apprentissage de la Machine. « Les entreprises sont fatigués de payer des prix élevés, recruter les talents cher et attendre des mois pour obtenir des résultats. Ayant la capacité de rapidement développer des modèles analytiques et de les déployer sans ces goulets d'étranglement, c'est changer. « « ML bleu azur permet aux entreprises de valeur à leurs données et à créer des systèmes pour réduire les dépenses, augmenter les revenus et mieux servir leurs clients. »

Faire des prédictions

Une fois un modèle ML Studio a été créé et évalué, il peut être utilisé pour faire des prédictions sur les données avec sorties inconnus. J'ai voulu pour prédire le parti politique d'un hypothétique représentant qui ont voté "Oui", "non", "Oui", « non » et ainsi de suite, sur les 16 projets de loi et un deuxième représentant, qui ont voté "Oui" sur les huit premiers projets de loi et « non » sur les factures de huit autres.

Une approche serait de créer et télécharger un nouveau Dataset de Studio ML puis il marquer à l'instar de la formation et des ensembles de données de test. Mais pour une quantité limitée de données, une approche plus interactive est d'utiliser le module d'entrer les données comme indiqué dans Figure 8, qui vous permet d'entrer les données manuellement.

entrer de nouvelles données pour prédire
Figure 8 entrer de nouvelles données pour prédire

Le format des données dans le module doit correspondre exactement au format des données utilisées pour l'apprentissage du modèle, donc les en-têtes de colonne sont nécessaires. La sortie du module d'entrer les données est combinée avec la sortie du module Train modèle. Après l'exécution de l'expérience, vous pouvez voir les résultats en cliquant sur l'option Visualize du module modèle de Score, comme indiqué précédemment en Figure 2.

Si vous faisiez des prédictions en utilisant un langage de programmation procédural, le code peut ressembler à :

string[] unknown = new string[] { "party", "y", "n", "y", . . "n" };
double result = lm.ComputeOutput(unknown);
if (result < 0.5)
  Console.WriteLine("Predicted party is democrat");
else
  Console.WriteLine("Predicted party is republican");

De plus, certains renseignements ML Studio est susceptible d'être un peu mystérieux. Rappelons que les prédictions sont deux valeurs numériques fin :

unknown-party  y  n  y . . y  n  democrat    0.0013
unknown-party  y  y  y . . n  n  republican  0.7028

Il s'avère que, pour la Classification binaire de régression logistique, une valeur de sortie inférieur à 0,5 indique la classe de première (démocrate dans cet exemple) et une valeur de sortie au-dessus de 0.5 indique la classe de seconde (républicain). N'oubliez pas que, comme Visual Studio, Studio ML possède de nombreuses fonctionnalités et génère une quantité énorme d'informations. Vous apprendrez ce que signifient les divers éléments d'information au fil du temps en utilisant le système et s'attaquer à une nouvelle pièce à la fois, plutôt que de faire une plongée profonde dans la documentation et essayer d'apprendre tout à la fois.

Aucun Code? !

Cet article a juste effleuré la surface de Studio de ML, mais il fournit suffisamment d'informations pour pouvoir reproduire l'expérience avec droit de vote et essayer l'outil. Vous avez peut-être remarqué que cet article ne comprend pas n'importe quel codage. Pas de code ? Bah ! Mais une des choses plus cool sur ML Studio est que vous pouvez écrire vos propres modules personnalisés à l'aide de c# et je vais couvrir cette rubrique dans de prochains articles. Mon intuition est que ML Studio générera un écosystème dans lequel les développeurs écrire des modules sophistiqués, spécialisés et mettre à la disposition de tous les deux dans le commerce et par le biais de divers canaux, tels qu'open source et articles.


Dr. James McCaffrey travaille pour Microsoft Research à Redmond, Washington  Il a travaillé sur plusieurs produits Microsoft, y compris Internet Explorer et Bing. Il peut être contacté à jammc@microsoft.com.

Remercie les experts techniques Microsoft suivants pour avoir relu cet article : Roger Barga (Machine Learning) et Michael Jones (produit Global Engineering)