Partager via



Octobre 2017

Volume 32, numéro 10

Cet article a fait l'objet d'une traduction automatique.

Intelligence artificielle - Exploration de Microsoft Azure Machine Learning Studio

Par Frank La La | Octobre 2017

Frank LaVigneLongTime lecteurs de mon blog (franksworld.com) ont remarqué au cours des 18 mois un décalage marqué dans le contenu vers la science des données, l’intelligence artificielle (AI) et d’apprentissage automatique (ML). Par conséquent, il est uniquement raccord que cette colonne également déplace des vitesses et se concentre sur la révolution passe partout : La révolution AI. Pas trop longtemps, AI a été les sélections de science-fiction. Maintenant, nous pouvons ajouter intelligence à pratiquement n’importe quelle application ou un site Web. En fait, la plupart de vos applications favorites et les sites Web utilisent déjà une forme de AI. Cortana et nombreux autres assistants de voix sont des exemples évidents de AI dans la couche d’interface utilisateur. Moins évidents, mais non moins important, sont des algorithmes intelligents optimisation des ressources, les systèmes de recommandation indiquant les films vous intéresser et déterminer ce que vous voyez dans vos flux sociaux.

Au cours des 10 dernières années, l’objectif de nombreux développeurs et aux organisations informatiques était la capture et le stockage des données volumineuses. Pendant ce temps, la notion d’une taille de la base de données « grande » a été initialement dans l’ordre de grandeur de téraoctets à pétaoctets. En 2017, l’appel est désormais une session sur les analyses de recherche, des tendances et des prédictions du futur selon les informations utiles dans ces magasins de données de grande taille. Combiné avec les dernières avancées en matière de recherche de AI, analytique de nuage algorithmes et les outils ML, ces magasins de données de grande taille peuvent non seulement être analysées, mais monétisés.

Avec le cloud de stockage et de puissance de calcul et économique, même les petites entreprises peuvent prédire le futur en anticiper le comportement des clients et d’identifier les tendances au niveau individuel et de l’échelle. Les organisations qui peuvent détecter et déployer des modèles prédictifs exploitables la concurrence seront très répandus dans leur segment de marché. Exploités, AI peut ajouter valeur sérieux pour toute entreprise. Comme Peter Drucker placer, « le meilleur moyen de prévoir l’avenir est de le créer. » Dans cet esprit, voici une présentation approfondie du AI et ML.

Les termes du contrat à droite de mise en route

Avant d’entrer dans un projet AI, il est important de définir l’étendue de ce qui est exactement « intelligence artificielle. » Ce sera important, car les colonnes futures seront appuient sur un ensemble commun de signification pour les termes du contrat associé à ce champ. Une recherche rapide sur Internet le terme « intelligence artificielle » génère un grand nombre de résultats différents, à partir de chatbots vision systèmes d’ordinateurs et aux débats sur la nature de conscience lui-même. Il n’existe aucun consensus fermes concernant les entend, la plupart des experts conviennent généralement sur des expressions simples, qui sont répertoriées dans Figure 1.

En général les Phrases acceptée Intelligence artificielle

Figure 1 généralement admis que les expressions d’Intelligence artificielle

La puissance du Cloud dans l’entre vos mains

Autour du milieu de la dernière décennie, j’ai un précoce et un partisan de la plateforme Tablet PC. Comme feriez de présentations pour différents groupes d’utilisateurs et de participer à des conférences, une critique serait reviennent inévitablement : absence de matériel de hautes performances. La raison de l’absence de puissance de calcul grave sur ces appareils avait plus faire avec les contraintes de fabrication d’une tablette viable : à savoir poids, autonomie et coût. Nombreux seraient l’objet qu’ils admirées le facteur de forme tablet PC, ils nécessaires un appareil doté d’un processeur plus puissant. Avance rapide 10 ans et les limites du coût, batterie vie et la connectivité réseau ont disparu en grande partie. N’importe quel appareil dans les réseaux de plage Wi-Fi et 4G peut maintenant vous connecter à des services informatiques illimitées et ressources de stockage dans le cloud.

AI dans le Cloud

En tant que développeur, vous disposez des choix en termes de quels types de services intelligents à consommer. Si une application ou un site Web nécessite une reconnaissance d’image ou le traitement du langage naturel, puis Microsoft a apporté plusieurs services disponibles en tant que partie des Services Microsoft cognitifs, un ensemble d’API, les kits de développement logiciel et les services qui s’étend sur portefeuille en constante évolution de Microsoft de ML APIs . Ils vous permettent d’ajouter facilement des fonctionnalités intelligentes, telles qu’émotion et détection vidéo. reconnaissance faciale, vocale et vision ; la parole et présentation de la langue, à vos applications. La vision de Microsoft est pour des expériences informatiques plus personnels et de productivité assistée par les systèmes de plus en plus peuvent voir, entendre, parlent, comprendre et même commencer à raison.

Ces services exposent des modèles qui ont été formés sur des millions d’exemples d’images. Dans une vidéo de Channel 9, Anna Roth de Microsoft explique brièvement le processus d’apprentissage les algorithmes avec une grande variété d’exemples de données (bit.ly/2x7u1D4). Les modèles exposées par les API des Services cognitifs nombreux ont été formés sur les années et les millions de points de données par des dizaines d’ingénieurs et des fonctions de recherche. C’est pourquoi ils sont tellement bien à ce qu’elles font. Lorsque votre application ou un site Web nécessite une solution qu’une des API Services cognitifs peut résoudre, utilisez-les en. La liste des offres de Services cognitifs Microsoft continue de croître. Pour une liste de mises à jour, accédez à bit.ly/2vGWcuN.

Toutefois, lorsque vos données ont une étendue plus limitée à l’intérieur d’un domaine spécifique, puis vous devrez créer vos propres modèles à partir de vos propres données. Alors que cela peut paraître intimidante ou peu pratique, le processus est relativement simple avec un autre service cloud fourni par Microsoft : Azure ML Studio.

Azure ML Studio

Azure ML Studio est un service en ligne qui rend ML et la création de modèles prédictifs simples et conviviale. Dans la plupart des cas, aucun code n’est impliqué. Les utilisateurs faire glisser autour des différents modules représentant des actions et les algorithmes dans une interface qui ressemble à Visio. Pour une flexibilité maximale et d’extensibilité, il existe de modules pour l’insertion de code R et Python pour les cas où les modèles intégrés ne suffisent ou utiliser le code existant.

Mise en route ouvrir un navigateur et la tête sur à studio.azureml.net. Si vous n’avez jamais utilisé Azure ML Studio, cliquez sur le bouton s’inscrire. Vous pouvez choisir l’option de l’espace de travail invité ou un espace de travail gratuit dans la boîte de dialogue qui suit (consultez Figure 2). Dans le cadre de cet article, je vous recommande d’à l’aide de l’espace de travail disponible, car vous avez la possibilité d’enregistrer vos projets et d’exposer vos modèles via les services Web.

Niveaux d’Azure Machine Learning Studio tarifaires

Figure 2 niveaux d’Azure Machine Learning Studio tarifaires

Si vous avez déjà un compte Microsoft, cliquez sur se connecter sous l’option de l’espace de travail gratuit. S’il s’agit de la première fois que vous êtes connecté à Azure ML Studio, vous verrez une liste vide d’expériences. ML est considéré comme un sous-ensemble de science des données, le terme « expérience » est utilisé ici.

Création d’une expérience la meilleure façon d’examiner la puissance d’Azure ML Studio consiste à démarrer avec une expérience de l’exemple. Heureusement, il existe un nombre d’échantillons prédéfinies fournies par Microsoft. Tout d’abord, cliquez sur le bouton Nouveau dans l’angle inférieur gauche de la fenêtre du navigateur. Dans la boîte de dialogue, tapez vol dans la zone de texte. L’écran doit ressembler à Figure 3. En cliquant sur la vue dans le lien de la galerie s’affiche une page de détail des informations sur l’expérience (bit.ly/2i9Q61i). Déplacez la souris sur la vignette, puis cliquez sur la bouton Ouvrir dans Studio pour ouvrir l’expérience pour commencer à travailler dessus.

L’expérience d’exemple Flight Delay Prediction

Figure 3 l’expérience d’exemple Flight Delay Prediction

Cette expérience s’exécute, ce qui est appelé une Classification binaire, ce qui signifie que l’algorithme ML place chaque enregistrement dans le jeu de données dans une des deux catégories. Dans ce cas, ou non le vol sera retardé.

Une fois que la charge de l’expérience votre écran doit ressembler à Figure 4.

L’expérience de retard de vol ouvert dans Azure Machine Learning Studio

Figure 4 l’expérience de retard de vol ouvert dans Azure Machine Learning Studio

Alors que cela peut se présenter intimidante dans un premier temps, ce qui se passe est très simple. Faire un zoom à l’aide de la roulette de défilement de la souris ou à l’aide du contrôleur de zoom dans l’angle inférieur gauche de la zone de l’espace de travail.

Navigation dans l’espace de travail canevas Azure ML Studio offre des contrôles de navigation intégrée pour Explorer et de manipuler la vue de la zone de l’espace de travail. Les contrôles de navigation de gauche à droite sont : une carte Mini de la zone de zoom contrôle slider, zoom au bouton de la taille réelle, un zoom pour ajuster bouton et un bouton bascule de panoramique. Vous avez pouvez le constater que cliquer et faire glisser autour de la zone de dessin sélectionne des modules et ne pas déplacent la zone de dessin. En cliquant sur le bouton de panoramique active et désactive le mode de sélection de panoramique. Lorsque le mode panoramique est activé, le bouton s’affiche en bleu.

Modules le canevas de l’espace de travail contient des modules liés entre eux. Chaque module représente un jeu de données, la manipulation de données ou un algorithme. Pour obtenir une idée du contenu du jeu de données source, sélectionnez le module de données de retards de vol, avec le bouton droit sur le 1 et cliquez sur visualiser dans le menu contextuel (consultez Figure 5).

Menu contextuel de vol des retards données Module

Menu contextuel de la figure 5 vol retards données Module

Dans la boîte de dialogue, le contenu du jeu de données apparaît dans une grille. Cliquez sur l’un des champs et développez les panneaux des statistiques et de visualisation. Dans Figure 6, le champ de l’opérateur est choisi et entre le panneau de configuration des statistiques et la visualisation, la forme de base de données peut être détectée. Cliquez sur le X dans le coin supérieur droit de la boîte de dialogue pour fermer cette vue.

Visualiser les données brutes

La figure 6, visualisez les données brutes

Répétez les étapes précédentes pour visualiser la structure et le contenu du jeu de données météo.

Manipuler les jeux de données brutes Notez qu’il existe un nombre de modules apporter des modifications aux données dans le jeu de données et il existe deux branches : une pour le jeu de données des retards de vol et l’autre pour le jeu de données météo. Les données de chacun des ensembles de données doivent être nettoyé afin d’être fusionnées et analysées par l’algorithme de ML. Notez que dans les étapes jointe au jeu de données météo, il existe encore un module qui exécute le code R. Sélectionnez le module Execute R Script et, comme avant, à droite de la souris cliquez sur le 1. Le menu contextuel comprend une option de visualiser, mais il est grisé, en l’état de toutes les autres options. Cela signifie que l’expérience n’a pas été exécutée. Dans la partie inférieure de l’écran, cliquez sur le bouton Exécuter et choisissez Exécuter pour exécuter l’expérience. Dans quelques instants, l’expérience se termine. En fonction de la charge du serveur, cette expérience peut prendre plus de temps lorsque vous utilisez le service gratuit. Maintenant, cliquez sur Execute R Script et avec le bouton droit de 1. La boîte de dialogue de visualisation affiche la sortie du module. En fait, maintenant que l’expérience entière a été exécuté, les données de chaque module peuvent être visualisées. Explorer les modules et visualiser les données à chaque étape, vous pouvez suivre les transformations de données tout au long du processus. Toutefois, les visualisations de certains modules apparaissent différentes de celle d’autres.

Apprentissage comme mentionné précédemment, cette expérience classifie vols en deux catégories : retardée ou ne pas retardé. L’expérience d’abord nettoie les données et les données des formes dans un format et une structure qui permet d’utiliser un algorithme de ML. Les chercheurs de données font souvent référence à ce processus en tant que « données ensuivirent » et il peut représenter la majorité des efforts dans n’importe quel type de projet de science des données.

En règle générale, le processus d’une expérimentation ML une fois que les données ont été mises en forme et nettoyées suit les étapes suivantes : fractionner les données dans un test de définir et d’apprentissage ensemble, choisir un algorithme pour examiner les données et évaluer les résultats. Cette expérience parcourt les données de deux algorithmes : Arbre de décision augmentés de deux classes et de régression logistique à deux classes. Chaque algorithme traite les données de différentes façons. Certains algorithmes sont préférables à certains jeux de données et les problèmes que d’autres. Il s’agit là l’expérimentation entre en jeu.

Lorsqu’il existe plusieurs algorithmes dans une expérience, les modèles peuvent être évaluées par rapport à un autre avec un module d’évaluer le modèle. Sélectionnez le module d’évaluer le modèle, avec le bouton droit sur 1 et sélectionnez les visualiser dans le menu contextuel. La boîte de dialogue ressemble à ceci Figure 7.

L’évaluer la boîte de dialogue modèle visualisation

Figure 7 l’évaluer la boîte de dialogue modèle visualisation

La boîte de dialogue de visualisation évaluer le modèle contient des informations essentielles pour comprendre les performances des modèles ML venez de créer. La ligne bleue représente le modèle créé via l’algorithme Two-Class Boosted Decision Tree et la ligne rouge représente le modèle créé par l’algorithme de régression logistique à deux classes. Le modèle bleu, sélectionné par défaut, a une précision de contrôle d’accès de 0.806, ce qui signifie qu’était correcte % 80.6 du temps. Cliquez sur le carré rouge dans la légende du graphique pour afficher les résultats à partir du modèle de régression logistique à deux classes. Sa précision a été légèrement meilleure à 81.7 %. Notez également, les nombres de la matrice de Confusion sur les deux modèles. Une matrice de confusion est une mesure de la qualité d’un modèle de classification. Il mesure le nombre de fois où qu'un enregistrement a été marqué correctement positif ou négatif, ainsi que la fréquence à laquelle le modèle a été incorrect avec « faux positifs » et « faux négatifs ».

La fonctionnalité graphique principale sur cet écran est la courbe caractéristique de récepteur d’exploitation ou ROC. Une explication complète de cette mesure garantit un article qui lui sont propres. Vous trouverez plus d’informations sur cette métrique sur Wikipédia à bit.ly/2fPKJnf. En supposant qu’aléatoire estimation est correcte environ la moitié du temps, la courbe ROC affiche un modèle avec une précision de 50 pour cent comme une ligne droite selon un angle de 45 degrés. Étant donné que les deux modèles sont supérieures à 80 pour cent, l’algorithme exécute beaucoup mieux que l’estimation aléatoire. En d’autres termes, l’ordinateur a appris à prédire les résultats avec une quantité raisonnable de précision.

Manipulation des données plus le reste du flux de travail implique laissant le nombre de colonnes dans le jeu de données à partir du 31 à six. Afin de rendre les données plus lisibles, les champs OriginAirportID et DestAirportID sont jointes à une table avec des noms de ville, état et aéroport. De cette façon 12264 devient plus lisible en tant que Washington Dulles International.

Synthèse

Certains termes par Azure ML Studio sont liés aux statistiques et sont généralement en dehors du vocabulaire habituel de la plupart des développeurs. En réalité, c'est-à-dire où l’essentiel de la courbe d’apprentissage d’Azure ML Studio se trouve dans le jargon de science des données d’apprentissage.

J’ai succinctement à peine ce qui peut être généré avec Azure ML Studio. L’étape suivante feront ce modèle prédictif accessibles aux sites Web et applications à l’aide de la prise en charge intégrée pour les services Web. Dans les futures colonnes, je vais aborder les autres aspects de AI au sein et en dehors d’Azure ML Studio.

Pendant l’apprentissage, intelligence artificielle et science des données en général peuvent intimider à l’ingénieur moyenne de données ou développeur, l’objectif global de cette colonne est pour vous aider à découvrir que tout à fait le contraire est vrai.


Frank La Vigneest un spécialiste des données à Wintellect et hébergez du podcast DataDriven. Blog régulièrement à FranksWorld.com et que vous pouvez surveiller sur son canal YouTube, « TV du monde de Frank » (FranksWorld.TV).

Grâce aux experts techniques Microsoft suivants pour la révision de cet article : Rachel Appel et Andy Léonard


Discussion sur cet article sur le forum MSDN Magazine