9 回のエピソード

Learn Live: 機械学習のためのデータ サイエンスの基礎

Learn TV で配信される Jason DeBoever と Glenn Stephens によるライブに参加し、この第 9 部の「機械学習のためのデータ サイエンスの基礎」シリーズをご覧ください。 Learn モジュールについて説明し、参加者の質問にライブで回答します。 基本的な従来の機械学習モデルから探索的データ分析やアーキテクチャのカスタマイズに至るまで、簡単に理解できる概念的なコンテンツと対話型の Jupyter Notebook をガイドとして提供し、基になる概念と、最も一般的な機械学習ツールを使用してモデルを構築する方法について説明します。

機械学習の概要

機械学習の概要

コンピューター サイエンスおよび統計学に関する知識がほとんど、またはまったくない方向けの機械学習の概要。 ここでは、いくつかの本質的な概念を紹介し、データについても説明します。また、Python を使用して、実際の環境と同じように機械学習モデルをトレーニングし、保存して使用することにより、機械学習のライフサイクル全体を対話形式で確認します。 このエピソードでは、次のことを行います。

  • 機械学習と従来のソフトウェアの違いを調べる。
  • 機械学習モデルを作成してテストする。
  • モデルを読み込んで、新しいデータで使用する。
教師あり学習を使用して従来の機械学習モデルを構築する

教師あり学習を使用して従来の機械学習モデルを構築する

教師あり学習は、データの例からアルゴリズムに学習させる機械学習の一形態です。 教師あり学習によって、現実世界に関する予測を行えるモデルが自動的に生成されるしくみについて、段階的に詳しく説明します。 また、これらのモデルがテストされる方法や、発生するおそれのある問題についても触れます。このエピソードでは、次のことを行います。

  • 教師ありと教師なしの学習を定義する。
  • コスト関数が学習プロセスに与える影響を確認する。
  • 勾配降下法によってモデルがどのように最適化されるのかを確認する。
  • 複数の学習率を試し、それらがトレーニングに与える影響を確認する。
機械学習用のデータの概要

機械学習用のデータの概要

機械学習モデルの力は、それらのモデルをトレーニングするために使用されるデータから生み出されます。 コンテンツと演習を通して、データを理解する方法、コンピューターが正しく解釈できるようにデータをエンコードする方法、エラーがないようにデータをクリーニングする方法のほか、適切に動作するモデルを作成するために役立つヒントについて説明します。 このエピソードでは、次のことを行います。

  • 探索的データ分析 (EDA) を使用して大規模なデータセットを視覚化する。
  • エラーがないようにデータセットをクリーニングする。
  • 数値およびカテゴリ データを使用して不明な値を予測する。
機械学習で回帰モデルをトレーニングして理解する

機械学習で回帰モデルをトレーニングして理解する

回帰は、ほぼ間違いなく、最も広く使用されている機械学習手法であり、科学的発見、ビジネスプランニング、株式市場分析の共通の基盤になっています。 この学習資料では、単純なものと複雑なもの両方の回帰分析について詳しく説明し、モデルのパフォーマンスを評価する方法についていくつかのインサイトを提供します。 このエピソードでは、次のことを行います。

  • 回帰のしくみを理解する。
  • 新しいアルゴリズムを使用する: 線形回帰、線形重回帰、多項式回帰。
  • 回帰モデルの長所と制限事項を理解する。
  • 線形回帰で誤差関数とコスト関数を視覚化する。
  • 回帰の基本的な評価メトリックを理解する。
機械学習モデルを調整してテストする

機械学習モデルを調整してテストする

機械学習について考えるとき、トレーニング プロセスに注目することがよくあります。 このプロセスの前に少し準備を行うと、学習の速度と品質が向上するだけでなく、それまでに見たことがないデータに直面したときにモデルが正しく動作する信頼性も向上します。 このエピソードでは、次のことを行います。

  • 特徴の正規化を定義する。
  • テスト データセットを作成して使用する。
  • テスト モデルによるトレーニングの向上と低下の両方の可能性を明確にする。
機械学習での分類モデルを作成して理解する

機械学習での分類モデルを作成して理解する

分類とは項目をカテゴリに割り当てることを意味し、自動化された意思決定と考えることもできます。 ここでは、ロジスティック回帰を使用して分類モデルについて説明し、より複雑な分類方法への足掛かりを提供します。 このエピソードでは、次のことを行います。

  • 分類と従来の回帰の違いを調べる。
  • 分類タスクを実行できるモデルを構築する。
  • 分類モデルを評価して改善する方法を調べる。
ランダム フォレストを使用してアーキテクチャとハイパーパラメーターを選択およびカスタマイズする

ランダム フォレストを使用してアーキテクチャとハイパーパラメーターを選択およびカスタマイズする

多くの場合、より複雑なモデルを手動でカスタマイズすることで、その有効性を向上させることができます。 より複雑なモデルのアーキテクチャを変更することで、どれほどの効果が得られるかを演習を交えながら説明します。 このエピソードでは、次のことを行います。

  • 新しいモデルの種類、デシジョン ツリーとランダム フォレストについて理解します
  • モデル アーキテクチャがパフォーマンスに与える影響について学習します。
  • トレーニングの有効性を向上させるためにハイパーパラメーターの操作を練習します。
混同行列とデータの不均衡

混同行列とデータの不均衡

データの分類において、モデルが適切か不適切かを知るにはどうすればよいでしょうか? コンピューターでモデルのパフォーマンスを評価する方法は、私たちには理解しにくいか、または実際の使用環境でのモデルの動作を簡略化しすぎる場合があります。 満足な方法で動作するモデルを構築するには、それを評価するための直感的な方法を見つけ、これらのメトリックによって私たちの見方がどれだけ偏よる場合があるかを理解する必要があります。 このエピソードでは、次のことを行います。

  • 分類モデルのパフォーマンスを評価する。
  • 分類モデルを改善するためのメトリックを確認する。
  • データの不均衡によるパフォーマンスの問題を軽減する。
ROC と AUC でモデルのパフォーマンスを測定および最適化する

ROC と AUC でモデルのパフォーマンスを測定および最適化する

受信者操作特性曲線は、トレーニング済みの分類モデルを評価および微調整するための強力な方法です。 学習コンテンツと実践的な演習を通じて、これらの曲線の有用性を紹介し、説明します。 このエピソードでは、次のことを行います。

  • ROC 曲線の作成方法を理解する。
  • これらの曲線を使用してモデルを評価および比較する方法について詳しく調べる。
  • ROC 曲線にプロットされた特性を使用してモデルを微調整する。

スピーカー

  • Jason DeBoever

    Microsoft シニア プロダクト マネージャー

    Twitter
  • Glenn Stephens

    Microsoft シニア コンテンツ開発者

    Twitter

よく寄せられる質問

イベントに参加するには費用がかかりますか?

このイベントは無料です。 Learn TV に参加してコンテンツを無料でストリーミングできます。

イベントはいつ開催されますか?

9 月 14 日から 11 月 9 日まで、毎週火曜日の午後 2:00 から午後 3:30 (太平洋標準時) にご参加ください。

このイベントはオンデマンドで利用できますか?

確かに取れますね。 過去のイベントをいつでもストリーミングできます。 すべての Learn Live を閲覧して、いつでもストリーミングできます。

このイベントはどこで行われますか?

このイベント シリーズは仮想です。 他の何千人もの人々と一緒に参加して、自宅、オフィス、デバイスから、くつろぎながらエクスペリエンスを楽しんでください。

エピソードはどの言語で配信されますか?

このショーは英語で配信されます。 Learn Live で各ライブ ショーの 48 時間後に利用できるようになる録画映像では、14 の異なる言語の字幕が利用できます。

倫理規定

私たちは、性別、性的指向、外見、障がい、年齢、人種、宗教に関係なく、すべての人に敬意を払い、フレンドリーでプロフェッショナルな経験を提供します。 私たちは、性別、人種、性的指向、障がいを貶めるあらゆる行為、またはハラスメントや差別と見なされるあらゆる行為を容認しません。 各個人が、当社の基準を知り、従う責任を負います。また、すべての人が歓迎され安全な環境を作り出すように支援する必要があります。 また、共に生活するこの惑星を同じように尊重するよう努めています。 問題に直ちに対処できるよう、質問、懸念、破壊的な活動や行動は、組織チームに報告してください。