エピソード

NLP のテキスト抽出における Azure Computer Vision OCR サービスの適用 |Python Data Science Day

代入 Theophilus Owiti

感情分析などの自然言語処理 (NLP) タスクのデータを取得することは、困難な課題になる可能性があります。 Microsoft Azure では、データ サイエンティストの動的なニーズを満たすために環境を調整することの最も重要な重要性を認識し、不可欠なツール (特に Computer Vision Service) を提供しています。 このサービスにより、データを収集してエンジニアリングするためのシームレスなプロセスが可能になります。 さまざまなデータ ソースは、論文、画像、書籍などのテキストにまたがるため、データセットを強化するための十分な機会を提供します。

参加者は、Microsoft Azure ツールと Visual Studio Code 拡張機能を活用して、強化された自然言語処理の取り組みのためにデータの取得、ストレージ、使用率を合理化するための分析情報を得ることができます。 包括的な目標は、NLP データの複雑さをナビゲートするために必要なリソースをデータ サイエンティストに与え、最終的に、より効率的で効果的なデータ サイエンス ワークフローを促進することです。 組み込まれるストレージ テクノロジは NoSQL (MongoDB)、Azure Blob Storage です。最終的には、提供されたローカル ファイルを利用し、これらのソースからのデータを組み込み、NLP タスクにデータを利用する方法についても説明します。

  • 00:00 - Azure Computer Vision OCR サービスのアプリケーション
  • 00:34 - 使用するツール
  • 02:51 - Azure Computer Vison の概要
  • 06:20 - 今日の目標
  • 06:56 - NLP の Python
  • 07:40 - デモ

のインスタンスに接続するときには、

開発者
Python